侧边栏壁纸
博主头像
天马行空 博主等级

凡是过往,皆为序章

  • 累计撰写 675 篇文章
  • 累计创建 11 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录

还真有人把fable5给蒸馏了,上线三天蒸了 5 亿 token。(合集转寄)

sortie
2026-06-28 / 0 评论 / 0 点赞 / 0 阅读 / 0 字
转寄人: sortie (sortie)
标 题: 还真有人把fable5给蒸馏了,上线三天蒸了 5 亿 token。
发信站: 水木社区 (Sun Jun 28 18:37:45 2026)
来 源: 120.245.107.123
【以下内容由 sortie 转寄于 NewExpress 版】
Engelbergermissing
Sun Jun 28 15:10:40 2026 · #1
不仅 Fable 5,Mythos 5 也有人给蒸了。 现在开源社区到处都是蒸了 Fable 5 和 Mythos 5 的小模型。
tongchen除旧迎新
Sun Jun 28 15:11:43 2026 · #2
愚公移山
【 在 Engelberger 的大作中提到: 】 : 不仅 Fable 5,Mythos 5 也有人给蒸了。 : 现在开源社区到处都是蒸了 Fable 5 和 Mythos 5 的小模型。
Engelbergermissing
Sun Jun 28 15:11:44 2026 · #3
这些人真有钱,光这输出的 5 亿 token,按 Mythos 5 的那个计价的话,都是 25000 美元了。
【 在 Engelberger 的大作中提到: 】 : 不仅 Fable 5,Mythos 5 也有人给蒸了。 : 现在开源社区到处都是蒸了 Fable 5 和 Mythos 5 的小模型。
tongchen除旧迎新
Sun Jun 28 15:13:37 2026 · #4
换你你要哪个? 不过,外国人说中国科技发展快,我找到点眉目了。
【 在 Engelberger 的大作中提到: 】 : 这些人真有钱,光这输出的 5 亿 token,按 Mythos 5 的那个计价的话,都是 25000 美元了。
kygkfg
Sun Jun 28 15:14:03 2026 · #5
5亿只是毛毛雨啦,500Mtoken,就算国外模型贵,也就是几万块钱 数据这块,这点数据量训练也很便宜 乘以一万能搞出一个相当水平的模型都是极其便宜了
【 在 Engelberger 的大作中提到: 】 : 不仅 Fable 5,Mythos 5 也有人给蒸了。 : 现在开源社区到处都是蒸了 Fable 5 和 Mythos 5 的小模型。 : FROM 111.55.145.* [四川 移动]
metaers灵机一动忽然道德婊
Sun Jun 28 15:16:01 2026 · #6
【 在 tongchen 的大作中提到: 】 : 换你你要哪个? : 不过,外国人说中国科技发展快,我找到点眉目了。 : 【 在 Engelberger 的大作中提到: 】 : : 这些人真有钱,光这输出的 5 亿 token,按 Mythos 5 的那个计价的话,都是 25000 美元了。
liuqixiao27打架手揣兜
Sun Jun 28 15:24:28 2026 · #7
哪儿这么简单,其实现在外网一个怀疑点是fable5不是纯血LLM,里面藏了一个agent,也就是说交互过程拿到的已经是迭代后的输出,不是LLM的思维链了
【 在 Engelberger 的大作中提到: 】 : 不仅 Fable 5,Mythos 5 也有人给蒸了。 : 现在开源社区到处都是蒸了 Fable 5 和 Mythos 5 的小模型。 : FROM 111.55.145.* [四川 移动]
HANNINGWINDOWADD
Sun Jun 28 15:25:43 2026 · #8
据说欧洲人道德特别有底线。
【 在 metaers 的大作中提到: 】
Dream05Dream05
Sun Jun 28 15:26:12 2026 · #9
现在蒸馏出小模型自己用这个思路很好 不然自己折腾花了很大代价都不咋的
【 在 Engelberger 的大作中提到: 】 : 不仅 Fable 5,Mythos 5 也有人给蒸了。 : 现在开源社区到处都是蒸了 Fable 5 和 Mythos 5 的小模型。 : FROM 111.55.145.* [四川 移动]
HANNINGWINDOWADD
Sun Jun 28 15:26:34 2026 · #10
gemini刚出来的时候,说自己的老板是李彦宏,你发现什么眉目了吗?
【 在 tongchen 的大作中提到: 】 : 换你你要哪个? : 不过,外国人说中国科技发展快,我找到点眉目了。
hyinzhyh
Sun Jun 28 15:31:31 2026 · #11
fable5有防蒸馏的,一个是下毒,一个是降智。你以为拿的是fable5的答案,实际拿的是4.8,而且下毒,让你寻找不到平坦极小值的解。
【 在 Engelberger 的大作中提到: 】 : 不仅 Fable 5,Mythos 5 也有人给蒸了。 : 现在开源社区到处都是蒸了 Fable 5 和 Mythos 5 的小模型。
weiwallzweiwallz
Sun Jun 28 15:33:14 2026 · #12
极有可能的,前头加了一个llm过滤它认为的高危提问
【 在 liuqixiao27 的大作中提到: 】 : 哪儿这么简单,其实现在外网一个怀疑点是fable5不是纯血LLM,里面藏了一个agent,也就是说交互过程拿到的已经是迭代后的输出,不是LLM的思维链了 : 【 在 Engelberger 的大作中提到: 】 : : 不仅 Fable 5,Mythos 5 也有人给蒸了。 : : 现在开源社区到处都是蒸了 Fable 5 和 Mythos 5 的小模型。
shuimu0691shuimu0691
Sun Jun 28 15:34:25 2026 · #13
能成事,在AI领域这点算小钱
【 在 Engelberger 的大作中提到: 】 : 这些人真有钱,光这输出的 5 亿 token,按 Mythos 5 的那个计价的话,都是 25000 美元了。
powerrenpowerren
Sun Jun 28 15:34:47 2026 · #14
欧洲和日本、东南亚、vv有啥很好的大模型吗?
【 在 Engelberger 的大作中提到: 】 : 不仅 Fable 5,Mythos 5 也有人给蒸了。 : 现在开源社区到处都是蒸了 Fable 5 和 Mythos 5 的小模型。
hotfixhotfix
Sun Jun 28 15:44:01 2026 · #15
5亿算个啥啊 我一个月就能用5亿
【 在 Engelberger 的大作中提到: 】 : 不仅 Fable 5,Mythos 5 也有人给蒸了。 : 现在开源社区到处都是蒸了 Fable 5 和 Mythos 5 的小模型。 : FROM 111.55.145.* [四川 移动]
riverwalk没有人比我更懂
Sun Jun 28 15:46:07 2026 · #16
原理和基本架构都是公开的,只要公开发售,过一段时间不破解也能被山寨
【 在 Engelberger 的大作中提到: 】 : 不仅 Fable 5,Mythos 5 也有人给蒸了。 : 现在开源社区到处都是蒸了 Fable 5 和 Mythos 5 的小模型。
bandeses
Sun Jun 28 15:58:11 2026 · #17
用过一次谷歌 ai模式,让她给出一道初一的绝对值运算问题,讨论了x大于-6的情况,得出x等于-2,他说舍去,还有其它情况。当时浏览快了,没看出来,后来跟他说-2是解,它才说它错了。那时发现它怎么能犯这种错误,看来是降智了。
【 在 HANNING 的大作中提到: 】 : gemini刚出来的时候,说自己的老板是李彦宏,你发现什么眉目了吗? : 【 在 tongchen 的大作中提到: 】 : : 换你你要哪个? : : 不过,外国人说中国科技发展快,我找到点眉目了。
metaers灵机一动忽然道德婊
Sun Jun 28 15:59:01 2026 · #18
就是超级低吧
【 在 HANNING 的大作中提到: 】 : 据说欧洲人道德特别有底线。 : 【 在 metaers 的大作中提到: 】 : FROM 123.116.45.* [北京 联通]
slicenihao
Sun Jun 28 16:05:30 2026 · #19
5亿?才500M token,毛毛雨吧,有好用的fable5么 好像看到有人挂了fb5名字就一堆人去下,不知道有没有实测
【 在 Engelberger 的大作中提到: 】 : 不仅 Fable 5,Mythos 5 也有人给蒸了。 : 现在开源社区到处都是蒸了 Fable 5 和 Mythos 5 的小模型。 : FROM 111.55.145.* [四川 移动]
ytmianytmian
Sun Jun 28 16:15:55 2026 · #20
这样应该会慢很多啊
【 在 liuqixiao27 的大作中提到: 】 : 哪儿这么简单,其实现在外网一个怀疑点是fable5不是纯血LLM,里面藏了一个agent,也就是说交互过程拿到的已经是迭代后的输出,不是LLM的思维链了
joygpwansquaresam
Sun Jun 28 17:18:05 2026 · #21
有什么推荐的fable5和mythos小模型吗
【 在 Engelberger 的大作中提到: 】 : 不仅 Fable 5,Mythos 5 也有人给蒸了。 : 现在开源社区到处都是蒸了 Fable 5 和 Mythos 5 的小模型。
woodyuewoodyue
Sun Jun 28 17:29:53 2026 · #22
5亿也太少了,一次50k,也就1w次,够干什么的?
【 在 Engelberger 的大作中提到: 】 : 不仅 Fable 5,Mythos 5 也有人给蒸了。 : 现在开源社区到处都是蒸了 Fable 5 和 Mythos 5 的小模型。 : FROM 111.55.145.* [四川 移动]
stockfan无休无止的作业
Sun Jun 28 17:32:03 2026 · #23
我一天就花掉好几亿token,这个算狗屁蒸馏
【 在 Engelberger 的大作中提到: 】 : 标 题: 还真有人把fable5给蒸馏了,上线三天蒸了 5 亿 token。 : 发信站: 水木社区 (Sun Jun 28 15:10:40 2026), 站内 : 不仅 Fable 5,Mythos 5 也有人给蒸了。 : 现在开源社区到处都是蒸了 Fable 5 和 Mythos 5 的小模型。 : ※ 来源:·水木社区 http://m.mysmth.net·[FROM: 111.55.145.*]
Engelbergermissing
Sun Jun 28 17:52:58 2026 · #24
我已经下载下来了。 其实这个蒸馏数据本身也可以卖钱。 蒸馏者自己的成本估计是 3~4 万美元。他卖出去,10 万美元一份,都一堆公司买吧
【 在 Dream05 的大作中提到: 】 : 现在蒸馏出小模型自己用这个思路很好 : 不然自己折腾花了很大代价都不咋的
z16166Netguy
Sun Jun 28 17:53:45 2026 · #25
问题是都不堪用
Engelbergermissing
Sun Jun 28 17:53:51 2026 · #26
mythos 5 也有人给蒸了, 那些被允许访问的公司内部也有人蒸数据
【 在 hyinz 的大作中提到: 】 : fable5有防蒸馏的,一个是下毒,一个是降智。你以为拿的是fable5的答案,实际拿的是4.8,而且下毒,让你寻找不到平坦极小值的解。
tongchen除旧迎新
Sun Jun 28 17:54:13 2026 · #27
说了也白给。
【 在 z16166 的大作中提到: 】 : 问题是都不堪用
sthgot2givesthgot2give
Sun Jun 28 17:56:40 2026 · #28
这点TOKEN量,也就是个微调吧,蒸馏算不上。 再说蒸馏很容易识别的,请求内容和普通用户完全不一样。
weiwallzweiwallz
Sun Jun 28 18:13:52 2026 · #29
有啥不一样?
【 在 sthgot2give 的大作中提到: 】 : 这点TOKEN量,也就是个微调吧,蒸馏算不上。 : 再说蒸馏很容易识别的,请求内容和普通用户完全不一样。 : FROM 114.250.179.* [北京 联通]
qyli泾渭漳淮
Sun Jun 28 18:16:13 2026 · #30
给外行科普一下,蒸馏是啥意思?
【 在 Engelberger 的大作中提到: 】 : 不仅 Fable 5,Mythos 5 也有人给蒸了。 : 现在开源社区到处都是蒸了 Fable 5 和 Mythos 5 的小模型。 : FROM 111.55.145.* [四川 移动]
sssss冬至
Sun Jun 28 18:26:51 2026 · #31
看看美剧西部世界,把人放到各种场景下,尤其是极端场景,测试反馈,用来训练机器人。这个测试获取数据的过程就是蒸馏。
【 在 qyli 的大作中提到: 】 : 给外行科普一下,蒸馏是啥意思? : 【 在 Engelberger 的大作中提到: 】 : : 不仅 Fable 5,Mythos 5 也有人给蒸了。 : : 现在开源社区到处都是蒸了 Fable 5 和 Mythos 5 的小模型。
liuqixiao27打架手揣兜
Sun Jun 28 18:33:07 2026 · #32
但是打榜得分更高啊
【 在 ytmian 的大作中提到: 】 : 这样应该会慢很多啊 : 【 在 liuqixiao27 的大作中提到: 】 : : 哪儿这么简单,其实现在外网一个怀疑点是fable5不是纯血LLM,里面藏了一个agent,也就是说交互过程拿到的已经是迭代后的输出,不是LLM的思维链了
博主关闭了所有页面的评论