侧边栏壁纸
博主头像
天马行空 博主等级

凡是过往,皆为序章

  • 累计撰写 632 篇文章
  • 累计创建 11 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录

明年的大模型更新,人类可能已经没资格做评测者了(合集转寄)

sortie
2026-05-21 / 0 评论 / 0 点赞 / 1 阅读 / 0 字
转寄人: ZabraZoe (ZabraZoe)
标 题: 明年的大模型更新,人类可能已经没资格做评测者了
发信站: 水木社区 (Thu May 21 14:13:15 2026)
来 源: 222.129.38.211
【以下内容由 ZabraZoe 转寄于 NewExpress 版】
Engelbergermissing
Thu May 21 13:16:13 2026 · #1
通用模型居然数学能力达到菲尔兹奖水平了 ai证明的定理还有几个人能看懂?有几个做benchmark的好意思舔着脸评价ai的数学水平?
tongchen除旧迎新
Thu May 21 13:16:45 2026 · #2
哈哈哈
【 在 Engelberger 的大作中提到: 】 : 通用模型居然数学能力达到菲尔兹奖水平了 : ai证明的定理还有几个人能看懂?有几个做benchmark的好意思舔着脸评价ai的数学水平?
zhixin志心
Thu May 21 13:46:38 2026 · #3
定理想不出证明来,但还是能看懂的
【 在 Engelberger 的大作中提到: 】 : 通用模型居然数学能力达到菲尔兹奖水平了ai证明的定理还有几个人能看懂?有几个做benchmark的好意思舔着脸评价ai的 ...
Engelbergermissing
Thu May 21 13:48:11 2026 · #4
网上做测评的人能看懂么
【 在 zhixin 的大作中提到: 】 : 定理想不出证明来,但还是能看懂的
Leo狮子星座流星雨
Thu May 21 13:50:57 2026 · #5
明年就能解决1+1问题了吗?好期待。
Z5boy二五仔
Thu May 21 13:54:59 2026 · #6
能证明黎曼猜想吗
【 在 Engelberger 的大作中提到: 】 : 通用模型居然数学能力达到菲尔兹奖水平了 : ai证明的定理还有几个人能看懂?有几个做benchmark的好意思舔着脸评价ai的数学水平?
TraderJerry哥曾信佛但佛信曾哥
Thu May 21 13:57:06 2026 · #7
过几年都没有数学难题了
【 在 Z5boy 的大作中提到: 】 : 能证明黎曼猜想吗
MilanaliMasdf
Thu May 21 13:58:09 2026 · #8
相当于期刊投稿啊
【 在 Engelberger 的大作中提到: 】 : 通用模型居然数学能力达到菲尔兹奖水平了 : ai证明的定理还有几个人能看懂?有几个做benchmark的好意思舔着脸评价ai的数学水平? : FROM 117.176.186.* [四川 移动/数据上网公共出口]
ZhangJuZheng荆州加油!湖北加油!
Thu May 21 14:03:22 2026 · #9
AI现在做高考数学和IMO都能拿到满分吗?
【 在 Engelberger 的大作中提到: 】 : 通用模型居然数学能力达到菲尔兹奖水平了 : ai证明的定理还有几个人能看懂?有几个做benchmark的好意思舔着脸评价ai的数学水平?
mil0mil0
Thu May 21 14:04:17 2026 · #10
不知道别的,反正豆包做题有时候挺不靠谱的。
【 在 ZhangJuZheng 的大作中提到: 】 : AI现在做高考数学和IMO都能拿到满分吗?
ZhangJuZheng荆州加油!湖北加油!
Thu May 21 14:08:09 2026 · #11
豆包确实不行,我试过 解初中平面几何不如千问
【 在 mil0 的大作中提到: 】 : 不知道别的,反正豆包做题有时候挺不靠谱的。
Engelbergermissing
Thu May 21 14:10:20 2026 · #12
你问的是24年和25年的问题
【 在 ZhangJuZheng 的大作中提到: 】 : AI现在做高考数学和IMO都能拿到满分吗?
博主关闭了所有页面的评论