转寄人: ZabraZoe (ZabraZoe)
标 题: 明年的大模型更新,人类可能已经没资格做评测者了
发信站: 水木社区 (Thu May 21 14:13:15 2026)
来 源: 222.129.38.211
【以下内容由 ZabraZoe 转寄于 NewExpress 版】
标 题: 明年的大模型更新,人类可能已经没资格做评测者了
发信站: 水木社区 (Thu May 21 14:13:15 2026)
来 源: 222.129.38.211
【以下内容由 ZabraZoe 转寄于 NewExpress 版】
通用模型居然数学能力达到菲尔兹奖水平了
ai证明的定理还有几个人能看懂?有几个做benchmark的好意思舔着脸评价ai的数学水平?
哈哈哈
【 在 Engelberger 的大作中提到: 】
: 通用模型居然数学能力达到菲尔兹奖水平了
: ai证明的定理还有几个人能看懂?有几个做benchmark的好意思舔着脸评价ai的数学水平?
定理想不出证明来,但还是能看懂的
【 在 Engelberger 的大作中提到: 】
: 通用模型居然数学能力达到菲尔兹奖水平了ai证明的定理还有几个人能看懂?有几个做benchmark的好意思舔着脸评价ai的 ...
网上做测评的人能看懂么
【 在 zhixin 的大作中提到: 】
: 定理想不出证明来,但还是能看懂的
明年就能解决1+1问题了吗?好期待。
能证明黎曼猜想吗
【 在 Engelberger 的大作中提到: 】
: 通用模型居然数学能力达到菲尔兹奖水平了
: ai证明的定理还有几个人能看懂?有几个做benchmark的好意思舔着脸评价ai的数学水平?
过几年都没有数学难题了
【 在 Z5boy 的大作中提到: 】
: 能证明黎曼猜想吗
相当于期刊投稿啊
【 在 Engelberger 的大作中提到: 】
: 通用模型居然数学能力达到菲尔兹奖水平了
: ai证明的定理还有几个人能看懂?有几个做benchmark的好意思舔着脸评价ai的数学水平?
: FROM 117.176.186.* [四川 移动/数据上网公共出口]
AI现在做高考数学和IMO都能拿到满分吗?
【 在 Engelberger 的大作中提到: 】
: 通用模型居然数学能力达到菲尔兹奖水平了
: ai证明的定理还有几个人能看懂?有几个做benchmark的好意思舔着脸评价ai的数学水平?
不知道别的,反正豆包做题有时候挺不靠谱的。
【 在 ZhangJuZheng 的大作中提到: 】
: AI现在做高考数学和IMO都能拿到满分吗?
豆包确实不行,我试过 解初中平面几何不如千问
【 在 mil0 的大作中提到: 】
: 不知道别的,反正豆包做题有时候挺不靠谱的。
你问的是24年和25年的问题
【 在 ZhangJuZheng 的大作中提到: 】
: AI现在做高考数学和IMO都能拿到满分吗?