明年的大模型更新，人类可能已经没资格做评测者了(合集转寄)-天马行空

Engelbergermissing

Thu May 21 13:16:13 2026 · #1

通用模型居然数学能力达到菲尔兹奖水平了 ai证明的定理还有几个人能看懂？有几个做benchmark的好意思舔着脸评价ai的数学水平？

tongchen除旧迎新

Thu May 21 13:16:45 2026 · #2

哈哈哈

【在 Engelberger 的大作中提到: 】 : 通用模型居然数学能力达到菲尔兹奖水平了 : ai证明的定理还有几个人能看懂？有几个做benchmark的好意思舔着脸评价ai的数学水平？

zhixin志心

Thu May 21 13:46:38 2026 · #3

定理想不出证明来，但还是能看懂的

【在 Engelberger 的大作中提到: 】 : 通用模型居然数学能力达到菲尔兹奖水平了ai证明的定理还有几个人能看懂？有几个做benchmark的好意思舔着脸评价ai的 ...

Engelbergermissing

Thu May 21 13:48:11 2026 · #4

网上做测评的人能看懂么

【在 zhixin 的大作中提到: 】 : 定理想不出证明来，但还是能看懂的

Leo狮子星座流星雨

Thu May 21 13:50:57 2026 · #5

明年就能解决1+1问题了吗？好期待。

Z5boy二五仔

Thu May 21 13:54:59 2026 · #6

能证明黎曼猜想吗

【在 Engelberger 的大作中提到: 】 : 通用模型居然数学能力达到菲尔兹奖水平了 : ai证明的定理还有几个人能看懂？有几个做benchmark的好意思舔着脸评价ai的数学水平？

TraderJerry哥曾信佛但佛信曾哥

Thu May 21 13:57:06 2026 · #7

过几年都没有数学难题了

【在 Z5boy 的大作中提到: 】 : 能证明黎曼猜想吗

MilanaliMasdf

Thu May 21 13:58:09 2026 · #8

相当于期刊投稿啊

【在 Engelberger 的大作中提到: 】 : 通用模型居然数学能力达到菲尔兹奖水平了 : ai证明的定理还有几个人能看懂？有几个做benchmark的好意思舔着脸评价ai的数学水平？ : FROM 117.176.186.* [四川移动/数据上网公共出口]

ZhangJuZheng荆州加油！湖北加油！

Thu May 21 14:03:22 2026 · #9

AI现在做高考数学和IMO都能拿到满分吗？

【在 Engelberger 的大作中提到: 】 : 通用模型居然数学能力达到菲尔兹奖水平了 : ai证明的定理还有几个人能看懂？有几个做benchmark的好意思舔着脸评价ai的数学水平？

mil0mil0

Thu May 21 14:04:17 2026 · #10

不知道别的，反正豆包做题有时候挺不靠谱的。

【在 ZhangJuZheng 的大作中提到: 】 : AI现在做高考数学和IMO都能拿到满分吗？

ZhangJuZheng荆州加油！湖北加油！

Thu May 21 14:08:09 2026 · #11

豆包确实不行，我试过解初中平面几何不如千问

【在 mil0 的大作中提到: 】 : 不知道别的，反正豆包做题有时候挺不靠谱的。

Engelbergermissing

Thu May 21 14:10:20 2026 · #12

你问的是24年和25年的问题

【在 ZhangJuZheng 的大作中提到: 】 : AI现在做高考数学和IMO都能拿到满分吗？