首页>资讯 > 聚焦资讯 > 正文

陶哲轩甩出调教GPT|焦点要闻

来源:凤凰网    2023-06-25 15:40:59

衡宇 萧箫 发自 凹非寺

量子位 | 公众号 QbitAI

鹅妹子嘤,天才数学家陶哲轩搞数学研究,已经离不开普通人手里的“数学菜鸡”GPT了!


(资料图片仅供参考)

就在他最新解决的一个数学难题下面,陶哲轩明确指出自己“使用了GPT-4”,后者给他提出了一种可行的解决方法。

借助GPT-4,他不仅成功地突破了这一难题,还将答案分享在了MathOverflow上:

它给我提供了最终的解题思路,接下来我只需要继续计算就行。

为了给更多数学家分享用GPT-4工作的便利性,陶哲轩还将自己的聊天记录po了出来,里面完整地记载了他和GPT-4的对话。

可以看见,在这份聊天记录中,他把GPT-4称呼为“专业数学合作者”,而不仅仅是一个普通的数学助手。

这个身份属实不一般了,不知道之后陶哲轩写论文的时候会不会把GPT-4列为共同作者(手动狗头)。

不仅如此,戳对话记录底部的“continue this conversation”按钮,还能一键把对话记录导入自己的ChatGPT中,突然闯入人类大师和AI的交谈。

陶哲轩解决了什么新问题?

陶哲轩研究的问题,是一个两天前在数学网站MathOverflow上更新的提问。

这个名叫“优雅的递归之A301897”问题,具体长这样:

其中,A301897是一个被整数数列网站OEIS收录的数列:

这个数列中有一系列来自长度为n的排列b的数,它们有一个共同点,就是满足Diaconis-Graham不等式且等号成立。

Diaconis-Graham不等式由戴康尼斯(Persi Diaconis)和葛立恒(没错,就是“最大数”之父Ronald Graham)于1977年共同提出,属于概率统计方面的研究。

显然,这一大段提问中不仅夹杂着大量专业数学公式,而且还涉及需要跳转的网页资料。

作为数学公认不太好的“数学菜鸡”,GPT-4真的能像一名专业数学家那样快速读懂公式、给出解决问题的专业建议吗?

事实上,相比直接把问题复制粘贴给GPT-4,陶哲轩做了三件事:

首先,做一些提示工程,明确GPT-4的“身份”和“目标”。其中身份是“一个擅长给技巧性建议的数学合作专家”,目标是“提供一些建议”而非解决问题。

然后,相比直接把大段公式复制进GPT-4提问栏(确实可以这样做),陶哲轩选择将问题描述转成Markdown格式。

最后,涉及需要GPT-4自己查找资料的内容,陶哲轩将它转变成一个引用注释,并在结尾给出网址。

完整的提问过程长这样:

也就是说,相比让GPT-4直接化身数学家去“解决问题”,陶哲轩只是把它当成一个提供灵感来源的“专家”,给自己建议一些研究的方向。

GPT-4很快给出了8个具体的建议:

1、理解问题:在深入证明之前,确保你理解了问题中的每一项。如果你不熟悉Diaconis-Graham不等式,研究一下它,了解表达式a(n)和R(n, q)中的每一项代表什么。

2、简化表达:有时候,复杂的表达可以被简化。例如,你可能想看看表达式中a(n)的二项式系数是否可以简化,或者是否可以用更简单的方式计算总和。

3、归纳法:由于R(n, q)是递归定义的,因此证明猜想的一种自然方法是使用数学归纳法。你可能想要证明,如果这个猜想对n成立,那么它对n+1也成立。

4、生成函数:另一种方法是使用生成函数。尝试找到a(n)和R(n, 0)的生成函数,然后证明它们是相等的。这有时可以把一个复杂的组合问题变成一个更简单的代数问题。

5、渐近分析:正如你提到的,分析a(n)和R(n, 0)的渐近行为可能会对它们的关系有一些深入的了解。这有时可以用斯特林的阶乘近似来实现,或者通过分析表达式中的主导项来实现。

6、数值证据:虽然不是证明,但收集数值证据有时可以让我们了解如何证明一个猜想。因为你有PARI/GP代码,可以用数值来检查猜想,你可能想读一读每个序列的前几项,看看是否能发现任何模式。

7、寻找类似问题:有时,一个问题或猜想是一个已知问题的泛化或变体。在组合文献中寻找类似的问题或定理,看看它们的证明是否可以适用于这个问题。

8、寻求反馈和合作:不要犹豫,从同事那里寻求反馈,或者在MathOverflow这样的论坛上发布你的部分结果。协作和同行评议通常是解决复杂数学问题的关键。

最终,陶哲轩使用建议4,也就是生成函数的方法,成功解决了问题。

当然,解决问题的过程并不需要用到GPT-4,采用MAPLE工作表+纸笔手动计算就能完成。陶哲轩也尝试了渐进分析(建议5)的方法,不过事实证明还是用生成函数更有效。

简单来说,陶哲轩只是用GPT-4给自己提供不同的解题思路,也就是“解题灵感”,但具体怎么解答,也就是更加数学的方法,他则不会交给GPT-4来完成。

至于“查资料”这种GPT-4的应用,陶哲轩也发挥到了极致。

例如在思考问题时,他还会把自己的“灵光乍现”拿出来和GPT-4讨论一下,例如他觉得这个问题和卡特兰数(Catalan numbers)有相似之处,希望GPT-4帮他查找一下对应的资料。

GPT-4很快给出了对应的回答,这也促使陶哲轩对另一个问题产生了新的灵感。

简单来说,陶哲轩在短短两段与GPT-4的对话中,展示了数学家使用GPT-4的正确姿势——找灵感和查资料。

这样一来,即使“数学菜鸡”如GPT-4,也能成为数学家的AI助理了。

大佬是怎么玩儿GPT的

分享人类大师和AI的聊天记录之余,陶哲轩的乳齿象博文里还附带着一份贴心指南,是他使用ChatGPT和GPT-4的经验之谈。

根据他过去的实操经验,最要紧的第一点:

不要试图让AI直接回答问题,因为这几乎肯定会得到一些看起来专业的废话

为了避免GPT成为废话文学大王,行之有效的方案如下:

让AI扮演合作者的角色,而后让它提供策略建议

Like this:

除此之外,“数学菜鸡”GPT,在大数学家手里能有什么用处?

陶哲轩大概的意思是酱婶儿的:

ChatGPT数学能力虽然不咋滴,但对做学术研究的人来说是个发散思维的好工具。

(对普通人来说有点不太专业,但对搞数学的学术人员来说刚刚好)

怎么解释用来“发散思维”这句话呢?

陶哲轩表达出来的观点是,既然ChatGPT在具体数学问题上给出的答案是不完全正确的,那不如索性发挥发挥它生成答案部分正确的特性。

简而言之,就是让它帮你找灵感balabalabla:

在处理数学问题时,可以让ChatGPT这类大语言模型做一些半成品的语义搜索工作。

也就是说,ChatGPT不用提供确切的答案,只用生成一些可能的提示。

这样一来,依据GPT生成的提示+传统搜索引擎搜索,就能很轻松get答案。

而且他还自曝,在GPT-4发布之前,他本人就从微软那里获得了访问资格。

也就是和微软154页《AGI的火花》论文里同款,未经过安全训练但能力更强的满血版。

从陶哲轩的反馈中可以看到,GPT-4非常擅长在和人类对话时进行一些cosplay,比如充当富有同情心的倾听者、热情洋溢的反馈者、富有创造力的灵感来源、翻译者或教师,或者是魔鬼的代言人。

与此同时,对于AI在数学研究中的表现,陶哲轩给出的大胆却又严谨的预言:

当与形式证明验证器、互联网搜索和数学符号包等工具整合时,2026年的AI,如果使用得当,将成为数学研究中值得信赖的共同作者,而且在许多其他领域也是如此。

除了数学研究,GPT-4已经是陶哲轩生活中的全方位小助手了。

他经常使用GPT-4回答一些随意、措辞含糊的问题,这些问题以前需要在搜索引擎里精心调整关键词才行。

还有位同事,因为亲戚拿到重症诊断而郁郁寡欢。为此,陶哲轩让大手一挥,让GPT-4洋洋洒洒写了封慰问信。

结果呢?同事眼含热泪,被感动哭了。

最后说回陶哲轩用GPT-4解决数学难题这事儿上来。

在MathOverflow下,有的网友觉得他不应该用GPT来回答数学问题,感觉是个很敏感的话题。

但还是有人表示了资瓷,表示觉得真的是泰库辣~

陶哲轩倒是毫不避讳地站出来表明了自己的立场,他倒不觉得有啥不好:

现在的担忧,跟维基百科流行初期时大家讨论的重点也没啥区别……

现在在维基百科上get初始线索,并且在引为论点时附上链接,展现它是我论据的一部分,都是大伙儿习以为常的事情。

并且陶哲轩看法还挺坚定,那就是“相信大家以后也会觉得用GPT来支持研究,没啥不妥当的呢”~

关键词:

陶哲轩甩出调教GPT|焦点要闻

衡宇萧箫发自凹非寺量子位|公众号QbitAI鹅妹子嘤,天才数学家陶哲轩搞

观天下!第二次世界大战简介50字左右_第二次世界大战简介50字

1、1939—1945年,德国、意大利、日本法西斯国家发动了一场人类历史上空

辽宁省内热门前十景区中沈阳占六席 这个端午沈水之阳不负清凉不负卿

辽宁省内热门前十景区中沈阳占六席接待游客310 18万人次同比增长284 17

短讯!因银行资金违规用于购地,向关系人发放信用贷款等“19宗罪”,江西银行收810万元巨额罚单

近日,江西银行一则810万元的巨额罚单公之于众,作出处罚决定的日期是2

2023我国海洋渔业基地及地区发展战略

我国是一个海洋大国,在绵长的海岸线上,点缀着一个又一个港口城市,勤

个性化消费渐成新趋势 小商品赢得大市场

个性化消费渐成新趋势小商品赢得大市场2023年06月25日14:27央视网

信用卡逾期变成呆账有啥后果?形成信用卡呆账的两种原因是什么?

信用卡逾期变成呆账有啥后果?1、冻结信用卡,银行多次催收后,债务人仍拒绝还款的话,银行会冻结用户的信用卡权限,持卡人的信用卡无法再使

信用卡欠钱不还会坐牢吗?信用卡逾期多少钱坐牢?

信用卡欠钱不还会坐牢吗?1、信用卡还不上可能会坐牢。2、信用卡逾期超过三个月或银行催款两次以上还不还款的,银行会冻结你卡片并将你列为

信用卡逾期会上征信吗?信用卡逾期多少钱会被起诉?

信用卡逾期会上征信吗?信用卡逾期会上征信,一次也会。只要存在信用卡逾期的情况,哪怕是一个小时,银行也会将逾期记录上传至征信中心,从

贷款逾期严重信用卡还能使用吗?如果信用卡已经逾期了怎么办呢?

贷款逾期严重信用卡还能使用吗?1、若是在未接入央行征信系统的贷款平台办的贷款逾期了,那逾期情况通常只会上报到大数据里,不会上报到客户

汽车经销商老大摘牌退市 庞大折射“4S模式”需调整 世界头条

日前,*ST庞大公告,公司收到上海证券交易所下发的《关于庞大汽贸集团

宋翊

1、宋翊是小说中的人物角色,性别,男。2、登场的作品是《最美的时光》

信用卡逾期1次会影响征信吗?征信出现逾期怎么办?

信用卡逾期1次会影响征信吗?1、信用卡逾期1次是会影响征信。2、按照银行规定来看,信用卡持卡者逾期一次该逾期记录也是会被上传征信的。3、

今年,郑州初二学生也得参加中招考试 今日观点

(网络图片)日前,郑州市教育局公布了今年中招报考情况和考场安排。据

冬天胎压2.1正常吗_冬天胎压2.2会不会有点低

2 1的胎压冬天异常,普通车的标准胎压是2 4-2 5bar,所以2 1的胎压冬天

环球热消息:当前讯息:信用卡逾期多长时间可以停息挂账?网贷怎么申请停息挂账?

信用卡逾期多久可以停息挂账用户的贷款逾期后,就可以申请信用卡停

8月8日登陆PS4和PS5,《幻塔》手游版售价78元 焦点观察

2021年国内上线的手游《幻塔》,将于8月8日登陆PS4和PS5平台。需要注意

人参和红参的区别图_人参和红参的区别

1、它是由人工加工制成的。2、红参味甘,微苦,性温。3、具有滋阴益气

儿子考了675分父亲弹射冲下楼 世界观天下

00:116月24日,安徽马鞍山。爸爸查到儿子高考成绩675分的那一刻,激动

聚焦IPO | 端午节后将有9只新股发行,创业板迎IPO发行“热潮”|世界热点评

端午节过后,A股市场的新股发行数量会有所增加,据Wind数据显示,下周

为什么媒体人都说哈弗二代大狗是15万级满级轻越野?答案揭晓

每到假期,都是大家扎堆出游的时候,这不端午节期间,12306又崩了。不少网友表示在查询机票、车票的时候,发现无法登陆12306,且一直显示未

债券停牌对股票是利好还是利空呢?债券停牌意味着什么?

债券停牌对股票是利好还是利空呢?债券停牌对股票是一个中性概念,既可能利好也可能利空。当债券因不好消息爆出、经营不善等原因停牌时,对

配债是自动扣款吗?配债缴款是什么意思?

配债是自动扣款吗?不是,配债不是自动扣款的,获得配债资格之后,投资者需要自己缴款,若是没有手动申请缴款意味着放弃此次配债的资格。配

外国人开A股账户需要什么东西?一张身份证可以开几个股票账户?

外国人开A股账户需要什么东西?【1】外国护照及复印件;【2】境内机构出具的就业证明及该机构的营业执照或统一社会信用代码证复印件(均需加盖

每日热议!机会必然是留给有准备的人—77分高会考生备考经验分享

高会考试其实不难,重要的是专心复习,坚持到底,正保网校学员初次备考

股票分红10派7元是好事还是坏事呢?股票分红送股是好事吗?

股票分红10派7元是好事还是坏事呢?股票分红10派7元无法确定是一件好事还是坏事,它并不是一概而论的,要分具体情况来看。众所周知,股票分

新三板挂牌算不算上市呢?为什么新三板不叫上市叫挂牌?

新三板挂牌算不算上市呢?新三板挂牌并不算上市,也不意味着就是上市了。上市公司是指在证券交易所上市交易的股份有限公司,而新三板是独立

停止确权?都不用争了,农村房子全部按“新规”处理

停止确权?都不用争了,农村房子全部按“新规”处理,农村房子,农村宅基

@楚雄人!无房职工租房可提取住房公积金了

@楚雄人!无房职工租房可提取住房公积金了,租房,楚雄,无房职工,住房公

综合资讯

+更多

热点资讯

+更多
股票池是什么意思?股价上涨对上市公司有什么好处?
股票池是什么意思 ?其实股票池是基金投资对象备选库的业内通俗称谓,也就是从股市中挑选出一些比较好的股票来作为基金投资的备选股。在《 [详细]

Copyright @ 2008-2020  www.43710.com   All Right Reserved Powered by 财经情报网 版权所有

财经情报网   联系邮箱:562 66 29@qq.com

网站备案:沪ICP备2020036824号-12