运营商财经 康钊/文
在6月28日的一个会上,中国联通董事长刘烈宏谈了他对人工智能的看法,他预测两年内50%的工作将受到人工智能的深刻影响,这可能是又一次产业革命的起点,可能是触碰下一个未来的历史节点。不过,他又认为,人工智能目前还是处级水平。
【资料图】
人工智能如今非常热,但是,也被认为能力还是没法跟人脑比。比如,德国学者对GPT-3.5进行了大规模测试,发现其实它只会讲25个笑话。
比如为什么音乐家不会整理房间?因为他们喜欢有一点和弦(乱)。
为什么电脑总是出汗?因为它们有太多运行程序。
为什么电脑没有女朋友?因为它们只有电脑妈妈。
为什么足球比赛中裁判总是开车?因为他们喜欢有点行驶(判罚)。
刘烈宏也笑称,“最近,我们注意到有专业人士使用GPT答了一下今年的高考试卷,其中英语得了140分、生物得了120分、语文得了110分,但是数学只得了80分,各科都是150分满分,大致是个考取二本的水平。”
GPT真的只有这个水平吗?好像是,因为另外有人也做了测试:
在今年的高考数学I卷中 共挑选了13道题(其中选择题8道、填空题2道、解答题3道),共计84分。分别测试了GPT-4、通义千问、文心一言、讯飞星火四个大模型,其中GPT-4得分最高为36分,讯飞星火得分最低为19分。按百分制分别为43、35、26、23分。
GPT在美国考试中似乎更厉害。OpenAI官网称,在“美国高考”SAT中,GPT-4在数学和阅读部分也能战胜近90%的考生。在难度更高的国际生物学奥赛中,GPT-4甚至能吊打99%的人类选手。在模拟美国律师从业资格考试中,GPT-4能排进前10%。
但GPT最大的短板是数学,GPT不擅长计算和推导,只能解决一些比较简单的计算题,如简单的函数求导、几何图形计算等。对于需要推导的数学题,GPT的表现很差。
运营商财经(官方微信公众号yyscjrd)—— 主流财经网站,一家全面覆盖科技、金融、证券、汽车、房产、食品、医药、日化、酒业及其他各种消费品网站。
关键词: