首页>资讯 > 社会资讯 > 正文

【天天播资讯】OpenAI为节约成本偷工减料?史上最强大模型GPT-4“变笨”引发全网讨论,输出质量被质疑明显下降

来源:每日经济新闻 四川    2023-06-03 13:30:04

如今距离OpenAI于3月中旬推出其最新版本的大型语言模型GPT-4已经有近3个月的时间。这段时间内,尽管全球资本市场对人工智能、大模型和算力的炒作此起彼伏,也有人称赞GPT-4这个版本强大的能力,但却很少有人质疑GPT-4是否真的比此前更早期的版本强大。

近期,网上对GPT-4是否出现退化的质疑声开始涌现出来,越来越多的网友开始表示,GPT-4对复杂程度相似的问题处理结果甚至还不如它的前身GPT-3或GPT-3.5。面对网友的大量质疑,OpenAI官方开发者推广大使回应称,GPT-4处于静止状态,且自3月 14日发布以来没有做过改动。


(资料图片仅供参考)

可能突破万亿参数的GPT-4,被OpenAI“狂吹”

根据OpenAI自己的说法,GPT-3拥有1750亿个参数,但GPT-4的规模可能会达到数千亿个参数,甚至可能会突破万亿级别。这一规模的提升将有助于提高模型的表现力和泛化能力,使其更能适应各种语言任务,同时也意味着GPT-4接受了更多的数据训练,模型文件中有更多的权重(参数),这也使得它的运行成本更高。

此外,GPT-4可以更准确地解决人们的难题,多模态的GPT-4还可以生成、编辑具有创意性或技术性的文章,在高级推理方面的表现超过其前身。当然,正如大家所猜测的那样,微软New Bing的聊天功能确实基于GPT-4。OpenAI称,该模型“比以往任何时候都更具创造性和协作性”,“可以更准确地解决难题”。它可以解析文本和图像输入,尽管它只能通过文本进行响应。

官方表示,GPT-4错误答案更少,而且也会减少偏离话题的可能,也尽可能不会再谈论禁忌话题,甚至在许多标准化测试中比人类表现得都要更好一些。

例如,GPT-4在模拟律师考试的成绩在考生中排名前10%左右,在SAT阅读考试中排名前7%左右,在SAT数学考试中排名前11%左右。相比之下,GPT-3.5在律师考试中的得分一般都是倒数10%左右。当然,它们考个研究生还是没问题的。

图片来源:OpenAI

不少业内人士也对GPT-4的未来应用前景表示看好,称GPT-4的出现将进一步推动AI语言模型领域的发展。作为下一代AI语言模型,GPT-4将会在各方面都得到进一步的改善,包括语言理解、生成、多语种支持等等。同时,GPT-4也将会在各个应用场景中得到广泛应用,为各个行业带来更加高效和智能的解决方案。

有网友4月份就对GPT-4是否退化发出质疑

那么,GTP-4真的如OpenAI自己所称的那样更强大吗?

就在美东时间本周早些时候,Ycombinator上已有网友提出质疑,称“(GPT-4)确实比以前快很多,但它的输出质量更像是GPT-3.5++。GPT-4产生了更多的bug代码,答案也缺乏深度和分析,总体感觉上比以前要糟糕很多。

图片来源:Ycombinator

在上述网友的帖子下方,另一名网友回复称,“是的。在更新之前,GPT(的上一个版本)能毫不费力地解决相当复杂的编程问题,并对非编程问题给出非常微妙且像是经过深思熟虑的答案。如今,GPT-4只能修改一个10行CSS模块中的两行,并再次给出这修改后的10行模块,不仅感到非常吃力,而且给出的答案中有些内容毫无关系……”

还有网友表示,“OpenAI的(最新)模型给我的感觉是100%被削弱了。几个月前我用它(的早期版本)解决了非常复杂的问题(例如编写一个最小的PDF解析器示例),但今天你会因为问了这么复杂的任务被GPT-4‘责备’。”这名网友最后还称,他已经决定取消订阅他的OpenAI会员资格。

图片来源:Ycombinator

在推特上,有网友称把GPT-4的3小时25条对话额度一口气用完了,都没能解决自己的代码问题,最后无奈切换回了GPT-3.5。

图片来源:推特

《每日经济新闻》记者还注意到,网上关于GPT-4是否退化的讨论,其实在1个月前就已经有了。当时有网友在美国版天涯+贴吧平台Reddit上,对GPT-4是否“变笨”发出质疑。这名当时网友称,“在过去几天里,我经历了GPT-4性能的明显下降。它的推理能力已经退化到GPT-3的水平,而且它正在努力完成上个月刚刚为我完成的任务。今晚的性能还是最糟糕的。这是怎么回事?”

图片来源:Reddit

在OpenAI的官方开发者论坛,有网友在4月30日就发帖称,“一周前,我用GPT4为MS飞行模拟器创建了一个非常简单的C#应用程序。这太神奇了,我只(手动)更正了一次。今天我用了同样的提示词,但经过多次修改后GPT-4还是不能正常使用。

图片来源:OpenAI

一时间,关于“GPT-4退化了”、“OpenAI为了节省成本开始偷工减料”等质疑声开始在Ycombinator、Reddit和推特等平台快速蔓延开来。速度如此之快,就连OpenAI官方的开发者推广大使Logan Kilpatrick都出面来公开回应网友的质疑:“API不会在没有我们通知您的情况下更改。

图片来源:推特

在上述推文下方,Logan还回复了网友一些问题,他称,GPT-4自从3月14日发布以来未发生改动。他还表示,GPT-4对于一些提示词给出的回答内容不一致,是由于大模型本身不稳定。不过,针对网页版GPT-4是否被降级过的追问,均未得到其本人的正面回答。

图片来源:推特

另据监管机构NewsGuard的专家分析,OpenAI最新版本的GPT-4大型语言模型在输出信息方面,确实比它的前身GPT-3.5还要糟糕。在今年3月份发布的报告中,NewsGuard就指出,GPT-4不仅在其研究人员的提示下回答了完全虚假的新闻叙述,而且甚至比GPT-3.5回答的内容更差。

关键词:

【天天播资讯】OpenAI为节约成本偷工减料?史上最强大模型GPT-4“变笨”引发全网讨论,输出质量被质疑明显下降

OpenAI为节约成本偷工减料?史上最强大模型GPT-4“变笨”引发全网讨论,输出质量被质疑明显下降,微软,人工

【世界新要闻】第六届南宝山羌族集聚区非物质文化遗产保护成果展在邛崃举行

悠悠羌笛声,曼曼羌族舞……在四川省邛崃市南宝山直台村,五彩缤纷的羌族非物质文化遗产尽收眼底。6月2日,

lctrl是哪个键 当前热闻

1、lctrl是leftctrl(键盘左边的CTRL键)。2、L表示左(left),M表示中(middle),R表示右(

【全球速看料】安哲

1、安哲,男,30(2021)。2、睿斯(上海)餐饮管理有限公司创始人 CEO。文章到此就分享结束,希望对大家有所帮

全球新资讯:手机等电子设备禁入考点 北京今年高考首次实行两次安检

2023年高考将于6月7日拉开帷幕。今天,北京教育考试院发布提示,今年高考首次实行考点、考场两次安检,为便

当前消息!宪政建设的根本意义在于它的什么正义 宪政建设的根本意义在于它的()正义

1、宪政建设的根本意义在于它的程序正义。2、宪政体制除了要求有一部良好的宪法外,还包括一系列的基本政治

全球速递!学校厕所水管自带粪围灯,女子一关灯立马通红:里面有岩浆?

5月30日,浙江,一位女生发现平平无奇的学校厕所水管,关灯后竟然成了“粪围灯”,视频中女生一关灯水管立

每日消息!火箭经理:引入不符合乌度卡比赛风格的球星毫无意义

火箭经理:引入不符合乌度卡比赛风格的球星毫无意义,火箭,哈登,斯通,火器,毫无意义,美国篮球,伊姆·乌度卡

萤组词_莹组词-天天观点

1、玉莹腴莹莹角莹滑莹魄莹洁莹润莹华莹白莹煌莹拂莹澈莹嫇莹泽莹镜莹琇莹莹莹磨莹玉

当前快报:南京浦口:“名医工作室”入驻,在家门口就能看上专家号

6月2日,南京市浦口人民医院“医联共建造福百姓”“名医工作室”集中入驻签约揭牌仪式举行。来自东南大学附

银行存款并非想象中那么安全?内行人透露:存定期存款请注意3点

一直以来,我国居民都有把闲钱存起来的习惯。随着社会经济快速发展,人们的收入水平不断提高,我国储蓄也一

如何开通个人收款码_3月个人收款码可继续使用 个人经营收款码自愿申请 天天动态

随着3月的临近,关于个人收款条码使用新规也越来越受关注。大量营业额不高的街边小商户是否需要从个人收款

ppsspp鑺卞睆_为什么我的pps播放时是花屏

想必现在有很多小伙伴对于为什么我的pps播放时是花屏方面的知识都比较想要了解,那么今天小好小编就为大家

国内首次!“移动CCU”在患者家成功救命 环球视点

34岁女青年在家突发晕厥、心脏停跳,生命危在旦夕!日前,阜外华中心血管病医院CCU主任张静选派“精兵强将

气囊或无法打开!丰田热门车型大规模召回!此前被曝用户信息泄露 241万车主恐“遭殃” 环球关注

日系三强之一的丰田汽车公司又“出事”了。日前,有消息称,丰田汽车北美公司宣布召回9 6万辆CorollaCross,涉

每日资讯:卖崽青蛙的崽被城管敲烂扔垃圾桶 网友:希望能柔性对待

【卖崽青蛙的崽被城管敲烂扔垃圾桶】6月1日,贵州遵义,一位青蛙人偶在广场售卖玩具时,其售卖的青蛙玩具,

2023年双鱼座9月事业运分析 抛开短期目标

由于加强了自我意识、更好的清晰了自己的生活状态,2023年9月对于我们座双鱼座来说,充满机会而且是一个关

2023年川渝幼儿趣味滑步车嘉年华举行_观天下

(记者贺劭清)2023年全国“奔跑吧·少年”儿童青少年主题健身活动(川渝会场)暨2023年川渝幼儿趣味滑步车嘉年

全球快消息!重磅!金监总局1号公告发布

潮新闻客户端国家金融监督管理总局(下称“金监总局”)挂牌成立以来的第一号文件来了。金监总局、人民银行

市场价值是什么意思_市场价值 全球聚焦

1、账面价值与市场价值的最大区别:账面价值=总资产-总负债,以资产负债表记录的数据计算市场价值=最终交易

世界新资讯:雅江县气象台更新高温橙色预警信号【II级/严重】【2023-06-03】

雅江县气象台更新高温橙色预警信号【II级 严重】【2023-06-03】雅江县气象台2023年06月03日09时26分继续发

【天天速看料】口袋西游枪侠加点问题大全_口袋西游枪侠加点问题

想必现在有很多小伙伴对于口袋西游枪侠加点问题方面的知识都比较想要了解,那么今天小好小编就为大家收集了

镰刀锤子代表什么(镰刀锤子)

诸多的对于镰刀锤子代表什么,镰刀锤子这个问题都颇为感兴趣的,为大家梳理了下,一起往下看看吧。

不建群 qq怎么群发消息给好友_qq怎么群发消息给好友-焦点

1、qq群发信息给好友有2个方法,第一种是创建讨论组,此方法适合给50人以下好友发送。2、第二种就是创建群

雅江县麻郎措镇森林火灾明火全部扑灭 火灾原因正在调查-全球观天下

5月30日9时许,四川雅江县麻郎措镇唐足村发生森林火灾。经多方力量科学扑救,明火于6月3日7时50分被全部扑

环球速看:小王庄镇:网格员化身“传声筒” 为民办实事

津滨海讯(记者张宇靖)一段时间以来,小王庄镇专职网格员多举措为群众办实事,解难题。网格员助力补贴精准

水浒后传主题曲和片尾曲(水浒后传主题曲)

1、片头曲-歌手:屠洪刚大河如龙群山有虎长啸仰天长歌当哭龙盘虎踞有钟有鼓龙腾虎跃有文有武一把剑划开万丈

我的世界拔刀剑大太刀怎么变成妖刀 我的世界拔刀剑大太刀-当前焦点

1、有用按住右键对怪物造成爆炸伤害。相信通过我的世界拔刀剑大太刀这篇文章能帮到你,在和好朋友分享的时

“中国孕妇泰国坠崖案”被告人三审获刑33年零4个月

“中国孕妇泰国坠崖案”三审宣判,被告人获刑33年零4个月新京报讯(记者 彭镜陶)6月2日,新京报记者从“

综合资讯

+更多

热点资讯

+更多
平仓清仓都是什么意思?买入平仓是什么意思?
平仓清仓都是什么意思?平仓和清仓两者之间不同的是:平仓是被迫强制把账户内的股票全部卖出,而清仓是投资人自己主动把全部股票一次性卖出 [详细]

Copyright @ 2008-2020  www.43710.com   All Right Reserved Powered by 财经情报网 版权所有

财经情报网   联系邮箱:562 66 29@qq.com

网站备案:沪ICP备2020036824号-12