-4.8 C
Berlin
星期四, 25 12 月, 2025

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

《堡垒之夜》新皮肤问世不到一周,已跻身史上使用率最高的皮肤之列

Epic Games公布了今年《堡垒之夜》的惊人数据,金·卡戴珊主题美妆套装在七日内便登顶年度榜单。该游戏无需付费即可畅玩,仅“拯救世界”模式为付费内容,其余所有收费项目均属纯装饰性道具。Epic Games还允许玩家通过游戏方式获取V币,无需真实货币消费。只要持续游玩,玩家即可解锁战斗通行证的免费奖励,每季最多可赚取200 V币。虽然听起来不多,但几个赛季积累下来,足以购买整套战斗通行证。此外,为鼓励新玩家尝试战役通行证而无需苦苦攒V币,Epic Games向购买第七章第一赛季入门礼包的新玩家提供了额外V币奖励。与老玩家支付4.49美元获得600V币不同,新玩家可享受专属优惠——同等价格的入门礼包内含1000V币。多数玩家乐于在游戏钱包中持有V币,这使他们能自由消费于道具商店,购买心仪的装饰品。 金·卡戴珊皮肤一周内跻身《堡垒之夜》史上百大热门皮肤榜 联名与跨界合作款通常最受玩家青睐,金·卡戴珊系列的成功便是明证。Epic Games近期公布的年度数据表明,该系列上架物品商店首周即以惊人销量刷新纪录。数据显示, 玩家身着金·卡戴珊皮肤进行的对战场次已突破3700万场。据Fortnite.gg统计,该皮肤已成为第七章最受欢迎的皮肤,尽管《堡垒之夜》现有皮肤数量已超千款,它仍迅速跻身游戏史上使用率最高的皮肤前100名。 2025年对Dill Bits意义非凡。pic.twitter.com/JqZ3LWna8S — 堡垒之夜 (@Fortnite) 2025年12月21日 当金·卡戴珊美妆系列发布时,部分玩家对这位社交名媛加入《堡垒之夜》皮肤阵容持怀疑态度,因为两者看似毫无关联。但在接受《Elle》杂志采访时,金被问及与《堡垒之夜》的合作时表示,她早已了解这款大逃杀游戏——她的家人中就有玩家。尽管自称技术不佳,但她热爱游戏中的服装设计,并认为这是款标志性作品。 金·卡戴珊美妆道具何时退出《堡垒之夜》商城? 12月27日美国东部时间晚7点 《堡垒之夜》中的金·卡戴珊皮肤拥有极高的可定制性,这正是众多玩家青睐美妆道具的关键要素。作为粉丝最爱的“标志性金·卡戴珊”皮肤,以1800虚拟币的价格提供丰富的自定义选项:玩家可选择乳胶连体衣的款式与颜色、发型,甚至决定是否佩戴墨镜。若花费1500 V币,玩家可购买基础版金·卡戴珊皮肤。但该版本可选风格较少,仅支持切换夹克穿脱状态。Epic Games还披露了其他亮点:萨布丽娜·卡彭特皮肤意外成为热门联名款。2025年期间,完成萨布丽娜·卡彭特双人组、三人组及小队任务的玩家总数近700万。萨布丽娜·卡彭特最初作为《堡垒之夜》第八赛季音乐通行证内容推出,今冬节日活动她将携全新主题皮肤回归。另一热门联动是K-Pop恶魔猎人跨界活动,该活动重制了游戏中每年万圣节推出的“恶魔狂潮”模式。Epic数据显示,今年十月该模式中被消灭的恶魔数量近1000亿。由此可见,尽管《堡垒之夜》已与数十个品牌及名人展开合作,却丝毫未影响游戏人气。Epic持续引入新角色吸引新玩家,同时激发回归玩家与老玩家的热情,这点至关重要。

“若非马里奥,我可能不会进入这个行业”——小岛秀夫坦言没有马里奥就不会有《合金装备》或《死亡搁浅》

小岛秀夫近日透露了自己投身游戏行业的最大契机,暗示若没有《超级马里奥兄弟》,小岛制作可能根本不存在。这位工作室创始人凭借《合金装备》系列的创作声名鹊起,已成为游戏界最具标志性的传奇人物之一。小岛以宏大而存在主义的叙事风格闻名,在《合金装备》系列之后创立同名工作室并打造《死亡搁浅》。如今这位开发者的创作根源,竟可追溯至游戏界最受喜爱的经典IP之一。自1980年代《马里奥兄弟》登陆街机厅以来,这款平台跳跃游戏系列已成为全球最具辨识度的流行文化符号之一。随着《超级马里奥兄弟》登陆任天堂红白机,该系列达到全新高度,也奠定了任天堂作为家用主机巨头的地位。马里奥的传奇同样激励着全球游戏开发者。 小岛秀夫受马里奥启迪投身游戏创作 在近期接受《连线》杂志采访时,小岛秀夫谈及了作为游戏开发者对他影响最深的几位人物。他分享了玩《超级马里奥兄弟》后的个人感悟,坦言这款游戏是他投身游戏开发的重要契机。小岛还趣谈了初次接触该游戏的经历,声称大学时期曾为玩游戏“逃课”。小岛盛赞《超级马里奥兄弟》是首个向开发者证明电子游戏“终将超越电影”叙事能力的典范,尽管初代作品剧情极为简单。在访谈中,小岛提及的重大灵感来源远不止《超级马里奥兄弟》和任天堂。当被问及电影导演时,小岛列举了众多影响其个人风格的杰出导演,包括斯坦利·库布里克、阿尔弗雷德·希区柯克、约翰·卡朋特等人。小岛秀夫在访谈中还透露了自己最喜爱的电影——《2001太空漫游》堪称“完美电影”,是“科学与哲学”的绝妙融合。他甚至谈及最想改编成游戏的电影,认为《铁血战士:荒野》和《最后的武士》具有“游戏化剧情”。 小岛秀夫的传奇随着每个新项目持续壮大 小岛秀夫在游戏界的创作生涯中,以星光熠熠的成就铸就传奇。在2025年游戏大奖颁奖礼上,《死亡搁浅2:海滩之上》以七项提名并列第二,成为本届颁奖礼提名最多的作品之一。尽管《死亡搁浅2》最终未斩获奖项,但该作入围了备受瞩目的“年度游戏”奖项决赛,最终不敌Sandfall Interactive开发的《明暗交界:远征33》。而初代《死亡搁浅》曾在2019年摘得“最佳游戏导演”奖项。 尽管小岛制作的最新作品广受赞誉,但这位开发者远未停下脚步。小岛秀夫于2023年正式公布由Xbox游戏工作室发行的全新恐怖游戏《OD》,该作由知名喜剧与恐怖题材作家乔丹·皮尔共同编剧。小岛同时透露将重返备受期待的动作间谍题材领域,正与索尼及哥伦比亚影业联合开发《Physint》。凭借这些新作,小岛秀夫有望进一步巩固其游戏界最高产创作者之一的地位——而这一切都要归功于那款改变游戏世界的平台跳跃小游戏。

据称《上古卷轴6》引擎大改将融入虚幻技术

据知名内部人士最新爆料,贝塞斯达正借助微软支持全面改造《上古卷轴6》引擎,计划整合虚幻引擎的特定技术。该爆料人还透露了更多项目细节,并阐述了这些技术如何与《星际战场》续作关联——贝塞斯达预计将在《天际》续作之前推出该新作。 微软据称协助贝塞斯达将虚幻技术植入《上古卷轴6》引擎 据科登的消息来源透露,贝塞斯达目前正在更新创世引擎,同时“借鉴虚幻引擎的部分技术”并将其整合到自家技术体系中。作为贝塞斯达母公司ZeniMax Media的所有者,微软据称正派遣内部专家团队提供支持。其中包括The Coalition工作室的技术总监凯特·雷纳——她在播客节目中被点名提及。该未具体说明的虚幻技术预计将应用于工作室的下个项目,因《上古卷轴6》早已确认将采用创世引擎。 《星际战场》或成《上古卷轴6》《辐射5》引擎技术的试验田 据悉,此次引擎升级将首先应用于贝塞斯达2023年推出的太空题材RPG。“《星际战场》正在经历某种技术性大改造,”科登透露,“其中部分改进将直接影响未来《辐射》与《上古卷轴》系列的游戏体验。”支持该观点的细节在于《星际战场》的Steam补丁记录——其中“lumens”分支仅在2024年7月29日更新过一次。需说明的是,Lumen(单数形式)是虚幻引擎5引入的照明系统。该系统无需开发者手动预烘焙光照,即可实现动态实时光影效果。虽然它支持光线追踪技术,在非正式场合常与光线追踪混用,但并非必须依赖该技术。《星际战场》正在经历某种技术性大改造... 其中部分改进也将影响未来《辐射》与《上古卷轴》系列新作的开发方向。 根据科登描述的计划,贝塞斯达采用虚幻技术并不意味着《上古卷轴6》会像《上古卷轴4:湮没重制版》那样完全依赖虚幻引擎。该重制版由Virtuos开发,采用虚幻引擎5呈现画面,但游戏逻辑仍基于Gamebryo引擎——即初代《湮灭》所用创世引擎的前身。相反,《上古卷轴6》预计将完全运行于创世引擎,并整合精选第三方技术。 贝塞斯达对TES6引擎的改造规模或仍逊于《星际战场》引擎革新 目前尚不清楚创世引擎改造的具体范围。贝塞斯达执行制作人托德·霍华德在2020年11月接受GamesIndustry.biz采访时,曾将《星际战场》引擎革新描述为“可能是工作室史上规模最大的改造工程”。此后该项目被视为《星际战场》耗时七年开发的根本原因之一——即便以现代3A游戏标准衡量,这亦属异常漫长的开发周期。2021年6月接受《每日电讯报》采访时,霍华德再度提及代号“创世引擎2”的改造计划,称其旨在为《星际战场》及工作室下一部作品提供共享基础架构。他虽提及贝塞斯达将在《上古卷轴6》开发期间持续更新引擎(如同对待任何新作),但霍华德的言论暗示现代化改造的主体工作已于《星际战场》制作期间完成,公司下一部作品将不会进行同等规模的引擎升级。2025年7月中旬,科登报道称《上古卷轴6》已达到“相当可玩”的状态,称其为重要开发里程碑。但鉴于贝塞斯达确认该作实际开发始于2023年末《星际战场》发售后,结合现代3A游戏开发周期,“相当可玩”的表述很可能指代的是预Alpha版本。该游戏仍不太可能在2028年前发售。2025年12月接受《游戏资讯》采访时,霍华德被问及这款开放世界RPG的现状,他形容《上古卷轴6》“进展非常顺利”。