13.5 C
Berlin
星期三, 29 4 月, 2026

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

Project Helix:新任负责人希望下一代Xbox主机能“价格亲民”——但同时也“不作任何承诺”

Xbox负责人阿莎·夏尔马(Asha Sharma)在一次采访中将“价格亲民”的Xbox硬件定为目标——但同时也明确表示:无法保证Project Helix的价格。当前一代游戏主机已问世超过五年;因此,人们的目光都投向了其继任者——包括微软Xbox的“Project Helix”项目。不过,刚刚上任的Xbox负责人阿莎·夏尔马(Asha Sharma)关于新一代主机的消息却并不乐观。当然,内存短缺危机是影响“Project Helix”规划的背景因素,正如她在接受Game File的采访中至少间接证实了这一点。夏尔马承诺价格亲民——但有一个重大保留条件此次采访的最初契机是一份公开信,该信件旨在勾勒Xbox平台的未来蓝图。据信,该平台将致力于打造“亲民、个性化且开放”的体验。当Game File询问这对Project Helix具体意味着什么时,Sharma却表现得相当谨慎。我们所处的市场有其现实情况——因此不会对价格点或类似事项做出承诺。但我希望确保世界各地的人们都能玩游戏。这种现实(几乎)可以从持续的存储危机中得到印证。昂贵的存储成本将导致即将推出的Xbox主机的售价飙升至四位数——但对你们来说,这似乎只是一个有限的因素!Project Helix:已公布,但未透露细节夏尔马在就任两周后便正式公布了Project Helix,这在某种程度上也象征着她从长期任职的前任菲尔·斯宾塞手中接过了接力棒。因此,这位Xbox负责人在采访中花了不少时间来讨论新主机的定位。夏尔玛在采访中确认,“Helix项目”将“同时支持主机和PC游戏”。当被问及这是否意味着将采用开放平台并支持第三方商店时,夏尔玛至少暂时对此保持了距离:“我并未参与相关讨论,因此我们将与合作伙伴共同做出这些决定。”没有稳固的基础,就没有Helix在规划 Helix 的同时,夏尔玛表示不会忽视当前仍在运行的主机世代。「我们组建了团队,并正在投资主机功能」,这位 Xbox 负责人在 GameFile 的采访中进一步表示。Xbox Series X|S...

《刺客信条:女巫》已失去第二位首席开发者——随着他的离职,一项核心功能也将被移除

育碧内部的动荡也波及到了《刺客信条》系列。在短短数月内,即将推出的新作《女巫》已失去第二位首席开发者——奇幻元素将被移除。育碧可谓风波不断。经历数个财年业绩不佳后,管理层于2024年底启动了公司内部重组。许多项目被重新评估,多款游戏被取消,数百名开发者遭到解雇。2026年初,以公司创始人伊夫·吉列莫为核心的高层宣布了新的公司架构。从今往后,该发行商的所有品牌都将由主题专属的创意工作室负责管理,旨在比以往更快地响应市场需求。在此过程中,各工作室和游戏系列内部也有大量管理层人员被替换,因为新的商业模式显然并未得到所有员工的认可。因此,《刺客信条》系列的长期创意总监马克-亚历克西斯·科特(Marc-Alexis Côté)于2025年底离职,由三位新任系列负责人接替,其中包括新任总内容总监让·盖斯东(Jean Guesdon)。育碧可谓风波不断。经历数个财年业绩不佳后,管理层于2024年底启动了公司内部重组。许多项目被重新评估,多款游戏被取消,数百名开发者遭到裁员。2026年初,以公司创始人伊夫·吉列莫为核心的高管团队宣布了新的公司架构。从今往后,该发行商的所有品牌都将由主题专属的创意工作室负责管理,旨在比以往更快地响应市场需求。在此过程中,各工作室和游戏系列内部也有大量管理层人员被替换,因为新的商业模式显然并未得到所有员工的认可。因此,《刺客信条》系列的长期创意总监马克-亚历克西斯·科特(Marc-Alexis Côté)于2025年底离职,由三位新任系列负责人接替,其中包括新任总内容总监让·盖斯东(Jean Guesdon)。此外,据最新报道,下一款正统续作——代号为Hexe的项目——似乎也并非一帆风顺。继今年2月创意总监克林特·霍金(Clint Hocking)率先辞职后,如今据IGN报道 他的同事、游戏总监贝诺·里谢尔也辞职了——这是该项目在短短几个月内发生的第二起总监级离职事件!围绕《女巫》发展方向的内部冲突内部显然就新作《刺客信条》的创意方向存在分歧。此前的高层显然希望在游戏中加入巫术等奇幻元素,而今年2月接替克林特·霍金(Clint Hocking)的新任创意总监让·盖斯顿(Jean Guesdon)则希望将游戏重新拉回更贴近现实的《刺客信条》设定中。具体来说:魔法元素很可能被移除。据通常消息灵通的育碧内部人士透露xj0nathan据说最初应该有远程操控猫咪的功能,以此绕过守卫并侦察区域。但这一机制现已取消。如果您想了解一些关于游戏幕后的小道消息(这可能与此次离职有关),那就是自今年2月让·盖斯东(Jean Guesdon)接任《刺客信条》系列负责人以来,他决定将《女巫》中所有“魔法”元素全部移除。例如,原本我们应该…… https://t.co/s9BcALY8aB — j0nathan (@xj0nathan) 2026年4月24日据这位内部人士透露,此次取消不仅涉及游戏的整体定位。魔法机制似乎尚未成熟,还需要大量工作。因此,这一决定很可能是为了整体加快《女巫》的发布进度。目前尚无具体日期。但育碧内部目前似乎正在加紧开发。目前已知《女巫》的故事背景设定在中欧——甚至可能是今天的德国——时间跨度为1550年至1650年间的女巫迫害时期。根据此前泄露的信息,女主角艾尔莎原本确实具备施展魔法的能力。不过,这似乎已成为历史。接下来,刺客系列将首先开启一场加勒比海之旅。《黑旗:重制版》(Black Flag Resynced)将于2026年7月9日发售,这是围绕海盗船长爱德华·肯威展开的、广受好评的系列第四部作品的重制版。此外,目前有越来越多传言称,育碧正在开发至少另一款系列旧作的重制版。在上面的链接框中,您可以找到更多关于《刺客信条》的最新资讯。

关于《异形:隔离2》,我们目前还一无所知,但有一项变更已标志着与前作相比发生了显著转变

开发团队将转用虚幻引擎5来制作这部续作。在世嘉(Sega)和 Creative Assembly 发布《异形:隔离 2》的首支预告片后不久,更多细节便浮出水面。据网站DSOGaming 报道称,该续作将采用虚幻引擎 5。这意味着前作中自研的 Cathode Engine 恐怕已过时。消息来源?Creative Assembly目前正在为《异形:隔离2》招聘一名高级开发经理。在招聘启事 中明确提到,该游戏将使用虚幻引擎5(Unreal Engine 5)进行开发。因此,这一信息已得到官方确认。三项新发现 虽然该消息并未透露《异形:隔离2》的具体玩法,但从转用UE5这一事实可以得出一些合乎逻辑的推断:发售日期: 鉴于目前仍在为《异形:隔离2》招聘高级开发经理,说明该作尚处于相对早期的开发阶段。我们目前预计游戏不会在2027年底前发布。光照效果:光影氛围是初代游戏的重要组成部分。借助改进的硬件光线追踪和Lumen技术,虚幻引擎5.6有望在此方面呈现出显著更佳(且更流畅)的效果。关卡设计:《异形:隔离2》的预告片似乎已展示了更为广阔的户外场景。鉴于UE5针对大型地图进行了优化,引擎的更换似乎是顺理成章的。这暗示着我们将摆脱前作中狭窄的飞船走廊。 UE5的利与弊转向虚幻引擎5为Creative Assembly带来了更多优势。例如,招聘和培训新开发人员变得简单得多,因为无需从头开始教他们使用专有引擎。相反,由于UE5的广泛普及,新加入的成员通常已经掌握了该工具。另一方面,UE5也因会因加载着色器而导致卡顿,甚至能迅速将性能极强的硬件逼至极限而臭名昭著。因此,Creative Assembly必须特别注重进行精细的优化。引擎的告别?随着此次转型,Cathode引擎似乎已走到生命周期的尽头,因为目前官方已没有使用该引擎开发的游戏。Cathode...