3.5 C
Berlin
星期六, 21 2 月, 2026

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

2XKO揭晓后续更新重点,包括新增格斗家阵容

在近期裁员传闻中,拳头游戏公布了2XKO的后续内容与规划,以安抚玩家对游戏存亡的担忧。2XKO的开发之路漫长而曲折,期间经历了诸多重大转折。2025年,随着拳头公司于10月7日正式确认《2XKO》登陆PC平台,随后在2026年1月扩展至PlayStation和Xbox平台,游戏发展似乎步入正轨。然而主机版上线数周后,局势突生变故。尽管玩家盛赞这款格斗游戏的操作手感与机制设计,拳头公司却宣布游戏表现未达维持如此庞大开发团队的预期标准。令人震惊的是,拳头公司解雇了约80名2XKO开发人员,相当于该游戏开发团队总人数的一半。这一严峻消息传出后,玩家们担心2XKO在正式发布不到一个月后就将走向终结,但事实证明情况并非如此。 《2XKO》公布未来规划与新角色 肖恩·里维拉在最新博客中阐述了游戏未来方向,向玩家揭示了拳头游戏的短期与长期规划。角色自然是格斗游戏的核心要素。尽管许多玩家对《2XKO》首发英雄阵容规模感到意外,但拳头公司正通过每个赛季持续扩充角色库。凯特琳作为S1赛季首位登场英雄,拳头公司现已提前曝光了即将加入游戏的两位角色:阿卡丽与塞娜。对众多玩家而言,阿卡丽是呼声极高的忍者系角色——这位来自符文之地宇宙的战士,凭借苦无与锁镰实现迅捷移动与疾风突袭。 同时曝光的塞娜则手持巨型遗物枪械,掌控着光与影的力量。塞娜能用这把枪远程攻击对手,但她不仅限于压制敌方,还能化身幽灵形态冲锋陷阵,近身缠斗搅乱敌阵。里维拉特别说明,目前展示的两位角色仍在开发中,后续将公布更多详情。 除新英雄揭晓外,博客还透露了团队正在推进的其他项目,包括修复当前问题——例如主机版《2XKO》的画面撕裂现象。拳头公司正着力优化《2XKO》三大核心要素:通过引入本地版本支持沙发联机,充分发挥游戏独特的双人对战机制优势。里维拉同时强调技能上限机制不会改变,将强化每位英雄的“独特魅力”,同时更清晰地展现每个角色的优劣势。最后团队将继续通过赛事和社区活动推动《2XKO》的发展。 尽管近期裁员消息令玩家担忧《2XKO》可能停更或减缓更新节奏,但此次消息终究令人欣慰。不过许多人仍在思索:游戏为何在发布不久就陷入如此境地?部分观点认为市场推广力度不足,但更多人将矛头指向皮肤定价问题——这在《Valorant》《英雄联盟》等拳头游戏中实属普遍现象。鉴于拳头游戏采用免费模式,工作室通过其他途径获取收益,主要依靠外观道具和赛季通行证。效仿拳头其他游戏的模式,《2XKO》玩家似乎已对游戏内道具定价感到不满。多数角色皮肤售价约20美元,套装价格更高——例如第一赛季街机超级礼包高达令人咋舌的80美元。即便是备受玩家称赞的薇、金克斯和艾克奥秘系列(因高度还原Netflix剧集而广受好评),也需购买100美元的入门礼包才能解锁。

《刺客信条:暗影》路线图:育碧计划推出更新、跑酷挑战和Switch 2 DLC

育碧发布了《刺客信条:暗影》的路线图,展示了截至 3 月底计划发布的内容。重点包括一个大型标题更新、一个面向社区的新跑酷挑战,以及 Switch 2 版本 DLC《淡路之爪》的固定发布日期。 下一个标题更新将于 2 月 17 日发布。它将带来新的评估、战斗反馈和跑酷功能。不久之后,育碧将举办一场竞赛,玩家可以提交自己的跑酷视频。此外,Switch 2 版本的《淡路之爪》扩展包的发布日期也已确定。 2 月 17 日的标题更新将带来统计页面、暴击反馈和手动跳跃功能 2 月 17 日即将推出的更新将为《刺客信条:暗影》新增一个统计页面。该页面可直接通过库存访问,旨在提供当前装备的详细统计信息。与以往相比,该页面可以更清晰地比较装备、增益和效果。 此外,育碧还改进了暴击时的视觉反馈。今后,暴击时敌人的生命值条将闪烁。动画效果也将更直接,暴击伤害更清晰。 然而,最重要的创新是新增的手动跳跃选项。在菜单中激活“高级跑酷”后,玩家可以随时跳跃。育碧将此功能定位为迈向更自由路线和更流畅跑酷过渡的一步。 育碧推出跑酷挑战赛,社区投票和奖品 为配合手动跳跃功能的推出,育碧推出了跑酷挑战赛。玩家可以录制自己的跑酷视频,提交时长不超过...

《战地风云6》的开发者们清楚地听到了粉丝们最大的批评,但请求大家耐心等待。

《战地风云6》刚刚进入第二个赛季,目前受到粉丝们的欢迎。但开发者们无法驳斥最大的批评。 在发布五个月后,《战地风云6》的情况可能更理想:Steam上的评论褒贬不一,玩家数量可能更高,第一季的表现也不尽如人意。 尽管如此,第二季发布后的初步反响还是比较积极的。不过,粉丝们仍然有一个主要的批评点: 地图太少了。 现在,Dice 开发商也回应了粉丝们的担忧。 我们很高兴你们想要更多 早在第一季时,玩家们就希望有更多新地图。与第二季一样,两张地图在三个月内陆续发布。相比之前《战地》游戏中一次提供四到五张地图的地图包,这显然太少了。 在 采访中,开发人员 Phil Girette 对粉丝们要求增加地图的呼声做出了回应,但这个回应可能不会让所有人满意: 我们看到了这些反馈,也清楚地听到了这些呼声。我们真的很高兴大家想要更多我们能提供的东西。 我们目前正在实验室测试戈木铁路,这是朝着正确方向迈出的一步。然后,我们当然会仔细考虑增加更多地图的问题。但地图也是我们制作过程中最耗时的工作之一。我们需要更多时间。 不过,新赛季的时间表和结构不会改变:目标仍然是三个月内分三个阶段进行。吉雷特不愿确认未来是否仍会提供三张地图。开发人员也表达了类似的观点  亚历克西亚·克里斯托菲在接受 Gamespot 采访时表示: 就频率而言,我们非常希望制作更多地图。我们正在努力尽快为玩家提供更多内容。 因此,《战地风云 6》未来的赛季是否会更大,还是个未知数。 显然,开发商根本无法更快地制作新地图。不过,我们还是可以期待不时会有一些地图重制版。火风暴行动自发布以来一直存在于游戏中,戈木铁路将在尚未确定的时间发布。 关于《战地6》最新地图的质量以及是否值得回归第二季,请参阅我们上面链接的评估。