4 C
Berlin
星期四, 15 1 月, 2026

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

1月15日突然成为生化危机粉丝的大日子

卡普空宣布将于2026年1月15日举办《生化危机》特别展示会。根据活动前发布的预告片,本次展示会将聚焦《生化危机:挽歌》,预计在2月27日发售前为玩家带来更多开发者见解及游戏玩法细节。《生化危机:挽歌》最初于2024年7月卡普空发布会首次曝光,并在2025年夏季游戏节迎来首支完整宣传片,新主角格蕾丝·阿什克罗夫特与回归舞台浣熊市由此正式确认。此后本作陆续发布多支预告片,最新预告片于2025年游戏大奖颁奖典礼首映,在历经数月传闻与泄露后,终于正式确认系列元老级主角里昂·肯尼迪将回归。 《生化危机》特别展示会定档2026年1月15日 1月15日美国东部时间下午5点/太平洋时间下午2点/格林威治时间晚上10点播出 卡普空为即将举办的《生化危机》发布会发布的预告片仅呈现了10秒游戏实机画面,但这短短十秒已让玩家窥见了1月15日可能呈现的精彩内容。莱昂·肯尼迪占据了预告片绝大部分镜头,只见他身着白大褂,与挥舞电锯的丧尸展开近身搏斗。根据极短的画面暗示,莱昂在《生化危机:挽歌》中似乎能像《生化危机4 重制版》那样格挡近战攻击。预告片中还短暂展示了第一人称射击视角,这似乎证实了本作将改变《生化危机7》和《村庄》的设定——玩家现在可以瞄准武器的准星进行射击。《生化危机:安魂曲》导演中西浩司在《生化危机》展示会预告片中闪现一瞬,暗示本次展示会可能包含开发者访谈环节。这将是自2025年12月确认莱昂·肯尼迪回归以来,开发团队首次公开谈论该角色。在里昂现身《生化危机:挽歌》游戏大奖预告片之前,卡普空曾坚称他不会出现在游戏中。2025年6月的卡普空焦点活动中,官方表示该角色“与恐怖题材不符”,并在游戏公布至12月期间多次否认其存在。 除了解开卡普空对里昂回归的保密之谜外,玩家或将见证其游戏流程与另一位主角格蕾丝·阿什克罗夫特的对比。当前传闻指出里昂篇章将侧重动作元素(类似《生化危机4 重制版》),而格蕾丝篇章则延续《生化危机7》的传统生存恐怖体验。 需特别注意的是,尽管标题暗示整个系列将获得关注,但根据上述预告片来看,《生化危机》特别展示会似乎仅聚焦于《生化危机:安魂曲》。预告片中仅展示该作画面,英文旁白也明确称其为“关于《生化危机:安魂曲》的特别展示会”。回顾往届《生化危机》发布会,卡普空通常会明确公布展示内容,例如2022年发布会曾确认将展示《生化危机4》《生化危机8黄金版》以及“更多内容”。尽管如此,1月15日展会上仍存在展示其他生化危机作品的可能性。虽然卡普空未正式确认其他生化系列游戏的开发计划,但泄密者Dusk Golem曾透露《生化危机0》与《生化危机-代码:维罗妮卡》的重制版正在制作中。

Twitch主播Nickmercs回应《ARC突袭者》作弊指控

前《使命召唤》电竞明星、现任主播尼克·科尔切夫(网名Nickmercs)针对其在热门第三人称突袭射击游戏《ARC突袭者》中作弊的指控作出回应。近期一段Nickmercs在《ARC突袭者》中击杀黄蜂的短视频在玩家社区疯传,主播精准的瞄准辅助操作令人怀疑其使用了自动瞄准外挂。对此Nick作出回应,解释自己作为少数使用手柄进行PC端游戏的内容创作者,该操作纯粹源于游戏过强的瞄准辅助机制。关注内容创作者和主播的玩家对Nickmercs应该不陌生,这位前电竞明星早已成为游戏圈家喻户晓的名字。35岁的他曾是《使命召唤》职业选手,在《使命召唤:现代战争2》时代就已在竞技圈崭露头角。2019年Nickmercs加入FaZe战队后事业迎来腾飞。此后他离开战队,将重心转向YouTube和Twitch平台的内容创作,定期直播《战地风云》和《ARC突袭者》等游戏。 Nickmercs否认在《ARC突袭者》中作弊 当职业选手转型主播后,面对每日数小时的直播,作弊指控往往如影随形。尼克默克斯近日在《ARC突袭者》中再度遭遇作弊质疑。上周,一段他在游戏中击落黄蜂战机的片段被上传至游戏子版块,发帖者询问:“如何才能让瞄准如此精准?” 尽管该帖未直接指控作弊,却收获数千赞和评论,其中多数质疑主播作弊行为。“我的瞄准辅助根本不像这样,”一位用户表示;另一人则称:“这就是作弊,我的瞄准辅助不会这样运作。”该主播随后回应指控,否认作弊嫌疑。“没有作弊。抱歉。我可不是花了20年打职业比赛,就为了在ARC机器人面前作弊。”尼克在近期直播中如此回应(转引自Jake Lucky)。虽然他未作更多说明,但推测PC端的瞄准辅助可能远强于主机平台。正如这位主播所指出的,历史上主机平台的瞄准辅助通常比PC端更强,但《ARC突袭者》似乎反其道而行。许多玩家发帖力挺尼克,强调游戏中瞄准辅助的强度,尤其是ARC机器人。在正确设置下,手柄会自动锁定黄蜂号机身,但玩家都清楚击落它的最佳方式是摧毁后方两组旋翼。因此尼克会先锁定机身再拉开,然后重新锁定旋翼——他试图让瞄准辅助锁定旋翼而非机身。 "抱歉我没作弊,可没等20年职业生涯就为了在ARC机器人面前作弊。想置我于死地或封杀我的各位,抱歉了—— 他妈的秀必须继续"Nickmercs回应ARC Raiders作弊指控pic.twitter.com/q1dXZl2AVS — Jake Lucky (@JakeSucky) 2026年1月12日 作弊问题近期在《ARC突袭者》社区引发热议,这款射击游戏的超高人气似乎吸引了大量作弊者涌入。值得庆幸的是,开发商Embark Studios已对此作出回应,并向玩家保证将对游戏规则进行重大调整,同时部署新型检测机制以识别并清除作弊者。声明发布后,众多作弊者已遭到《ARC突袭者》的临时封禁,但多数玩家认为Embark应采取更严厉措施,立即实施永久封禁。该工作室今日还发布了2026年首个重大更新,1月13日面向PlayStation 5、Xbox Series X/S及PC平台推送了新版补丁。此次更新将游戏版本升级至1.11.0,终于削弱了引发争议的“触发手雷”——该道具此前已主导PvP对战数周。Embark工作室重新调整了该道具的伤害衰减机制,使爆炸中心区域伤害更集中,边缘区域伤害降低。同时将手雷引爆延迟时间从0.7秒延长至1.5秒。

《战地6》推迟第二季更新,延长第一赛季

开发商战地工作室正式宣布推迟《战地6》及REDSEC第二季的发布,并将延长当前赛季的运营周期。《战地6》第二季现定于2月17日登陆PlayStation 5、Xbox Series X/S及PC平台。但好消息是,工作室计划于1月20日推出新更新,通过新增内容延长第一赛季周期,以满足玩家未来数周的游戏需求。 《战地6》及REDSEC第二季延期至2月17日 尽管战地工作室尚未正式公布第二季的发布日期,但原定于1月20日结束的第一季本应在本月晚些时候迎来第二季。然而在最新公告中,工作室宣布《战地6》与REDSEC的第一季将持续运营至2月17日第二季上线。工作室声明称,调整发布日期是为根据玩家反馈进一步完善第二季内容。虽然玩家需再等待五周才能体验新赛季,但战地工作室并未让玩家空手而归。1月20日将推出“延期更新”,包含全新周挑战、奖励路径及延续第一赛季的战役通行证。1月27日开放的“寒霜烈焰奖励路径”将让玩家通过层级推进解锁免费与高级定制奖励,包括武器套装、士兵皮肤及经验值加速道具。战地工作室表示,霜焰奖励路径可与《战地6》第一赛季战斗通行证同步推进。与以往奖励路径不同,霜焰奖励路径的所有奖励点数均可通过周挑战获取,该路径不设额外奖励挑战。 战场新威胁升级,战斗愈演愈烈。第二季将于2月17日开启。pic.twitter.com/fGMegJJuTj — 战地 (@Battlefield) 2026年1月13日 工作室同时透露情人节庆典活动即将开启,更新期间将推出新一轮每日登录奖励及数个双倍经验周末活动。期待新修复内容的玩家还可欣喜得知,1月20日的更新将包含多项优化改进,但具体细节尚未公布。战地工作室计划继续支持“战地实验室”项目,让玩家社区能在游戏更新进入后期开发阶段时提前体验内容。工作室表示:“第一赛季的延长与战地实验室的运用,将为整个运营赛季的精彩内容奠定基础,包括即将到来的第二赛季。”尽管第二赛季的具体内容尚未公布,战地工作室承诺将于二月披露更多细节,并将在近期公布《战地6》及REDSEC的2026年完整路线图。