18.5 C
Berlin
星期二, 30 6 月, 2026

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

Steam Machine:Valve收回了一项核心承诺,这让主机玩家倍感熟悉

Valve下调了Steam Machine的性能承诺。在游戏行业,豪言壮语往往“保质期”很短。继索尼PlayStation 5的购买者之后,Steam Machine的潜在用户和购买者如今也必须吸取这一教训。Reddit上细心的用户发现,Valve悄无声息地调整了关于这款游戏PC性能的一项重要信息。此前还曾豪言“4K分辨率下60帧游戏”,如今却已明显调整为“最高支持4K分辨率,搭配FSR技术”的表述。原生4K的悄然告别具体来说,这涉及在热门硬件子版块r/pcmasterrace中的一项发现。一位细心的用户在对比当前实时版本与官方宣传页面旧版本时,注意到了一处关键的文字变更:最初的承诺:Valve在规格说明中宣传“60 FPS的4K游戏体验”。这种表述暗示,内置硬件具备足够的计算能力,能够流畅运行4K分辨率下的现代游戏。修改内容:在网站悄然更新的版本中,该段落已被更谨慎的表述“最高支持通过 FSR 实现 4K 游戏”所取代。在未发布任何官方新闻稿或说明性博客文章的情况下,Valve 由此明确了一项关键的技术细节。新文本明确指出,玩家主要将通过AMD的图像增强技术FidelityFX Super Resolution(FSR)体验4K游戏。该技术先以较低分辨率渲染图像,随后将其增强至4K分辨率。初步测试证实了这一更新后的性能承诺。PC Games Hardware 的同事们在基准测试中发现,玩家应预期其性能更接近全高清(Full-HD)或 WQHD 水平。https://www.youtube.com/watch?v=6tI1SoMj5vgPlayStation粉丝的既视感:8K与4K的承诺这种暗中退缩的做法,对PlayStation玩家来说恐怕格外似曾相识。在PlayStation 5上市时,索尼还在包装上印有8K标志进行宣传。向消费者传达的信息非常明确:这款硬件性能如此强大,甚至支持8K分辨率。近四年后,索尼收回了这一承诺。8K标志已被移除,此后再未出现在包装上。https://www.youtube.com/watch?v=Dr1dFKCvQao在4K 60帧方面,主机玩家同样不得不做出妥协。虽然常规版PlayStation主机在“画质模式”下通常可以以4K分辨率运行,但帧率会被限制在30帧。而在“性能模式”下,虽然能达到梦寐以求的60帧,却无法实现原生4K分辨率。索尼的PlayStation...

Steam上下一款爆红的联机“朋友乱斗”游戏已初现端倪

Steam在合作类“朋友乱斗”游戏领域迎来了一颗崭新的新星——《Bombanana》,其试玩版迅速成为该平台上游玩人数最多的游戏之一,数千名粉丝正翘首以盼其正式上线。近年来,Steam上的“朋友乱斗”子类型呈现爆发式增长,独立游戏《Peak》、《R.E.P.O.》和《Content Warning》的成功便是明证。如今,《Bombanana》展现出了巨大的潜力,并有望成为Valve商店中下一款备受瞩目的“朋友乱斗”游戏,原因如下:在《Bombanana》中,三名玩家将加入一场合作游戏,共同的目标是拆除一枚定时炸弹。关键在于,这三名玩家各自都存在某种影响其能力的障碍:一名玩家是聋人,一名是哑人,另一名则是近乎失明。哑玩家负责阅读拆弹手册,并通过表情动作而非言语传达指令。聋玩家则将哑玩家的手势翻译给盲玩家,以便他们在时间耗尽前成功拆弹。《Bombanana》在发售前就获得了压倒性的好评2026年6月初,Steam举办了“Next Fest”活动,数千款AA级和独立游戏提供了免费试玩版。活动结束后,Valve公布了“Next Fest”试玩版播放量前50名的榜单,其中Bombanana位居榜首。截至本文撰写时,Bombanana的试玩版在Steam上已获得超过1,500条评价,其中97%为好评。& nbsp;根据 SteamDB 数据,这款尚未发行的独立游戏免费试玩版在高峰期同时在线玩家数也超过了 40,000 人,每天都有数千名玩家专程回归体验该试玩版。《Bombanana》迄今为止的发售前成就第1名2026年6月Steam Next Fest期间最受欢迎的试玩版 同时在线玩家超过40,000人 用户平均评分达到“压倒性好评”《Bombanana》巧妙地将解谜与玩家互动相结合,创造出一种根据玩家不同而截然不同的游戏体验。对于那些好奇游戏中是否存在进度系统的玩家来说,《Bombanana》会随着游戏进程逐步提高每项拆弹挑战的难度,并加入新的机制和花样。每局结束时,系统会根据玩家的用时和失误次数进行评分。值得一提的是,《Bombanana》非常适合快速游玩,因为每项任务通常持续时间不到五分钟。鉴于该游戏在正式发布前就已大获成功,可以肯定的是,《Bombanana》在不久的将来将成为 Steam 最佳“朋友互怼”游戏中的家喻户晓之作。开发商 Lefto Studio 计划于 2026...

《寂静岭 f》官方免费DLC现已上线

发行商科乐美(Konami)为《寂静岭 f》发布了全新DLC,这或许是恐怖游戏爱好者早有预料的。更令人欣喜的是,《寂静岭 f》DLC 现已上线,这为游戏界两大最具标志性的日本恐怖游戏系列(这两个系列常被粉丝们拿来比较)之间又增添了一层联系。今年早些时候,科乐美曾与光荣特库摩合作,推出了一款融合《寂静岭 f》DLC与《零:绯红蝴蝶 重制版》的恐怖跨界内容。该更新允许玩家让《寂静岭 f》的主角天仓美绪换上《零》系列主角清水绫子的校服套装,同时还将绫子的“狐狸面具”赠予美绪及其双胞胎妹妹真由。如今,看来轮到光荣特库摩回馈科乐美了。全新《寂静岭f》×《零~红蝶重制版》联动DLC《寂静岭 f》的“绯红蝴蝶”DLC 是一款以天仓美绪为原型的免费服装,现已登陆所有平台。这套免费服装让日向子穿上了天仓美绪的标志性装扮,让玩家在体验《寂静岭 f》的同时,也能向另一款经典恐怖游戏致敬。虽然这只是纯粹的装饰性内容,但鉴于这两个系列经常被拿来比较,这一设定显得十分自然。虽然没有新增剧情或游戏内容,但既然是免费的,哪怕只是为了重温《寂静岭F》的微小理由(尤其是考虑到游戏中所有可解锁的结局),也实在难以抱怨。这个DLC很可能标志着这场“以牙还牙”式联动的终结,但也或许两家公司正在为更大的合作铺路——尽管目前这还只是天马行空的猜测。这款DLC既能激励玩家重温游戏,也能吸引新玩家入坑——特别是《零:月蚀之夜2》的粉丝。说到这里,值得一提的是,《寂静岭f》目前正作为Steam夏季特卖的一部分参与促销,可享受五折优惠(价格降至34.99美元)。如果有人一直在等待打折,那么近期恐怕再难有比这更好的时机了,因此最好在7月9日夏季特卖结束前尽快行动。此外,对于刚接触这两个系列的新玩家,还有一款价格稍高的合集包,其中包含《寂静岭 f》和《零:重制版》。对于正在游玩《寂静岭f》的玩家来说,这次联动无疑是一个重返游戏世界的绝佳借口。而对于《零》系列的资深粉丝而言,这也再次印证了该系列仍在持续影响着现代恐怖游戏——即使是通过像这样的合作形式。虽然只是一个小小的补充,却向这两个生存恐怖系列致敬——它们数十年来一直以截然不同的方式让玩家心惊胆战。自《零~暗影之镜~》于2001年问世以来,其缓慢的节奏、心理层面的叙事以及独特的氛围,让许多恐怖游戏爱好者将其与《寂静岭》相提并论。当然,最大的区别在于《零~暗影之镜~》的“暗箱”战斗系统,该系统已成为该系列的标志性机制。尽管如此,这两个系列在二十多年间始终是生存恐怖游戏领域的支柱,因此此次合作显得顺理成章。