2.4 C
Berlin
星期一, 1 12 月, 2025

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

部分《银河战士Prime 4》早期版本已现身市面

距离《银河战士Prime 4:超越》12月4日发售尚有数日,但任天堂Switch 2版本的实体游戏似乎已提前流出。Reddit用户Shadow-Gang在帖子中晒出了手持实体游戏的照片,评论区网友调侃称任天堂很快就会上门找他麻烦。 任天堂游戏出现提前泄露版并非首次,但对于《银河战士Prime4:超越》这样备受瞩目的作品,此举确实存在风险。近期Switch及Switch 2平台的《宝可梦传说:Z之觉醒》与《大金刚狂热》等作品也曾提前泄露,引发数据挖掘行为,任天堂为此发布过剧透警告。如今《银河战士Prime 4》似乎也遵循着类似模式,同样的情况可能再次发生,而其漫长的开发历程更使局面变得尤为棘手。 《银河战士Prime 4》漫长开发周期加剧变数 《银河战士Prime 4:超越》不仅是近年最受期待的《银河战士》系列作品,更是史上最受期待的游戏之一。自2007年《银河战士Prime 3:腐蚀》问世后,该系列杳无音讯长达十年之久,直至任天堂E3发布会通过预告片正式公布《银河战士Prime 4》。此后,本作在开发过程中历经艰辛,不仅经历了工作室更迭,更完成了彻底重启。 2017年6月: 银河战士Prime 4 正式公布 2018年2月:万代南梦宫工作室确认开发 2019年1月:宣布由Retro工作室接手重启开发 2024年6月18日: 公布新作标题《银河战士Prime 4:超越》 2025年9月12日:任天堂宣布游戏正式发售日为2025年12月4日 毋庸置疑,银河战士Prime 4:超越的实体版本竟已流入市场,其时机堪称破坏性事件。这款备受关注多年的作品,任何泄露的画面或早期体验都可能在任天堂预定宣传期前影响公众认知。这种可能性尤为突出,因为每段《银河战士Prime 4》的预告片和预览都引发了质疑:本作究竟会忠于系列本源,还是彻底颠覆传统开拓新天地? 《银河战士Prime 4:超越》引发玩家担忧 开放区域与Vi-0-La摩托车 首先,《银河战士Prime 4:超越》的开放探索环节引发了粉丝担忧,尽管目前仅凭预告片就做出判断为时尚早。Reddit用户UnlikelyLikably的一篇帖子 在银河战士Prime...

杰夫·基利在加州沙漠里放了一个神秘的雕像——玩家们对它的来历有各种疯狂的猜测

在游戏大奖和杰夫·基利的社交媒体频道上,出现了一座带有位置信息的谜之雕像。粉丝们认为这暗示着新《战神》、《上古卷轴》...还是《半条命3》? 时间快到了:2025 年 12 月 12 日,游戏大奖将如期举行。和往常一样,杰夫·基利将担任主持。除了为优秀游戏颁奖外,该节目还以宣布新项目和播放独家预告片而著称。 游戏大奖和杰夫·凯利在社交媒体上发布了一条神秘消息,让许多玩家兴奋不已。这背后是否暗示着新《战神》甚至《半条命3》的到来?让我们仔细看看吧。 一座雕像静静地矗立在沙漠中,一动也不动,一言不发...... 11 月 29 日,杰夫·凯利在他的 X 账户(原 Twitter)上发布了一张雕像的照片,并配以“皇家、鼓舞人心、厚重”的文字。此外,游戏大奖的官方账号还发布了一张地图,上面标记着加利福尼亚州约书亚树国家公园的位置: https://t.co/PpLEh3fP6M pic.twitter.com/9SxWtgy3N2 — The Game Awards (@thegameawards) 2025年11月29日 雕像上刻着各种各样生物——亡灵、熊、鳄鱼、穿盔甲的人——它们扭曲着身体,发出尖叫,围着大门扭动,大门顶端有一个像眼睛一样的肿瘤,上面长着藤蔓。不久,第一批...

失传的《辐射:新维加斯》版本现身,其中包含大量我们本不该看到的丰富内容

一个YouTube频道挖掘出了一个比最终发布版本大2GB的新维加斯原型。 在亚马逊剧集第二季即将上映之际,许多粉丝都沉醉在《辐射:新维加斯》的回忆中。因为这部热门剧集的续集将带我们回到标志性的新维加斯大道,这是《辐射》角色扮演游戏的高潮场景。 如果你对《辐射:新维加斯》还意犹未尽,那么我们有个好消息要告诉你: 一个失传的版本现已出现,其容量比最终发布版本多出 2 GB。下面我们就来简要介绍发生了什么,以及你在文件中能找到什么。 《辐射:新维加斯》原本规模更大 发生了什么? 全新的 YouTube 频道 Games' Past 致力于挖掘和恢复旧游戏。首先亮相的是《辐射:新维加斯》的一个旧版本,日期为 2010 年 7 月 21 日——距离最终版本的制作日期只有一个月的时间。这个原型总大小为 6 GB,比最终版本多出 2 GB。 但这位 YouTube...