10.1 C
Berlin
星期六, 6 6 月, 2026

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

技嘉在Computex展会上以一系列创新产品庆祝成立40周年!

在瞬息万变的科技界,能坚持40年实属不易。技嘉将在今年的Computex 2026展会上庆祝这一重要里程碑。技嘉在Computex上庆祝成立40周年!技嘉没有仅仅停留在例行公事的演讲上,而是真正将今年的展会呈现得触手可及。其背后的理念其实相当简单,却令人倍感亲切:他们希望向世人展示,即便历经四十年,他们依然活力十足,并持续钻研,致力于为我们的办公桌提供最佳解决方案。但本次展会最精彩之处在于,产品展示绝非枯燥乏味。展会的口号非常明确:欢迎光临,请尽情体验,亲自试用一下这些产品吧。为了让大家感受一下现场的真实氛围,让我们带大家在展位上进行一次虚拟的短途游览。其中,您可以近距离欣赏到几乎完整的PC系统及其所有组件,包括:显示器 主板 显卡 散热器 电源 喧嚣之中:消费级展区我们从普通玩家和电脑装机者通常花费最多时间的地方开始:直接进入庞大的消费级展区。这里人头攒动,人们可以亲眼看到新硬件的实际运行效果。尤其是显示器领域,目前正发生着许多变化。技嘉(GIGABYTE)推出的Aorus Elite Fo27Q28G解决了OLED屏幕最令人头疼的问题之一。凭借所谓的“第四代Tandem光面OLED”技术和智能OLED保护功能,烧屏问题将不复存在。同时,这款4K面板还支持280Hz刷新率。如果您更喜欢更高分辨率: Aorus Elite FM275K16P 是首款将 5K 分辨率与 165 Hz 刷新率相结合的镜面 Mini...

《皇牌空战 Zero》首次作为PC版预购特典推出

万代南梦宫意外宣布,《皇牌空战 Zero:贝尔卡战争》将首次登陆PC平台。这一消息是在索尼“State of Play”活动中公布的,该游戏将作为《皇牌空战8:西夫之翼》豪华版的预购特典提供。该作计划于10月1日在PS5和Steam平台发售。PS2时代的经典之作《皇牌空战零》最初是为PlayStation 2开发的,迄今为止尚未推出高清重制版或PC版。因此,即将登陆PC平台的消息对该系列的粉丝来说无疑是一个令人惊喜的好消息。该重制版也可能单独发售。戏剧与神话的碰撞《皇牌空战零》以其独特的剧情与激烈的空战相结合而闻名,这些元素还融入了北欧神话和亚瑟王传说,为游戏增添了特殊的叙事深度。声望系统与重复游玩性《皇牌空战 Zero》的一个显著特色是声望系统。玩家可根据任务中的决策,扮演雇佣兵、士兵或骑士等不同角色。这些角色不仅会影响剧情走向,还会改变遭遇的敌人类型,从而大幅提升游戏的重复游玩价值。常见问题《皇牌空战8:西夫之翼》何时发售?《皇牌空战8:西夫之翼》计划于10月1日发售,PS5和PC(通过Steam)版本将同步推出。《皇牌空战 Zero》会单独在PC平台发售吗?虽然《皇牌空战 Zero》最初作为预购特典提供,但未来也有可能单独发售。《皇牌空战 Zero》有哪些特色?该游戏以其声望系统而闻名,该系统会影响玩家和敌人的行为,同时还融入了北欧神话和亚瑟王传说元素。

《行会:1410年的欧洲》——终于要开启抢先体验了吗?今年最受瞩目的中世纪游戏之一即将上线

这款全新的策略游戏将于7月开启抢先体验,玩家将在游戏中于一座城市中建立自己的商业帝国。《行会:欧洲1410》终于确定了发布日期!至少是抢先体验版。此前在游戏公告的采访中,开发者曾向我们保证,《行会》系列的新作不会采用抢先体验模式,而是会完整发布。尤其是考虑到《行会3》在抢先体验阶段耗费了数年之久,这一决定听起来确实是个好主意。现在终于要进入抢先体验阶段了,而且距离正式开启,已经没剩多少时间了!2026年7月16日正式开启!关于为何转为抢先体验,我们只能猜测,目前尚无官方声明。无论如何,这给了开发者更多时间来打磨《公会》,并借此收集玩家反馈。当然,粉丝们希望这次的抢先体验期不会像《公会3》那样漫长。游戏包含哪些内容?目前同样缺失的是官方公告,说明抢先体验版中哪些内容已开放,哪些尚未开放。因此我们预计,所有计划中的功能都可能在抢先体验阶段亮相,而“抢先体验”的状态主要意味着仍可能出现大量 Bug,且游戏平衡性可能还需要大量调整工作。但在内容方面,你们应该能体验到我们在预览版本中已经见过的所有内容。《行会》本质上是角色扮演与经济模拟的混合体。可以将其想象成《十字军之王》,只不过场景设定在中古时代的一座城市中。在那里,你将作为一名新市民选择一种职业,然后逐步晋升。具体如何实现,全凭你自己决定。你可以建立一个商业帝国,也可以通过担任公职来巩固自己的优势。你的家庭成员和继任者也将决定你对城市发展能产生多大的影响。你们可以通过这种方式影响四座真实存在的城市,这些城市均以历史原型为蓝本。目前已知的有纽伦堡、库滕贝格、弗罗茨瓦夫和格拉茨。在抢先体验期间,可能会有更多城市加入。职业方面也是如此,此前曾公布过十一类职业,包括铁匠、盗贼或旅店老板。目前尚不清楚这些职业是否都能在抢先体验阶段玩到。在我们上次体验的预览版本中,情况往往并非如此。此外,我们目前也不清楚游戏将在抢先体验阶段持续多久。