3.8 C
Berlin
星期三, 15 4 月, 2026

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

《战地6》第二季将于明日迎来终章——“猎手/猎物”带来新载具,《战地1》的“行动”模式回归

《战地6》第二季将再次迎来海量新内容,包括全新游戏模式、新载具等。《战地6》第二季即将迎来又一次大型内容更新。“猎人/猎物”作为继“极端措施”和“夜幕降临”之后的第三个,也是第二季的最后一个篇章。1.2.3.0补丁预计于4月14日上线,除新增内容外还将带来多项优化。其中包括限时“行动”模式“Augur”、一辆新载具、战利品通行证的额外奖励路径等内容。第二赛季的更新何时上线?明天4月14日欧洲中部夏令时上午11点起,即可下载1.2.3.0版本更新。同日下午2点起,相关内容将正式开放游玩。所有重大更新一览:战斗通行证新内容:您可以在“猎人/猎物”活动中解锁额外的装备和装饰道具。“预言者行动”将《战地1》风格的行动模式带回:北约旨在从“武装和平”组织手中夺回自己的卫星防御系统。广阔的战场横跨两张相连的地图。战斗始于“污染区”地图,随后扩展至“哈根塔尔基地”。一方队伍负责防守基地,另一方则需尝试攻占。该模式仅限时开放,并将重点强调团队协作。新载具:LTV是一款专为防御设计的北约四座载具,不仅作为小队的重生点,还设有补给站,可为队员补充弹药和生命值。新武器:“Ripper14”砍刀是一款近战武器,可让你近距离击杀敌人。你可通过“猎人/猎物”战斗通行证解锁该武器。REDSEC 大逃杀新增训练路径:“Hazmat Breacher”为大逃杀中的进攻型角色带来了新定位,该角色专注于烟雾弹,旨在将敌人从藏身处逼出,同时Hazmat Breacher会通过面罩保护自己免受负面效果的影响。其他改进现在,您在游戏中将获得额外的武器和载具经验值,这将使整体升级体验更加令人满意。您在多人游戏和大逃杀模式中获得的经验值将普遍增加。此外,挑战模式的进度也将更加令人满意,因为现在会将大逃杀模式中的比赛时长、击杀数和助攻数纳入考量。 大逃杀和“挑战赛”模式的战利品将进行调整并重新平衡,其中包括“突击补给包”和护甲部件。总体而言,这些模式将带来更连贯且更有成就感的体验。战斗中的即时反馈也将有所调整。例如,命中时的音效将更加清晰,伤害将更容易、更快速地被识别,且弹道的表现将更加一致。除颤器和 AJ-03 COAG 医疗笔将进行更新。配件、动画以及挑战的显示效果也将得到优化。菜单、战地通行证、本地化、商店等内容也进行了视觉调整,以提升清晰度和一致性。完整的暂定补丁说明可在 Steam 上查看。如果您想了解《战地6》近几个月来的最新动态,请点击上方链接查看相关文章,其中包含所有重要信息。尽管《战地6》大获成功,但并非全是好消息:发行商EA最近也裁减了大量开发人员。

Steam新游速递:精彩纷呈的巨作发布周即将到来

本周将有18款极具看点的新作与大家见面。下面为您介绍本周最值得期待的PC新游。本周 Steam 可谓是爆满,因为有多款绝对的精品大作正等待着大家。那么,让我们不要浪费时间,一起来看看未来几天有哪些令人兴奋的新作在等着大家吧!快速导航本周亮点:《风玫瑰》本周其他精彩 Steam 新作4月13日,星期一 4月14日,星期二 4月15日,星期三 4月16日,星期四 4月17日,星期五 本周亮点:《风玫瑰》(类型:生存 -开发商:Windrose Crew -发售:2026年4月14日 (Steam/抢先体验)随着 Windrose本周推出了一款极具野心的生存冒险游戏,它将经典的资源收集循环与残酷的《黑暗之魂》式战斗以及酷炫的海盗背景相结合。你将流落至一个程序生成的世界,需要采集材料、制作工具,并逐步建立自己的定居点。战斗系统对你的技巧要求颇高,因为盲目挥砍很快就会导致游戏结束。除此之外,你还将掌舵自己的船只,与敌对海盗派系展开海战,并在遭遇登船袭击时保卫战利品。若不想独自航行于七大洋,你还可以通过在线合作模式与好友并肩作战。即便在抢先体验阶段,《Windrose》也能让你乐在其中:三大生物群落、约30座岛屿以及90多个手工打造的地下城,将为你带来丰富的探索、谜题和战利品。预计主线剧情通关时长约为50至70小时。在周二正式发售前,您还可以在 Steam 上试玩演示版,甚至还能获得一份完整版的望远镜。我们的 Fabiano 已经试玩过了——并对此持谨慎乐观的态度。本周其他值得关注的...

《深红沙漠》:1.03补丁将让你的开放世界生活轻松许多

《深红沙漠》将变得更加便捷。此次1.03版本更新支持攀爬时的快速传送,并增强了你的随从能力。我们带来了德语版的补丁说明。近400万份销量,Steam平台玩家数量可观以及目前极佳的Steam评价都说明了一切:《深红沙漠》尽管起步有些坎坷,但已发展成为许多开放世界游戏爱好者当前最喜爱的游戏之一。自游戏发布以来,Pearl Abyss 展现出了惊人的响应速度,其更新频率之快,足以让许多其他工作室望尘莫及。随着最新1.03补丁的发布,作为其6月前路线图的一部分,开发者们现在正全力以赴,致力于打磨庞大的皮韦尔(Pywel)游戏世界的各个细节。其中,游戏流畅性和灵活性是重点,这使得生存和探索变得更加舒适。通过飞行传送实现无限移动最引人注目的改动涉及一个曾让许多《Crimson Desert》玩家咬牙切齿的系统:快速旅行。自1.03补丁起,你的角色不再需要静止不动,即可在世界地图上选择传送点。现在,即使你正骑在坐骑上、攀爬陡峭的岩壁,甚至是在自由落体中,该功能也能正常运作。即使在水中,你也无需先抵达岸边,即可缩短行程。为你的伙伴注入新力量此前,许多玩家都对次要角色达米安和翁卡的实用性有限提出了批评。虽然主线剧情始终与克利夫紧密相连,但在开放世界中与他的同伴们一同探索时,却常常让人感觉像是在倒退。Pearl Abyss 现已为这两位角色赋予了新技能,使他们与主角平起平坐。凭借“公理之力”与“风之面纱”的加持,他们已成为探索世界的得力助手。达米安的“盾牌投掷”和翁卡的“散射射击”如今能产生与克利夫“力量拳”相同的效果,这使得在角色间切换终于在游戏体验上变得有意义。不过克利夫本人也并非空手而归,他获得了“乌鸦天踢”这一新技能,为空战提供了新的机动选择。世界地图视野更开阔除了游戏机制的调整外,界面也进行了精简,并增加了更多有用的信息。谁没有遇到过这样的情况:在广阔的开放世界中站在一个洞穴前,不禁疑惑自己是否已经把那里清理得干干净净?《深红沙漠》1.03补丁为已探访过的洞穴和已开启的宝箱引入了不同的图标。在“深渊枢纽”挑战中,你也能立即看到这些挑战是否已被重置。顺便提一下:此前因使用英特尔 Arc 显卡而无法畅玩《深红沙漠》的玩家,如今终于可以松一口气了——游戏现已正式支持该显卡,并集成了包含帧生成技术的 Intel XeSS 3.0。《深红沙漠》1.03 版本更新日志详情:《深红沙漠》1.03 版本有哪些新内容?本次更新主要聚焦于舒适度提升和游戏体验优化。《Crimson Desert》已迎来重大更新,版本号升级至1.03。此处提供德语版的完整补丁说明。主要更新内容本次补丁新增了武器显示选项及最小字体大小设置。此外,每位角色都获得了新技能。同时,操控和界面也得到了优化:现在即使在骑马、坠落、游泳或攀爬墙壁等情况下,也可以使用传送功能。内容灰鬃营地已得到改进。(为避免剧透,相关内容的变更请参见下方的下拉菜单。)修复了在悬赏任务激活期间完成特定任务时出现的问题。(为避免剧透,相关内容的变更请参见下方的下拉菜单。) 快进功能已得到改进,现在在非宽屏格式的普通对话中也可使用。您可以在“其他 语言和游戏”下通过新选项“快进速度”来调整快进速度。深渊节点现在更容易被发现。部分深渊谜题的易用性已得到改善。现在更清晰地显示出某些技巧可通过“力量之拳”激活。改进了灯笼和“反射光线”技能,使其提供更多提示。优化了通往攀登顶点的路径。部分深渊的地形已得到优化。现在在悬赏任务激活期间也可使用银行,但无法存放金条,也无法更新投资金额。修复了在完成第9章(惩戒圣所)后若摧毁图腾,导致某些步骤的任务无法完成的问题。修复了若在任务激活前已获得相关任务物品,导致某些任务无法完成的问题。修复了完成特定任务后,派卢恩城的NPC冈特(装备)、哈里(铁匠)、布朗顿(马厩)和萝拉(服装)会被其他NPC取代的问题。1.01.00补丁为皮韦尔大陆(红沙漠及部分区域除外)的默认战斗音乐新增了三首曲目。 本次补丁还为加载界面新增了一首音乐。 操作与战斗现在,即使在骑乘坐骑、坠落、游泳或攀爬墙壁时,您也可以通过世界地图进行传送。...