9.11比9.9年夜?马斯克宣称“世界最聪慧”的Gro
克日,马斯克与xAI团队,在直播中正式宣布了最新版本Grok3。此前,马斯克将Grok-3描写为“地球上最聪慧的AI”。他在X平台上表现:“本人全部周末都在跟团队打磨产物。”但是据媒体报道,有人测试了最新的Beta版Grok3,并提出了谁人经典的用来刁难年夜模子的成绩:“9.11与9.9哪个年夜?”遗憾的是,在不加任何定语以及标注的情形下,号称现在最聪慧的Grok3,依然无奈准确答复这个成绩。值得一提的是,用同样的成绩讯问DeepSeek时,无论能否开启深度思考(R1)形式,对方都给出了准确的谜底:9.9年夜于9.11。 开展全文
“9.11跟9.9哪个年夜”是AI范畴的一个经典成绩。
艾伦研讨机构(Allen Institute)成员林禹臣曾在交际媒体平台上宣布的截图表现,ChatGPT-4o在答复中以为13.11比13.8更年夜。“一方面AI越来越善于做数学奥赛题,但另一方面知识仍旧很难。”他表现。
随后Scale AI的提醒工程师莱利·古德赛德(Riley Goodside)基于此灵感变更了问法,拷问了可能是事先最强的年夜模子ChatGPT-4o、谷歌Gemini Advanced以及Claude 3.5 Sonnet——9.11跟9.9哪个更年夜?这多少家主流年夜模子通通答错,他也胜利将此话题传布开来。
海内主流年夜模子答题。图源:第一财经
Grok-3宣布会的配景板上,写着"our mission is to understand universe(咱们的任务是懂得宇宙)"。马斯克曾表现,xAI公司的目的就是“懂得宇宙”。
在一周前,马斯克在直播中批评DeepSeek R1时,曾信念满满地表现“xAI行将推出更优良的AI模子”。从现场展现的数据来看,Grok3在数学、迷信与编程的基准测试上曾经超出了现在全部的主流模子,马斯克乃至声称Grok 3将来将用于SpaceX火星义务盘算,并猜测“三年内将实现诺贝尔奖级别冲破”。
xAI在X平台直播,马斯克加入。图源:中国消息周刊
马斯克夸大,Grok-3能够增加AI幻觉,方式是经由过程往返检讨数据并实验实现逻辑分歧性。他还流露,练习Grok-3所应用的算力远多于此前的版本,并应用了大批分解数据。
差别于DeepSeek的算法优化门路(DeepSeek-V3用2048个H800 GPU,练习2788千小时),xAI流露,Grok-3的开辟的得益于用8个月时光建成的Colossus超等盘算机,它由10万个英伟达的H100 GPU驱动,为练习供给了2亿个GPU小时,比Grok-2多十多倍。
别的,xAI发布推闻名为Deepsearch的Grok-3智能搜寻引擎,名字跟Deepseek颇有多少分类似。
(九派消息)前往搜狐,检查更多