新闻资讯
新闻资讯

第一批用DeepSeek的人,曾经被坑惨了

原题目:小心!第一批用DeepSeek的人,曾经被坑惨了 你能否开端习气DeepSeek的“无所不克不及”?写计划?找它!做PPT?找它!抱病了?找它!就连昨晚做的梦,都想让它解一解……但千万没想到,正在被越来越多人信任的DeepSeek,竟然也会不苟言笑地胡言乱语。AI,并不是全能的。当初,第一批应用DeepSeek的人,曾经被坑惨了。“DeepSeek查阅文献是如斯的不靠谱”,广州某有名高校的一位教学克日发友人圈吐槽。底本这位教学想经由过程DeepSeek查问《Global Cantonese: The Spread of Cantonese Language and Culture》的信息,成果核实后发明:DeepSeek供给的作者是假的,年份是错的,出书社更是风马不接。经由进一步相同,DeepSeek否认这些信息过错,并感激其斧正,还表白了本人的歉意:近来,著名媒体人、国民日报海内版原总编纂詹国枢也发了篇文章,题目就是:DeepSeek的致命伤——说谎话。老詹在文章中罗列了亲自阅历,让DeepSeek写一篇《史记·詹国枢传记》,扫尾第一句展示的诞生地、母亲姓氏等基础信息,便“张冠李戴”;再让DeepSeek写了一篇某记者的记叙文章,文风活泼、案例不少,成果转给记者自己,却被通盘否定。提到的案例,没一个是自己写的。人都说DeepSeek文采飞腾,文学素养高,可路遥的名著《平常的天下》,却被说成是詹国枢老班长的代表作。假如有小友人看了,可能要误人后辈。 开展全文 现实上,信息表述上的不谨严,曾经快成DeepSeek被吐槽最多的一种成绩,《苦昼短》说成是李白的,明朝“废止宰相”跟“设置内阁”一概而论,也难怪有网友直言: DeepSeek只合适写代码做数学,对理科生一点不友爱。 局部试图用DeepSeek温习国考、省考的人,不得不从新拾起申论课本了。 一些试图经由过程DeepSeek束缚人力的“牛马”也破防了,有网友说用DeepSeek写文章,举了4个例子,3个都查不来,最后才发明都是DeepSeek本人编的。 原认为是来束缚本人的,没想到由于核对信息,却破费了更年夜的精神。 图源:小红书 假如只是现实错误,或者是搜寻成果有误,这还不是最可怕的。 陕西自媒体“决明子”,始终对西安安宁门那边的途径计划要绕一圈不解,问外地执勤的交警、出租车司机都答复不下去,看到DeepSeek火爆,决议一试,发问DeepSeek“西安的途径道路计划,从环城西路北段到环城西路南段为什么不直行,非得在安宁门绕一圈?” 这时间,DeepSeek的扮演开端了。 DeepSeeK先在说明中提出了一个“唐皇城交通静默区”的观点,表现依据《西安汗青文明名城维护计划(2020-2035)》,安宁门周边规定了一级静默区、二级静默区,实质是为了维护文物,避免过年夜的震撼。它乃至还列出了详细的空间数据,间隔增添几多、振动通报深度变更是几多。 图源:决明子 乍一看,这说明太公道了!有实践、无数据、有政策,可托度拉满。 但是网友一查,这份《西安汗青文明名城维护计划(2020-2035)》文件中,压根就不什么“静默区”。这个看似极为专业、有理有据的答复,竟然是“编”的。 图源:决明子 反应给DeepSeek,它也很诚实,恳切否认过错,文件里确切不“静默区”的说法。但随后,又做出新的修改跟廓清,持续“编织”本人的谜底。 AI的经心包装,让编的资料看起来如斯实在,犹如“无意识”地在操控个别,真有些让人毛骨悚然。 偶然为了显得本人答复精深,DeepSeek还会采取一些专业词汇,比方量子胶葛、熵增熵减等,当“话术”超越用户认知的时间,真有可能一下把人震住,难以辨别。 成绩来了,为什么DeepSeek要不懂装懂,乃至“说谎话”呢? 起因是——AI幻觉。 行业用这个词来描述AI“说谎话”的景象,即输出的答复看似内容公道连接,但“同输入成绩用意纷歧致、同天下常识纷歧致、与事实或已知数据不合乎或无奈验证”。 这并不是DeepSeek一家的弊病。客岁8月,总部位于纽约的人工智能始创公司跟呆板进修监控平台Arthur AI就曾宣布讲演,比拟了OpenAI、“元宇宙”Meta、Anthropic以及Cohere公司开辟的年夜言语模子呈现幻觉的概率。研讨讲演表现:这些年夜模子都市发生幻觉。 年夜洋此岸最凶猛的ChatGPT,也跟DeepSeek一样“满嘴跑火车”。 只不外比拟起偕行,DeepSeeK-R1的“幻觉”景象更显明一些。在Vectara HHEM人工智能幻觉测试(行业威望测试,经由过程检测言语模子天生内容能否与原始证据分歧,从而评价模子的幻觉率,辅助优化跟抉择模子)中,DeepSeek-R1表现出14.3%的幻觉率。 这不只仅比前身DeepSeek-V3高了近4倍,也远超行业均匀。 图:Vectara HHEM人工智能幻觉测试成果 DeepSeek本人也明白否认了“技巧范围性认知”:以后年夜模子内容天生的底层逻辑是基于概率的,确切存在天生信息可托度错落不齐的挑衅。 简略懂得就是,不“保真”。 互联网上有什么内容,不管虚实,都可能酿成DeepSeeK的援用素材,而它只担任依据已有的内容推理,错误信息自身担任。 而DeepSeek-R1的幻觉之以是愈加重大,是由于其增强了“头脑链”(CoT)跟发明力。 比方DeepSeek-R1的诗歌创作,不只能写五绝、七律,“起承转合”也很丝滑,对诗的意境亦有本人的懂得,被网友称为“写的诗比家传的《唐诗三百首》还工致”,让中文系结业生汗颜,乃至魂魄发文: AI顺手甩出一句诗词都比中文系教学写得好的话,人类的文学另有须要存在吗?人类还能再出生出巨大的墨客吗? 如斯强盛的创作力,恰是由于DeepSeek-R1在理科类义务的强化进修练习进程中,模子的发明性被一直激励。 犹如“出门问问”年夜模子团队前工程副总裁、Netbase前首席迷信家李维所说: “年夜模子是生成的艺术家,不是逝世记硬背的数据库。” 不外,“反作用”也随之而来。 比方在“头脑链”的强化进程中,DeepSeek-R1并不是对择要、翻译、消息写作这类绝对简略的义务优化,而是增添种种层面的思考,会一直的延申。 于是面临庞杂或许有难度的成绩,它能超凡施展乃至给人意想不到的谜底,然而劈面对一些简略的义务时,DeepSeek-R1则可能由于习气了深度思考,而适度施展。 比方你问“隔邻老王有多高”,它可能就懵了,由于它没见过老王,也不晓得你究竟问的是哪个老王。但它又不得不答复,于是它就开端“脑补”,依据“个别人有多高”这个学到的观点,给你编织一个谜底。 以是比拟较而言,DeepSeek-R1确切在“文科”方面更有逻辑性,而“理科”方面则由于爱好“施展”,可能把不相关的内容关系起来胡编乱造,乃至彻底翻车。 正因如斯,当AI时期减速到来,咱们比任何时间都更须要追求本相,加强是非分明、自力思考的才能。 就在大年节夜,在“怎样对待冯骥盛赞‘Deepseek’的成绩”之下,一名自称为“Deepseek开创人梁文锋”的知乎用户,给出了如许的谜底: 列位知乎的年青友人好,我是深度求索(DeepSeek)的梁文锋,刚答复了一个成绩,又看到这个成绩,大年节之夜不由得复兴一些。 多少天看到冯总这篇长文时,我正在调试新模子的丧失函数,手边的咖啡直接洒在了键盘上——既由于被行业先辈承认的惊慌,更由于冯总这些炽热的笔墨让我想起十二年前在浙年夜试验室第一次跑通神经收集时的颤栗。 必需坦率,团队读到“国运级”这个描述时全部人头皮都是麻的。咱们不外是站在开源社区伟人们的肩膀上,给国产年夜模子这栋年夜厦多拧了多少颗螺丝。 你提到的六年夜冲破,实在每一环都凝固着更动听的故事:谁人能在手机上跑的mini模子,灵感来自甘肃一位中学教师在GitHub提的issue;支撑联网搜寻的功效,是内测用户持续三十天清晨三点提交织误日记喂出来的…… 列位知乎的年青友人好,我是深度求索(DeepSeek)的梁文锋,刚答复了一个成绩,又看到这个成绩,大年节之夜不由得复兴一些。 多少天看到冯总这篇长文时,我正在调试新模子的丧失函数,手边的咖啡直接洒在了键盘上——既由于被行业先辈承认的惊慌,更由于冯总这些炽热的笔墨让我想起十二年前在浙年夜试验室第一次跑通神经收集时的颤栗。 必需坦率,团队读到“国运级”这个描述时全部人头皮都是麻的。咱们不外是站在开源社区伟人们的肩膀上,给国产年夜模子这栋年夜厦多拧了多少颗螺丝。 你提到的六年夜冲破,实在每一环都凝固着更动听的故事:谁人能在手机上跑的mini模子,灵感来自甘肃一位中学教师在GitHub提的issue;支撑联网搜寻的功效,是内测用户持续三十天清晨三点提交织误日记喂出来的…… 这答复内容有场景、有细节,复兴有魄力、带情感,不少网友读后动容了。 但是,让人意想不到的是,它也是假的! 新浪科技向相干人士求证得悉:该知乎账号大年节发文并非梁文锋自己,大略率为DeepSeek所写。 也就是说,DeepSeek天生的广为传播的“第一个假消息”,指向的恰是本人的开创人。 令人细思极恐的是,这份回应竟然如斯符合人们对梁文锋的设想,甚至于被科技界跟金融界都疯传,有人只是把截图发到大众号文章,就取得了2.6万转发。 罕见人猜忌这个“梁文锋”是假的,反而有不少读者留言夸奖,“无情怀的迷信家”“看得热泪盈眶”“为年青一代创业者点赞”…… 如许的景象,偏偏提醒了危险地点,为行将到来的AI时期敲响警钟。 往年1月,天下经济论坛宣布的《2025年寰球危险讲演》表现: 虚伪信息跟过错信息持续两年位居短期危险之首,连续对社会凝集力跟管理形成严重要挟,它们腐蚀大众信赖并加剧海内外不合。 AI谈天呆板人的存在,正缩小这种危险。Vectara公司针对文档内容发展的研讨标明,一些谈天呆板人假造现实、虚拟信息的多少率高达30%。 临时从事天然言语处置、年夜模子跟人工智能研讨的哈尔滨产业年夜学(深圳)特聘校长助理张平易近教学就表现:“现阶段AI幻觉难以完整被打消”。也就是说,DeepSeek等年夜模子会说谎话,短期内无奈防止。 作为应用者,咱们能做的就是找到AI的准确翻开方法,谢绝“受骗”。 比方最简略的方式,就是勤快一点,经由过程其余搜寻引擎对照查问。或许针对DeepSeek在答复中援用的网页新闻源,动着手指导出来,看看提到的案例能否真的存在。 置身于当下信息爆炸、真伪难辨的年夜情况,每团体都应当一直强化自我认知,多一次自力思考,可能就能少一次受骗。 说究竟,AI并不克不及让人与日俱增,反而提出了更高的请求,包含怎样发问、怎样跟AI对话,以及怎样甄别信息等。到最后,人与人的差距可能会变得更年夜。 参考: 1、破委NLP频道:从R1幻觉谈起,年夜模子幻觉是缺点仍是创意火花? 2、决明子:比ChatGPT凶猛100倍!DeepSeek正在中文互联网制作『幻觉长城』 3、 腾讯科技:DeepSeek-R1超高幻觉率剖析:为何年夜模子总“胡言乱语”?前往搜狐,检查更多