點(diǎn)擊右上角微信好友
朋友圈
請(qǐng)使用瀏覽器分享功能進(jìn)行分享
9月18日消息,據(jù)媒體報(bào)道,由DeepSeek團(tuán)隊(duì)共同完成、梁文鋒擔(dān)任通訊作者的DeepSeek-R1推理模型研究論文,近日登上國際頂級(jí)學(xué)術(shù)期刊《自然》(Nature)的封面,引發(fā)廣泛關(guān)注。
與今年1月發(fā)布的初版論文相比,本次正式發(fā)表的版本披露了更多模型訓(xùn)練的技術(shù)細(xì)節(jié),并對(duì)發(fā)布初期外界有關(guān)“蒸餾”方法的質(zhì)疑作出了正面回應(yīng)。
DeepSeek-R1也因此成為全球首個(gè)經(jīng)過嚴(yán)格同行評(píng)審的主流大語言模型?!蹲匀弧吩谠u(píng)論中指出,當(dāng)前絕大多數(shù)主流大模型尚未經(jīng)過獨(dú)立的同行評(píng)審,而這一重要空白“終于被DeepSeek打破”。
公開資料顯示,DeepSeek創(chuàng)始人梁文鋒畢業(yè)于浙江大學(xué)電子信息與通信工程專業(yè),獲本科及碩士學(xué)位。他于2023年7月創(chuàng)立DeepSeek,公司在2024年5月推出DeepSeek-V2,同年12月27日發(fā)布DeepSeek-V3。
2025年1月20日,DeepSeek正式發(fā)布DeepSeek-R1模型。該模型猶如一顆投入平靜湖面的巨石,在國際AI界激起千層浪,不僅顛覆了“AI研發(fā)必須高投入、長周期”的傳統(tǒng)認(rèn)知,也打破了美國在AI領(lǐng)域的話語壟斷。