如果讓你說(shuō)出今年人工智能領(lǐng)域最轟動(dòng)的一件事情,那大部分人的答案應(yīng)該是DeepSeek的橫空出世。今年2月初,DeepSeek在140個(gè)國(guó)家和地區(qū)的應(yīng)用市場(chǎng)下載排行榜同時(shí)登頂,并以開(kāi)源策略充分展現(xiàn)其技術(shù)自信。
開(kāi)源大模型是指由研究機(jī)構(gòu)或公司開(kāi)發(fā)并公開(kāi)發(fā)布的大規(guī)模預(yù)訓(xùn)練模型,其源代碼、參數(shù)權(quán)重甚至是訓(xùn)練數(shù)據(jù)(或數(shù)據(jù)生成方法)都開(kāi)放透明,任何人都可以訪問(wèn)、使用、修改和分發(fā)。
“DeepSeek是一款完完全全的開(kāi)源模型,將各個(gè)環(huán)節(jié)包括數(shù)據(jù)、代碼、權(quán)重、推理鏈的運(yùn)行思路、工程構(gòu)建方法都開(kāi)放出來(lái),讓更多人愿意參與進(jìn)去?!辟惖涎芯吭盒跑浰浖a(chǎn)業(yè)研究室副主任黃文鴻解釋,就好比建造一所房子,真正的開(kāi)源不僅公開(kāi)圖紙、材料、房屋結(jié)構(gòu),還會(huì)清晰地告訴你,每一步應(yīng)該建什么,有了這些信息你就可以1比1還原房子。由此可見(jiàn),DeepSeek開(kāi)放程度之高前所未有,這也是其一經(jīng)發(fā)布就產(chǎn)生巨大影響的原因之一。
降低生態(tài)構(gòu)建成本
DeepSeek對(duì)于我國(guó)人工智能產(chǎn)業(yè)發(fā)展最大的意義在于,其構(gòu)建了基于自主研發(fā)基座大模型的開(kāi)發(fā)生態(tài),從軟硬件的適配到應(yīng)用推廣甚至產(chǎn)品宣傳,都是全球廠商和開(kāi)發(fā)者共同完成的,極大降低了生態(tài)建設(shè)成本。例如,微軟、英偉達(dá)、亞馬遜、英特爾、AMD等全球科技巨頭相繼宣布上線了DeepSeek開(kāi)源模型推理服務(wù),國(guó)內(nèi)廠商諸如騰訊云、阿里云均支持DeepSeek的一鍵部署和調(diào)用。
“這就像安卓操作系統(tǒng)是開(kāi)源軟件一樣,因?yàn)殚_(kāi)源具有良好的適配性,手機(jī)、芯片、智能家居等各類廠商紛紛接入,讓安卓成為移動(dòng)互聯(lián)網(wǎng)時(shí)代能夠與蘋(píng)果IOS系統(tǒng)并駕齊驅(qū)的通用技術(shù)底座?!秉S文鴻告訴記者,互聯(lián)網(wǎng)企業(yè)、車(chē)企、三大運(yùn)營(yíng)商等紛紛接入DeepSeek,后續(xù)會(huì)讓很多具體應(yīng)用部署在DeepSeek基座模型上,將迅速提高其用戶數(shù)量和市占率。
除DeepSeek以外,我國(guó)還有不少開(kāi)源模型在業(yè)界引起廣泛關(guān)注。就在DeepSeek-R1發(fā)布前,上海AI創(chuàng)業(yè)公司MiniMax發(fā)布了其開(kāi)源模型MiniMax-01,首次采用線性注意力機(jī)制,實(shí)現(xiàn)了技術(shù)突破;阿里巴巴最新開(kāi)源的通義千問(wèn)QwQ-32B推理模型,在數(shù)學(xué)、代碼及通用能力的多項(xiàng)權(quán)威評(píng)測(cè)集中表現(xiàn)良好,穩(wěn)居全球最大AI開(kāi)源社區(qū)Hugging Face趨勢(shì)榜榜首,成為當(dāng)下最受歡迎的開(kāi)源大模型之一。
“這些都彰顯了開(kāi)源對(duì)技術(shù)生態(tài)的推動(dòng)作用,吸引了業(yè)內(nèi)各方支持,形成良好的技術(shù)分享氛圍?!秉S文鴻認(rèn)為,信息技術(shù)領(lǐng)域具有強(qiáng)者恒強(qiáng)的發(fā)展規(guī)律,我國(guó)在開(kāi)源模型上是有先發(fā)優(yōu)勢(shì)的,必須進(jìn)一步筑牢技術(shù)“護(hù)城河”。但目前各行各業(yè)真正懂開(kāi)源模型的人才并不多,基于開(kāi)源大模型的下游企業(yè),以及做工程優(yōu)化、模型調(diào)優(yōu)的研發(fā)人員相對(duì)較少,高校應(yīng)該培養(yǎng)更多相關(guān)人才,共同促成“創(chuàng)新—共享—再創(chuàng)新”,助力產(chǎn)業(yè)生態(tài)更加完備。
阿里云高級(jí)總監(jiān)朱迅垚認(rèn)為,開(kāi)源理念在產(chǎn)業(yè)界還沒(méi)有形成廣泛共識(shí),但DeepSeek和通義千問(wèn)的成功會(huì)讓大家逐步認(rèn)識(shí)到,開(kāi)源模型將成為推動(dòng)我國(guó)人工智能發(fā)展最強(qiáng)勁的引擎。下一步,建議從國(guó)家到地方再到企業(yè),以更加積極的態(tài)度擁抱開(kāi)源,同時(shí)在布局智能算力、構(gòu)建高質(zhì)量數(shù)據(jù)集、上云用云等方面加快創(chuàng)新步伐,緊跟世界先進(jìn)水平。
推動(dòng)應(yīng)用落地
DeepSeek發(fā)布以來(lái),各行各業(yè)都在探索將其融入自身業(yè)務(wù)場(chǎng)景?!伴_(kāi)源模型憑借其低成本、高性能、高開(kāi)放度的技術(shù)優(yōu)勢(shì),加速了人工智能在行業(yè)的普及速度?!秉S文鴻說(shuō)。
今年2月,恒生電子大模型應(yīng)用全面接入DeepSeek,在金融投研、合規(guī)、運(yùn)營(yíng)、投行等業(yè)務(wù)場(chǎng)景中取得較好效果。例如,在投行業(yè)務(wù)中,利用DeepSeek-R1理解能力,可自動(dòng)解析招股書(shū)、盡調(diào)報(bào)告等復(fù)雜文檔,實(shí)現(xiàn)財(cái)務(wù)數(shù)據(jù)校驗(yàn)、合規(guī)風(fēng)險(xiǎn)提示的秒級(jí)響應(yīng)。
通義千問(wèn)開(kāi)源模型Qwen系列更是憑借其多模態(tài)、全尺寸的技術(shù)能力,以及由數(shù)量龐大的開(kāi)發(fā)者和中小企業(yè)匯聚起的良好生態(tài),加快賦能千行百業(yè)。截至目前,阿里已開(kāi)源200多款模型,包括文本生成模型、視覺(jué)理解/生成模型、語(yǔ)音理解/生成模型、文生圖及視頻模型等多模態(tài),覆蓋從0.5B到110B參數(shù)的各類尺寸。
去年4月,中國(guó)科學(xué)院國(guó)家天文臺(tái)人工智能工作組發(fā)布了基于Qwen打造的新一代天文大模型“星語(yǔ)3.0”。目前已成功接入國(guó)家天文臺(tái)興隆觀測(cè)站望遠(yuǎn)鏡陣列Mini“司天”,可實(shí)現(xiàn)自主控制望遠(yuǎn)鏡進(jìn)行觀測(cè)、分析觀測(cè)結(jié)果,智能地給出下一步觀測(cè)建議,這是大模型在天文觀測(cè)領(lǐng)域的首次應(yīng)用。“從預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)到合成靶向藥物,再到發(fā)現(xiàn)新的病毒種類,大模型與科研相結(jié)合帶來(lái)了許多突破性成果。”朱迅垚說(shuō)。
DeepSeek也好,通義千問(wèn)也罷,我國(guó)開(kāi)源模型正以其寬松的開(kāi)發(fā)許可和低成本的訓(xùn)練方式,提升人工智能在行業(yè)的應(yīng)用廣度。
商業(yè)模式仍需明晰
以ChatGPT為代表的閉源模型,其商業(yè)模式被稱為“token(令牌)經(jīng)濟(jì)”,即通過(guò)向用戶提供API服務(wù),基于token用量計(jì)價(jià),然后來(lái)賺取利潤(rùn)。那么,開(kāi)源模型又是如何盈利的?
對(duì)此,黃文鴻向記者分享了幾個(gè)案例。Meta公司推出的Llama大模型通過(guò)開(kāi)源可以吸引更多企業(yè)和開(kāi)發(fā)者加入其生態(tài),為后續(xù)廣告收入創(chuàng)造機(jī)會(huì)。
市場(chǎng)上還出現(xiàn)了開(kāi)源閉源并行的模型產(chǎn)品。具體而言,首先開(kāi)放出來(lái)相對(duì)基礎(chǔ)的能力,培養(yǎng)用戶使用習(xí)慣,而更高性能的模型則需付費(fèi)使用。還有的開(kāi)源模型會(huì)與云服務(wù)綁定售賣(mài),相當(dāng)于模型是免費(fèi)的,收取的只是算力費(fèi)用。“這種模式就好比你想用IOS系統(tǒng)就必須配備蘋(píng)果手機(jī)。再有更相似的案例是,谷歌通過(guò)安卓系統(tǒng)吸引用戶,再通過(guò)售賣(mài)谷歌郵箱、谷歌地圖等增值服務(wù)收取費(fèi)用?!秉S文鴻補(bǔ)充道。
在朱迅垚看來(lái),很多做開(kāi)源模型的企業(yè)具有濃厚的技術(shù)理想主義色彩,他們的初衷未必完全是奔著商業(yè)化去的?!巴x千問(wèn)大模型在全球擁有超過(guò)10萬(wàn)個(gè)衍生模型和上億次下載量,這些都是免費(fèi)提供給用戶的。但正因?yàn)殚_(kāi)源,大量開(kāi)發(fā)者被吸引過(guò)來(lái),阿里云的模型服務(wù)和配套算力服務(wù)得到更多開(kāi)發(fā)者青睞,開(kāi)發(fā)者跟廠商形成一個(gè)‘開(kāi)源—應(yīng)用—反饋’的良性循環(huán)?!?/p>
開(kāi)源模型的發(fā)展仍處于初期階段,如何形成健康成熟的商業(yè)模式業(yè)界仍在探索中?!捌髽I(yè)做開(kāi)源模型肯定是想盈利的,要摸索出一條正向循環(huán)發(fā)展路徑,在技術(shù)普惠和商業(yè)變現(xiàn)間尋找到平衡點(diǎn),讓產(chǎn)業(yè)鏈上各個(gè)環(huán)節(jié)的參與者都能受益,確保開(kāi)源模式持續(xù)穩(wěn)定運(yùn)轉(zhuǎn)下去?!秉S文鴻建議。(李芃達(dá))
(責(zé)任編輯:蔡文斌)