阿里云宣布通義千問開源,用戶可以免費商用

1.阿里云開源通義千問70億參數模型
阿里大模型往開源道路上前進。
近日,阿里云開源通義千問70億參數模型,包括通用模型Qwen-7B和對話模型Qwen-7B-Chat。
具體來看,Qwen-7B是支持中、英等多種語言的基座模型,Qwen-7B-Chat是基于基座模型的中英文對話模型,已實現與人類認知對齊。
據介紹,這兩款開源模型均已上線魔搭社區,開源、免費、可商用。用戶既可從魔搭社區直接下載模型,也可通過阿里云靈積平臺訪問和調用Qwen-7B和Qwen-7B-Chat,阿里云為用戶提供包括模型訓練、推理、部署、精調等在內的服務。
此次上線兩款開源模型,讓阿里云成為了國內首個加入大模型開源行列的大型科技企業。
開源,簡單來說,就是指開放的源代碼,過去通常指公開某款軟件項目的源代碼。人工智能三要素包括算法、算力和數據。從人工智能方面看,大語言模型的開源,其源碼在算法上。算法的核心部分主要包括有模型結構和訓練方法,這兩部分都有對應的源碼。
開源模型,也就是開源訓練好的模型參數,這些模型是通過大量數據和算力訓練出來的。站在企業的角度,阿里云上線這兩款開源模型,能夠幫助其他大中小企業簡化模型訓練和部署,極大降低了企業訓練模型的成本。
站在阿里云角度,開源模型能夠讓阿里云建立起一個繁榮的開源社區生態,助力阿里云開源大模型的發展。
事實上,阿里云已經在構建開源模型社區上有所部署。魔塔社區就是去年推出的AI模型社區,魔搭社區成立初衷就是通過開源開放、共建社區生態的方式,讓AI開發使用更簡單。經過半年左右的發展,魔搭成為了國內規模最大AI模型開源社區。
(圖源:阿里云開發社區)
阿里云表示,開源大模型可以幫助用戶簡化模型訓練和部署的過程,用戶不必從頭訓練模型,只需下載預訓練好的模型并進行微調,就可快速構建高質量的模型。
今年,在世界人工智能大會上,阿里云CTO周靖人透露,阿里云魔搭社區已聚集180萬AI開發者和由20多家頂尖人工智能機構貢獻的900多個優質AI模型,將努力把魔搭社區培育成中國最大的“大模型自由市場”。
開源大模型平臺的不斷完善以及開源生態的日益繁榮發展,將助推中國大模型的技術進步與應用落地。
2.阿里云首個加入大模型開源行列
今年4月,阿里云就推出了大模型通義千問。在短短幾個月的時間,阿里云發布了通義系列大模型,例如,通義聽悟、通義萬相等語言、視覺、多模態的AIGC工具。
通義千問,是阿里云推出的一個超大規模的語言模型,功能包括多輪對話、文案創作、邏輯推理、多模態理解、多語言支持,能夠跟人類進行多輪的交互,也融入了多模態的知識理解,且有文案創作能力,能夠續寫小說,編寫郵件等。
(圖源:通義千問官網)
那么,阿里云成為國內首個加入大模型開源行列的大型科技企業意味著什么呢?
通義千問成為第一個科技大廠的開源大模型,或許意味著國內已經白熱化階段的“百模大戰”,進入了一個新階段。
我們需要清楚的是,大模型有開源模型和閉源模型之分。也就是說,不同企業會結合自己的戰略需要來選擇開源或者不開源。例如,盤古大模型不采用任何開源技術,華為云相關負責人表示,由于華為云盤古大模型定位于賦能千行百業,這里面必將聚集無數行業大數據(涉及行業機密等),因此未來盤古大模型不會開源。
不過,總的趨勢來看,大模型的開源將會成為行業主要發展趨勢,各大模型廠商需要通過開源迅速搶占市場。當技術難以成為拉開競爭對手的護城河,繁榮的開源生態就成為了各大企業關注的焦點。
在今年7月的世界人工智能大會上,周靖人宣稱,阿里云將把促進中國大模型生態的繁榮作為自己的首要目標,向大模型創業公司提供全方位的服務,包括最強大的智能算力和開發工具,并在資金和商業化探索方面提供充分支持。
(圖源:封面新聞)
2022年,阿里云在國內首倡MaaS(ModelasaService,模型即服務)理念,搭建了一套以AI模型為核心的云計算技術和服務架構,向大模型初創企業和開發者開放,提供包括模型訓練、推理、部署、精調、測評、產品化落地等在內的全方位服務。
目前,阿里云已形成模型即服務(MaaS)、平臺即服務(PaaS)、基礎設施即服務(IaaS)三層架構。
此次開源的兩款模型,大幅降低了研究者使用大模型的門檻。與此同時,開源打通了阿里模型之間的鏈路。例如,AI模型社區魔搭能夠通過靈積實現服務化。
阿里云的靈積模型服務平臺,提供了一系列自動化的模型上云工具鏈路,支持模型的自主接入,所有接入靈積平臺的模型都能自動獲取平臺的強大服務能力。
總的來看,在行業開源大模型潮流趨勢下,通義千問的開源勢在必行。
3.開源大模型紛紛免費可商用
開源的一個重要體現就是免費、可商用,阿里云的大模型并不是第一個免費、可商用的大模型。
今年7月,智譜AI和清華KEG發布公告,稱為了更好地支持國產大模型開源生態,ChatGLM-6B和ChatGLM2-6B權重對學術研究完全開放,并且在完成企業登記獲得授權后,允許免費商業使用。公告提供了企業登記入口,需要的信息只有姓名、國家、郵箱、機構,用途和要申請的模型(ChatGLM-6B或ChatGLM2-6B)。
百川智能的Baichuan-13B模型在發布的同時也開源允許免費商用。據官方介紹,Baichuan-13B包含130億參數的開源可商用的大規模語言模型,在中英文 Benchmark上均取得同尺寸模型中最好的效果。
Meta和微軟合作推出下一代開源大語言模型 Llama 2,并宣布免費提供給研究和商業使用,開發者們可以直接在Llama 2官方網站下載該模型。
Meta認為,開放的方法是當今人工智能模型開發的正確方法,特別是在技術快速發展的生成領域。通過公開提供人工智能模型,它們可以使每個人受益。為企業、初創企業、企業家和研究人員提供其開發的工具。
今年6月,人工智能研究機構BAAI開源了一個全新的國產開源大語言模型Aquila系列模型。該模型基于大量的中英文數據集訓練,是一個完全開源可商用國產大語言模型。
顯然,開源模型在競爭中快速發展,越來越多企業的開源模型能力越來越成熟。不過,開源模型的使用范圍也存在著局限性。
正如7月23日,在極客公園主辦的AGI Playground大會上,BentoML亞太區負責人劉聰表示,開源的模型能力變得越來越好,但還是限于私有化部署以及商業公司內部的一些用例。普適化的用例可能還是依賴 OpenAI 這種大模型的能力。
RWKV、Syrius炬星聯合創始人羅璇認為,其實現在很多商業公司也開始開源,但實際上是把一些效果比較差的模型開源,真正好的模型并不會開源,而且數據不會開源,數據是大家要關注的問題。
“現在大家開源社區用的數據都是ChatGPT對話的數據,這個是很大的問題。我認為開源社區應該更關注數據的建立,也希望所有的開源社區一起做這個事情。”
綜合來看,開源大模型的免費可商用仍然需要一番探索,隨著未來生態多元化的豐富,開源模型會繼續呈現出更加繁榮的景象。
