字節跳動布局大模型 分別在語言和圖像兩種模態上發力

2月23日消息,據36氪報道,字節跳動在大模型上已有所布局,分別在語言和圖像兩種模態上發力。字節跳動相關技術負責人對此回應:技術中臺在這些領域有探索,還很初期,不成熟。
一名知情人士透露,語言大模型團隊由字節搜索部門牽頭,目前團隊規模在十數人左右。圖片大模型團隊則由產品研發與工程架構部下屬的智能創作團隊牽頭。
另有知情人士表示,字節跳動語言大模型團隊在今年組建,探索方向主要為與搜索、廣告等下游業務的結合,“搜索業務部門、AI Lab和AML(應用機器學習)團隊都調了一部分人支援語言大模型,團隊目前的預期是在今年年中推出大模型”。
據悉,語言大模型團隊負責人與圖像大模型團隊負責人的間接和直接匯報對象,均為Tik Tok產品技術負責人朱文佳。加入字節跳動前,朱文佳曾在百度擔任搜索部主任架構師。朱文佳于2015年進入頭條,被稱為“頭條里算法技術的Top 3人選”。四年后,他成為今日頭條CEO。2021年2月,他又調任成為Tik Tok產品技術負責人,向Tik Tok CEO周受資匯報。
朱文佳,圖源:今日頭條官微
此外,一名AI資深從業者透露,字節并不缺GPU。字節旗下的企業技術服務平臺火山引擎,在2021年正式進軍基礎云市場(IaaS層),為大模型所需的算力奠定了基礎。
上述從業者表示:“從訓練大模型的角度而言,工程團隊和云服務團隊一樣關鍵,在兩者上均無短板的字節跳動具有一定優勢。”
對AI領域的布局,字節的反應速度一直較快。據了解,目前AIGC(AI生成內容)技術也已結合到頭條的內容創作以及抖音的圖文內容生成中。比如2021年,抖音上線的可以把人臉卡通畫的“漫畫臉”特效就小有出圈。
但ChatGPT的成功模式已證明,大模型的訓練是入場費高昂的長跑。另有知情人士表示,在ChatGPT公開前,字節內部對大模型的投入依然較為猶疑,“對于字節的產品矩陣來說,目前的算法已經夠用”。
