國(guó)內(nèi)企業(yè):需進(jìn)一步增強(qiáng)軟件及系統(tǒng)能力
雖然ChatGPT還沒(méi)有進(jìn)入盈利階段,但英偉達(dá)已經(jīng)成為第一波吃到紅利的企業(yè)。為處于下行周期的半導(dǎo)體產(chǎn)業(yè)增添了一絲亮色。在北京時(shí)間2月23日凌晨的財(cái)報(bào)發(fā)布中,英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛表示,從初創(chuàng)公司到大型企業(yè),對(duì)于生成式AI的多功能性與能力的興趣越來(lái)越濃厚。英偉達(dá)將幫助客戶從生成式AI 和大型語(yǔ)言模型技術(shù)的突破中獲取優(yōu)勢(shì)。
英偉達(dá)在AI芯片的先發(fā)優(yōu)勢(shì)和占比優(yōu)勢(shì),固然有硬件性能的原因,但更關(guān)鍵的是軟件生態(tài)的加持。在21世紀(jì)初,GPU的并行計(jì)算能力引起了學(xué)術(shù)界和產(chǎn)業(yè)界的關(guān)注。但是,開發(fā)者想要調(diào)用英偉達(dá)GPU的計(jì)算能力進(jìn)行圖形處理以外的任務(wù),必須編寫大量的底層語(yǔ)言代碼,這對(duì)于習(xí)慣高級(jí)語(yǔ)言的程序員極其不便。2006年,英偉達(dá)推出CUDA平臺(tái),支持開發(fā)者用熟悉的高級(jí)程序語(yǔ)言進(jìn)行編程,靈活調(diào)用GPU的算力。自此,GPU的使用范圍不再局限于顯卡,而是擴(kuò)展到所有適合并行計(jì)算的領(lǐng)域。GPU與CUDA組成的軟硬件系統(tǒng),形成了英偉達(dá)的產(chǎn)品壁壘。
近年來(lái),國(guó)內(nèi)AI芯片企業(yè)在架構(gòu)創(chuàng)新、算力性能、平臺(tái)方案等領(lǐng)域涌現(xiàn)出一系列成果,但仍然需要在軟件、系統(tǒng)和生態(tài)層面進(jìn)一步向國(guó)際領(lǐng)先企業(yè)看齊。趙立東表示,針對(duì)大模型對(duì)于AI芯片的需求,芯片廠商一方面通過(guò)拆解大模型的系統(tǒng)級(jí)需求,快速迭代下一代芯片,從底層提升性能和支持效率。另一方面,要基于既有的芯片打造系統(tǒng)級(jí)方案,通過(guò)軟件升級(jí)解決大模型加速遇到的內(nèi)存容量小、通信占比高等核心痛點(diǎn)問(wèn)題。
“要對(duì)標(biāo)國(guó)際領(lǐng)先的AI芯片廠商,需要在三個(gè)層面開發(fā)優(yōu)化:一是芯片升級(jí),在算力、內(nèi)存、微架構(gòu)等層面針對(duì)大模型計(jì)算做優(yōu)化;二是軟件升級(jí),從傳統(tǒng)的單卡以及單機(jī)多卡為主的支持能力拓展至萬(wàn)卡級(jí)別大集群支持,有效提供面向大模型支持的分布式計(jì)算、混合并行、內(nèi)存優(yōu)化等整體軟件方案;三是系統(tǒng)方案,以AI芯片為核心,結(jié)合計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)打造深度優(yōu)化的系統(tǒng)級(jí)方案,面向大模型提供極致的性能和成本優(yōu)勢(shì)?!?/p>