
架構(gòu)重構(gòu),得一微閃存大模型的創(chuàng)新路徑
在人工智能的廣闊領(lǐng)域中,得一微從蘋(píng)果公司的一篇論文《LLM in a flash: Efficient Large Language Model Inference with Limited Memory》(中文譯名《閃存中的大模型:有限內(nèi)存的高效大模型推理》)中汲取了寶貴靈感,積極探索存力芯片如何更好地服務(wù)大型語(yǔ)言模型(LLM)。這篇論文為大模型在有限內(nèi)存環(huán)境下實(shí)現(xiàn)高效推理提供了全新的視角和思路,而得一微敏銳地捕捉到了這一理念的巨大潛力,堅(jiān)信閃存技術(shù)與大模型的深度融合將開(kāi)辟出前所未有的創(chuàng)新路徑,為人工智能的發(fā)展注入新的活力。
與此同時(shí),閃迪的HBF高帶寬閃存開(kāi)發(fā)成果為整個(gè)業(yè)界注入了新活力。HBF高帶寬閃存憑借其卓越的性能和創(chuàng)新架構(gòu),顯著提升了數(shù)據(jù)傳輸速度和存儲(chǔ)效率,為大模型的穩(wěn)定運(yùn)行提供了更為堅(jiān)實(shí)的硬件基礎(chǔ)。這一技術(shù)突破不僅精準(zhǔn)滿足了大模型對(duì)海量數(shù)據(jù)存儲(chǔ)和快速讀寫(xiě)的嚴(yán)苛需求,更為存力芯片與大模型的融合發(fā)展提供了有力支撐。在大模型架構(gòu)演進(jìn)方向上,得一微將稀疏模型架構(gòu)視為未來(lái)發(fā)展的必然趨勢(shì)。盡管當(dāng)前MoE(Mixture of Experts)架構(gòu)在大模型中取得了顯著成果,但在得一微看來(lái),這并非大模型架構(gòu)的終極目標(biāo),未來(lái)宏觀的模塊稀疏逐漸向微觀的神經(jīng)元級(jí)別稀疏邁進(jìn),而這種神經(jīng)元級(jí)別的稀疏架構(gòu)與閃存技術(shù)的特性高度契合,有望充分發(fā)揮閃存的存儲(chǔ)和讀寫(xiě)優(yōu)勢(shì),實(shí)現(xiàn)大模型在效能、成本等方面的全面優(yōu)化。基于此,得一微著力研發(fā)如何利用閃存技術(shù)特性,設(shè)計(jì)出更高效、更靈活適配神經(jīng)元級(jí)稀疏模型的AI存力芯片架構(gòu),通過(guò)技術(shù)創(chuàng)新推動(dòng)大模型向更高效率演進(jìn)。
技術(shù)矩陣,存儲(chǔ)控制+存算互聯(lián)+存算一體的協(xié)同進(jìn)化
“閃存和大模型融合的架構(gòu)創(chuàng)新只是起點(diǎn),真正的考驗(yàn)在于量產(chǎn)化落地?!眳谴笪吩诓稍L中透露,得一微“AI存力芯片”技術(shù)路徑,通過(guò)存儲(chǔ)控制、存算互聯(lián)、存算一體三大核心技術(shù)矩陣,正在重構(gòu)數(shù)據(jù)流,引領(lǐng)存力芯片智能化升級(jí)。
優(yōu)化存儲(chǔ)調(diào)度:通過(guò)先進(jìn)的存儲(chǔ)控制技術(shù),優(yōu)化數(shù)據(jù)在存儲(chǔ)介質(zhì)中的存取策略,最大化存儲(chǔ)帶寬利用率,降低訪問(wèn)延遲。使數(shù)據(jù)在存儲(chǔ)介質(zhì)中的讀寫(xiě)更加高效、流暢,為AI應(yīng)用提供了更快速、更穩(wěn)定的數(shù)據(jù)支持。打通高速通道:利用存算互聯(lián)技術(shù),構(gòu)建更高效(更高帶寬、更低延遲)、更智能(支持QoS、確定性延遲)的連接通道,讓數(shù)據(jù)能更快、更順暢地直達(dá)計(jì)算單元。大幅縮短數(shù)據(jù)傳輸時(shí)間,提高系統(tǒng)的整體響應(yīng)速度,為AI負(fù)載的高效處理提供有力保障。顛覆性架構(gòu):探索存算一體技術(shù),將部分計(jì)算直接放在存儲(chǔ)單元內(nèi)部或近端執(zhí)行,從根本上減少甚至消除數(shù)據(jù)搬運(yùn)的需求,實(shí)現(xiàn)指數(shù)級(jí)的能效比提升和延遲降低。這也是讓龐大算力得以“吃飽”、“高效工作”的關(guān)鍵所在。全棧生態(tài)賦能,加速AI時(shí)代存力進(jìn)化
基于存儲(chǔ)控制、存算互聯(lián)和存算一體三大技術(shù)支柱,得一微在AI手機(jī)、AI PC、AI汽車(chē)、AIoT及AI服務(wù)器五大領(lǐng)域,構(gòu)建起覆蓋智慧終端、智能汽車(chē)與智算中心的完整存力生態(tài),展現(xiàn)出強(qiáng)大的技術(shù)實(shí)力和市場(chǎng)影響力。

AI手機(jī)突破:得一微作為國(guó)產(chǎn)存力主控芯片設(shè)計(jì)企業(yè),已大規(guī)模進(jìn)入核心手機(jī)廠商供應(yīng)鏈,其技術(shù)實(shí)力得到了閃存原廠的高度認(rèn)可。得一微自研的eMMC存力主控芯片歷經(jīng)10多年市場(chǎng)量產(chǎn)驗(yàn)證,還推出了中國(guó)大陸首款商用量產(chǎn)UFS 3.1存力主控芯片,讀寫(xiě)速度超過(guò)2GB/s,性能卓越可靠,為智能手機(jī)普及AI應(yīng)用提供了強(qiáng)有力的支持,持續(xù)為用戶帶來(lái)更流暢的智能體驗(yàn)。AI汽車(chē)攻堅(jiān):得一微車(chē)規(guī)級(jí)存力芯片已成功應(yīng)用于東風(fēng)、長(zhǎng)安、吉利、上汽、陜汽、一汽、長(zhǎng)城等多家主流車(chē)企,成為公司成長(zhǎng)最快的業(yè)務(wù)之一。目前,公司已構(gòu)建起完備的車(chē)規(guī)級(jí)存力產(chǎn)品矩陣,量產(chǎn)了多款車(chē)規(guī)eMMC、BGA SSD,并即將推出車(chē)規(guī)UFS存力芯片。這些產(chǎn)品依托得一微自主底層芯片設(shè)計(jì)能力,在性能、可靠性和能效等方面深度優(yōu)化,符合嚴(yán)苛的車(chē)規(guī)標(biāo)準(zhǔn),為智能汽車(chē)提供安全可靠的存儲(chǔ)保障,助力汽車(chē)行業(yè)向智能化、電動(dòng)化方向邁進(jìn)。AI服務(wù)器躍遷:得一微AI-MemoryX顯存擴(kuò)展解決方案,依托自研芯片和AI存儲(chǔ)系統(tǒng)級(jí)創(chuàng)新,顯著提升了單機(jī)的顯存容量,突破大模型訓(xùn)練的顯存瓶頸,為AI服務(wù)器的高性能運(yùn)行提供關(guān)鍵支持。隨著AI-MemoryX技術(shù)的迭代創(chuàng)新,得一微將以AI-MemoryX SSD進(jìn)入智算中心存力市場(chǎng),推動(dòng)產(chǎn)品從功能型向智能型升級(jí)。此外,得一微還積極布局CXL存算芯片設(shè)計(jì)開(kāi)發(fā),提升存算融合效率,為未來(lái)數(shù)據(jù)中心、AI計(jì)算等場(chǎng)景帶來(lái)創(chuàng)新解決方案。AI PC進(jìn)化:得一微SSD存力主控芯片年出貨量數(shù)千萬(wàn)顆,新一代PCIe 5.0存力主控芯片即將推出,支持高達(dá)14.5 GB/s傳輸速率,采用先進(jìn)的架構(gòu)設(shè)計(jì),實(shí)現(xiàn)更高的數(shù)據(jù)傳輸速率和更低的延遲,進(jìn)一步滿足AI PC、邊緣計(jì)算等場(chǎng)景對(duì)存儲(chǔ)性能的極致需求,助力AI技術(shù)的規(guī)?;瘧?yīng)用。AIoT智能滲透:在AIoT(人工智能物聯(lián)網(wǎng))領(lǐng)域,得一微存力解決方案早已實(shí)現(xiàn)規(guī)?;瘧?yīng)用,其eMMC、SD卡、TF卡年出貨量超億顆,產(chǎn)品廣泛應(yīng)用于智能家居、智能安防、工業(yè)物聯(lián)網(wǎng)等多個(gè)領(lǐng)域,為萬(wàn)物智聯(lián)提供高可靠、低功耗的存力支持,助力各行業(yè)智能化升級(jí)。
站在2025年的技術(shù)高地,得一微正式啟動(dòng)“河圖計(jì)劃”——基于存算一體架構(gòu)的AI存力芯片研發(fā)戰(zhàn)略。該計(jì)劃通過(guò)突破性的架構(gòu)創(chuàng)新,推動(dòng)存儲(chǔ)介質(zhì)從“數(shù)據(jù)容器”向“智能載體”演進(jìn),引領(lǐng)存力芯片行業(yè)進(jìn)入全新的發(fā)展階段。這一計(jì)劃也直指得一微“讓每比特?cái)?shù)據(jù)創(chuàng)造更多智能”的企業(yè)愿景。
正如吳大畏先生所言,“未來(lái)的存儲(chǔ)設(shè)備將是會(huì)‘思考’的智能體,當(dāng)每個(gè)SSD固態(tài)硬盤(pán)都具備自我認(rèn)知架構(gòu),它們不僅能存儲(chǔ)數(shù)據(jù),更能理解數(shù)據(jù)、優(yōu)化數(shù)據(jù),甚至在休眠狀態(tài)下持續(xù)進(jìn)行數(shù)據(jù)價(jià)值挖掘和自我進(jìn)化——這才是存力真正的智能革命?!?/section>當(dāng)存力長(zhǎng)出AI大腦,存力也將成為一種重要的算力。得一微正憑借其卓越的技術(shù)實(shí)力和創(chuàng)新精神,成為這一變革中的關(guān)鍵突破者,引領(lǐng)存力芯片行業(yè)邁向更智能、高效的未來(lái),為全球存力進(jìn)化提供先進(jìn)智能的中國(guó)方案。