應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點新聞
企業(yè)注冊個人注冊登錄

云天勵飛公布大算力芯片戰(zhàn)略,誓將推理成本“狂砍”100倍

2026-02-05 09:09 視覺物聯(lián)
關(guān)鍵詞:云天勵飛

導(dǎo)讀:云天勵飛以一場“大算力芯片戰(zhàn)略前瞻會”向行業(yè)投下重磅炸彈:未來三年聚焦大模型落地成本攻堅,劍指百萬Tokens推理成本降低100倍!

  當(dāng)AI大模型從實驗室走向千行百業(yè),成本與效率的博弈正成為行業(yè)破局的關(guān)鍵。

  近日,云天勵飛以一場“大算力芯片戰(zhàn)略前瞻會”向行業(yè)投下重磅炸彈:未來三年聚焦大模型落地成本攻堅,劍指百萬Tokens推理成本降低100倍!

  與此同時,公司2025年業(yè)績預(yù)告釋放積極信號——營收最高預(yù)增52.61%,虧損大幅收窄。

  這場“技術(shù)+商業(yè)”的雙輪驅(qū)動,能否為行業(yè)撕開一條普惠AI的新賽道?

  芯片戰(zhàn)略:從“算力競賽”到“成本革命”

  近年來,全球AI產(chǎn)業(yè)格局正經(jīng)歷深刻重塑,其發(fā)展重心從“重訓(xùn)練”逐步轉(zhuǎn)向“重推理”。

  根據(jù)IDC預(yù)測,推理算力占比將持續(xù)攀升,2024年占比40%,2027年將達70%。而這一轉(zhuǎn)變的背后,是AI應(yīng)用場景的加速落地與使用頻次的爆發(fā)式增長,推動算力需求結(jié)構(gòu)發(fā)生根本性變化。

  然而,在AI大模型狂飆突進的同時,一個關(guān)鍵瓶頸日益凸顯:高昂的推理成本正成為AI規(guī)?;涞氐摹鞍⒖α鹚怪唷?,嚴(yán)重制約了技術(shù)從示范走向普及。

  面對這一行業(yè)性挑戰(zhàn),云天勵飛選擇將戰(zhàn)略重心聚焦于攻克大模型落地的“成本壁壘”,通過底層架構(gòu)創(chuàng)新開啟“成本革命”。公司提出“百萬Tokens推理成本降低100倍以上”的突破性目標(biāo),旨在推動AI技術(shù)從實驗室走向普惠化應(yīng)用,真正成為賦能千行百業(yè)的生產(chǎn)力工具。

  為實現(xiàn)這一目標(biāo),云天勵飛確立了GPNPU技術(shù)路線,構(gòu)建起“GPNPU=GPGPU+NPU+3D堆疊存儲”的核心技術(shù)框架。該架構(gòu)創(chuàng)造性地兼顧通用計算的“通用性”與NPU的“高效性”,在工程層面同步解決可遷移性、可部署性和持續(xù)降本三大難題,為推理時代提供系統(tǒng)級解決方案。

  在生態(tài)兼容性方面,針對CUDA作為全球主流加速計算平臺的現(xiàn)實,云天勵飛的GPNPU架構(gòu)實現(xiàn)了“一行代碼完成CUDA程序兼容”,這種生態(tài)適配能力,顯著降低了技術(shù)遷移門檻。

  針對推理場景的能效優(yōu)化,云天勵飛通過引入針對大模型推理高度優(yōu)化的NPU單元,并結(jié)合3D堆疊存儲等先進技術(shù)來突破“內(nèi)存墻”限制,從而在系統(tǒng)級提升帶寬、降低時延,將能效優(yōu)勢切實轉(zhuǎn)化為真實的成本優(yōu)勢。

  在架構(gòu)工程創(chuàng)新層面,云天勵飛強調(diào)了兩大務(wù)實策略:

  ①“算力積木”架構(gòu):基于Chiplet擴展與互連技術(shù),將標(biāo)準(zhǔn)計算單元進行模塊化封裝,支持算力像搭積木般靈活擴展。這種設(shè)計使產(chǎn)品形態(tài)能夠覆蓋從邊緣計算到大規(guī)模推理的全場景需求。

  ②系統(tǒng)級優(yōu)化導(dǎo)向:拒絕單純的“芯片參數(shù)競賽”,將“如何讓模型運行更高效”的核心問題融入架構(gòu)設(shè)計。通過圍繞真實業(yè)務(wù)負載持續(xù)迭代,系統(tǒng)性地破解推理鏈路中的成本與時延瓶頸。

  業(yè)績表現(xiàn):營收增長,虧損進一步收窄

  日前,云天勵飛發(fā)布2025年年度業(yè)績預(yù)告,公司主營業(yè)務(wù)經(jīng)營保持穩(wěn)健增長勢頭,預(yù)計2025年公司營業(yè)收入、毛利率較上年同期均提升顯著,公司虧損進一步收窄。

  根據(jù)業(yè)績預(yù)告顯示,預(yù)計云天勵飛2025年營業(yè)收入為11.3億元至14億元,同比增長23.18%至52.61%;預(yù)計實現(xiàn)歸屬于母公司所有者的凈利潤為-4.71億元至-3.51億元,虧損同比收窄18.64%至39.36%。

  關(guān)于本期公司業(yè)績虧損變化的原因,云天勵飛表示,公司企業(yè)級和消費級場景業(yè)務(wù)的銷售收入大幅增長,綜合毛利潤較上年顯著提升,促使公司虧損收窄。

  同時,為把握行業(yè)發(fā)展機遇,鞏固公司核心技術(shù)競爭優(yōu)勢,云天勵飛在高端人才、底層技術(shù)方面繼續(xù)加大投入。報告期內(nèi),公司研發(fā)投入仍保持較高水平,故公司經(jīng)營毛利未覆蓋研發(fā)等方面投入,呈現(xiàn)虧損狀態(tài)。

  展望未來,云天勵飛將繼續(xù)深耕核心業(yè)務(wù),持續(xù)推進技術(shù)創(chuàng)新與市場落地,進一步提升盈利能力與經(jīng)營效益。

  行業(yè)視角:AI普惠時代加速到來?

  當(dāng)前,全球AI行業(yè)正邁入從“模型構(gòu)建”向“價值創(chuàng)造”的關(guān)鍵轉(zhuǎn)折期,產(chǎn)業(yè)邏輯也正經(jīng)歷多維度重構(gòu)。

  技術(shù)層面,單純追求參數(shù)規(guī)模的“軍備競賽”已顯疲態(tài),增長曲線趨于平緩。行業(yè)焦點正從“把模型做得更大”轉(zhuǎn)向“讓應(yīng)用跑得更穩(wěn)、更省”。技術(shù)創(chuàng)新重點不再局限于提升理論性能峰值,而是更加聚焦于優(yōu)化工程落地與部署效率。

  商業(yè)層面,企業(yè)客戶對AI投入的審視日趨理性務(wù)實,投資回報率(ROI)已成為決策的核心標(biāo)尺。在規(guī)?;渴鸬倪M程中,推理成本的可控性、解決方案的穩(wěn)定性以及整體運營成本效益等,正超越單純的性能參數(shù),成為采購決策中更具分量的決定性指標(biāo)。

  政策層面,國家“人工智能+”行動計劃的推進,明確提出要降低技術(shù)應(yīng)用門檻、賦能廣大中小企業(yè)。這要求產(chǎn)業(yè)界不僅提供先進技術(shù),更需通過架構(gòu)創(chuàng)新與成本優(yōu)化,打造“用得起、用得好”的算力基礎(chǔ)設(shè)施,使AI紅利能廣泛滲透至實體經(jīng)濟各毛細血管。

  而這一切的共同作用,清晰地指向同一個產(chǎn)業(yè)剛需:一場以“極致性價比”為核心的算力成本革命已勢在必行。這也正是云天勵飛提出“成本革命”戰(zhàn)略的深層背景——AI普惠并非自然結(jié)果,而是需要通過創(chuàng)新實現(xiàn)的技術(shù)經(jīng)濟可行性突破。

  寫在最后

  隨著全球算力產(chǎn)業(yè)的風(fēng)向標(biāo)加速向推理側(cè)傾斜,一場圍繞“單位推理成本”的競賽已然拉開序幕。當(dāng)推理成本真正降至足夠低的水平,AI才能真正走出實驗室和演示場景,成為千行百業(yè)日??梢蕾?、可負擔(dān)的通用生產(chǎn)力工具。這場圍繞成本效率的競賽,將最終決定AI普惠時代的到來時間和普及廣度。