應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊個(gè)人注冊登錄

曦望新一代推理 GPU 芯片啟望 S3 發(fā)布:單位 Token 推理成本降低 90%

2026-01-28 09:30 IT之家
關(guān)鍵詞:曦望GPU芯片

導(dǎo)讀:國產(chǎn) GPU 廠商曦望(Sunrise)發(fā)布了新一代推理 GPU 芯片啟望 S3。

  1 月 27 日消息,據(jù)界面新聞報(bào)道,國產(chǎn) GPU 廠商曦望(Sunrise)發(fā)布了新一代推理 GPU 芯片啟望 S3。這是該公司在近一年累計(jì)完成約 30 億元戰(zhàn)略融資后的首次集中公開亮相。

  據(jù)了解,啟望 S3 是一款面向大模型推理的定制化 GPGPU 芯片。據(jù)了解,該芯片在典型推理場景下的整體性價(jià)比較上一代產(chǎn)品提升超過 10 倍。算力與存儲設(shè)計(jì)上,芯片支持 FP16 至 FP4 精度切換,采用 LPDDR6 顯存方案,顯存容量較上一代提升 4 倍。

  在應(yīng)用層面,啟望 S3 在 DeepSeek V3/R1 滿血版等主流大模型推理場景中,單位 Token 成本較上一代降低約 90%。

  曦望還同步發(fā)布了面向大模型推理的寰望 SC3-256 超節(jié)點(diǎn)方案,可適配千億、萬億級參數(shù)的多模態(tài) MoE 推理場景。此外,曦望還聯(lián)合商湯科技、第四范式等生態(tài)伙伴,共同發(fā)起“百萬 Token 一分錢”推理成本計(jì)劃。曦望與浙江大學(xué)簽署戰(zhàn)略合作協(xié)議,聯(lián)合成立“智能計(jì)算聯(lián)合研發(fā)中心”。

  曦望前身是商湯科技大芯片部門,不久前宣布在一年內(nèi)完成了近 30 億元戰(zhàn)略融資。2025 年,曦望芯片交付量已突破萬片。