123,123

<abbr id="xfcvp"></abbr>

應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞

企業(yè)注冊個(gè)人注冊登錄

階躍星辰發(fā)布新一代基礎(chǔ)大模型 Step 3，華為昇騰芯片已首先實(shí)現(xiàn)搭載

2025-07-28 09:52 IT之家

關(guān)鍵詞：階躍星辰大模型Step 3

導(dǎo)讀：階躍星辰正式發(fā)布了新一代基礎(chǔ)大模型 ——Step 3，是階躍星辰首個(gè)全尺寸、原生多模態(tài)推理模型，兼顧模型效果與推理成本，是在模型架構(gòu)創(chuàng)新、算法工程協(xié)同設(shè)計(jì)上的一次大膽嘗試與 Scale Up。

　　7 月 26 日消息，在 2025 世界人工智能大會（簡稱“WAIC 2025”）開幕前夕，階躍星辰在上海正式發(fā)布了新一代基礎(chǔ)大模型 ——Step 3，將于 7 月 31 日面向全球企業(yè)和開發(fā)者開源。

　　據(jù)官方介紹，Step 3 是階躍星辰首個(gè)全尺寸、原生多模態(tài)推理模型，兼顧模型效果與推理成本，是在模型架構(gòu)創(chuàng)新、算法工程協(xié)同設(shè)計(jì)上的一次大膽嘗試與 Scale Up。Step 3 采用 MoE 架構(gòu)，總參數(shù)量 321B，激活參數(shù)量 38B。

　　Step 3 擁有強(qiáng)大的視覺感知和復(fù)雜推理能力，可準(zhǔn)確完成跨領(lǐng)域的復(fù)雜知識理解、數(shù)學(xué)與視覺信息的交叉分析，以及日常生活中的各類視覺分析問題。

　　Step 3 在 MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench (2024.08-2025.05) 等榜單上取得了開源多模態(tài)推理模型的 SOTA 成績。

　　官方稱，目前，主流開源模型雖然針對解碼進(jìn)行了大量優(yōu)化，但其優(yōu)化方案主要適配國際高端芯片，在中端及國產(chǎn)芯片上的解碼效率仍有提升空間。在架構(gòu)設(shè)計(jì)階段，Step 3 便充分考量系統(tǒng)與硬件的特性，實(shí)現(xiàn)廣泛硬件平臺上的高效推理。憑借系統(tǒng)和架構(gòu)創(chuàng)新，Step 3 實(shí)現(xiàn)了行業(yè)領(lǐng)先的推理解碼效率。

　　根據(jù)原理分析，Step 3 在國產(chǎn)芯片上的推理效率最高可達(dá) DeepSeek-R1 的 300%，且對所有芯片友好。在基于 NVIDIA Hopper 架構(gòu)的芯片進(jìn)行分布式推理時(shí)，實(shí)測 Step 3 相較于 DeepSeek-R1 的吞吐量提升超 70%。這些都是在不犧牲激活參數(shù)量、不降低注意力容量的條件下實(shí)現(xiàn)的

　　階躍星辰宣布聯(lián)合近 10 家芯片及基礎(chǔ)設(shè)施廠商，共同發(fā)起“模芯生態(tài)創(chuàng)新聯(lián)盟”，首批成員包括華為昇騰、沐曦、壁仞科技、燧原科技、天數(shù)智芯、無問芯穹、寒武紀(jì)、摩爾線程、硅基流動等。目前，華為昇騰芯片已首先實(shí)現(xiàn) Step 3 的搭載和運(yùn)行。沐曦、天數(shù)智芯和燧原等也已初步實(shí)現(xiàn)運(yùn)行 Step 3。其它聯(lián)盟廠商的適配工作正在開展。

客服熱線：0755-86227155 86227055 傳真：0755-86227110 E-mail:rfidabc@gmail.com
新聞編輯QQ：

，投稿信箱：1984342256@qq.com，客服QQ：

，媒體/展會合作QQ：

感谢您访问我们的网站，您可能还对以下资源感兴趣：

国产一级毛片午夜福

中文字幕无码第1页免费精品操女操操亚洲日韩在线中文字幕综合国产成人图片综合网站

階躍星辰發(fā)布新一代基礎(chǔ)大模型 Step 3，華為昇騰芯片已首先實(shí)現(xiàn)搭載

相關(guān)閱讀

階躍星辰發(fā)布新一代基礎(chǔ)大模型 Step 3，華為昇騰芯片已首先實(shí)現(xiàn)搭載