DeepSeek-V3.2-Exp模型正式发布并开源
2025-09-29 18:12:55
分享至

ChainCatcher 消息,DeepSeek-V3.2-Exp 模型今日正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对 DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大 EP 并行方案部署,基于稀疏 Attention 结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
最新快讯
美 SEC 与 CFTC 将召开 14 年来首次联合圆桌会议
ChainCatcher
2025-09-29 19:50:43
K Wave Media 获 Galaxy Digital 约 100 万美元股权投资
ChainCatcher
2025-09-29 19:47:48
数据:贝莱德将逾 4.96 万枚 ETH 和 340.5 枚 BTC 存入 Coinbase Prime
ChainCatcher
2025-09-29 19:46:50
NextGen 获批扩展数字资产业务,已购入 444 枚 TAO 代币并完成质押
ChainCatcher
2025-09-29 19:46:43
三菱日联:若非农就业报告疲软,美元恐将进一步下跌
ChainCatcher
2025-09-29 19:46:41