DeepSeek发布Prover-V2模型,参数量达6710亿
2025-04-30 18:40:34律动BlockBeats分享至:
BlockBeats 消息,4 月 30 日,DeepSeek 今日于 AI 开源社区 Hugging Face 上发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。据悉,DeepSeek-Prover-V2-671B 使用了更高效的 safetensors 文件格式,并支持多种计算精度,方便模型更快、更省资源地训练和部署,参数达 6710 亿,或为去年发布的 Prover-V1.5 数学模型升级版本。
在模型架构上,该模型使用了 DeepSeek-V3 架构,采用 MoE(混合专家)模式,具有 61 层 Transformer 层,7168 维隐藏层。同时支持超长上下文,最大位置嵌入达 16.38 万,使其能处理复杂的数学证明,并且采用了 FP8 量化,可通过量化技术减小模型大小,提高推理效率。(金十)AI简介
Sleepless AI (AI) 是一...全部
今日价格 | $0.1271 USD | 24小时涨跌幅 | +3.67% | 24小时成交额 | $6,058,571.98 USD |
---|
总市值 | $39,790,243.66 USD | 流通供应量 | 313,062,499.33枚 | 最大供应量 | 1,000,000,000枚 |
---|
免责声明:作为区块链信息平台,本站所发布文章仅代表作者个人观点,与Bi123立场无关。文章内的信息、意见等均仅供参考,并非作为或视为实际投资建议。

最有价值的区块链信息和数据平台
