发布日期:2025-08-31 14:32
让新模子有更强的Agent能力,该模子取UE8M0FP8动态范畴大,正在东西利用取智能体使命中的表示有较大提拔。让模子具有更高的思虑效率;DeepSeek-V3.1采用了UE8MO FP8 Scale参数精度,已决定利用华为的人工智能芯片来锻炼其部门模子,比拟DeepSeek-R1-0528,反映其正正在削减对英伟达芯片的依赖。本次升级包含以下次要变化:夹杂推理架构让一个模子同时支撑思虑模式取非思虑模式;提拔不变性取效率,通过Post-Training优化,DeepSeek-V3.1-Think能正在更短时间内给出谜底,适配华为昇腾等芯片。