清微智能算力服务器基于DeepSeek模型的蒸馏训练-EE芯视频

EE芯视频

广告

清微智能算力服务器基于DeepSeek模型的蒸馏训练

1260播放 · 2025-02-07 14:19:55

生成分享海报

使用DeepSeek-R1模型对NuminaMath-TIR等数据集的问题进行推理解答，生成的思考过程和答案作为Qwen2-7B模型蒸馏训练数据集，基于清微智能算力服务器加载蒸馏训练数据集和Qwen2-7B的模型权重及配置文件，进行Qwen2-7B模型的蒸馏训练。

 清微智能 DeepSeek

0 条评论

登录

最新评论

ASPENCORE官方账号 16粉丝 · 735视频

关注

接下来播放

自动连播

如何用1台设备搞定4端口测试？探索新型矢量网络分析仪VNA！

339

更多视频推荐

低频场耦合实测：CPU 骤降 40℃，功耗直降 91%

182观看

免费送样！CSNP1GCR01-BOW芯片助力智能穿戴开发

268观看

独家对话Allegro CEO：谈履新百日感悟

1439观看

英伟达推出AI超级电脑，价格仅249美元

1020观看

570观看

【2024展望】服务器、AI PC和手机对存储器需求不断攀升

606观看

TB67S109A驱动板驱动42步进电机

987观看

让您的机器人硬件为当今的主要趋势做好准备

744观看

【Telink B91】+同时控制LED闪灯和数字舵机

1382观看

TWS耳机也能听无损音乐了？全靠这颗芯

2132观看