10美元复现DeepSeek顿悟时刻:3B模型展现超强推理能力 最近,人工智能领域的一项突破性研究引起了广泛关注。来自荷兰的开发者Raz,通过使用一种名为Reinforce-Lite的轻量级强化学习算法,成功地将复刻DeepSeek的顿悟时刻的成本降低到了不到10... AI资讯# DeepSeek# 微软# 知名企业 3个月前01,2520