古董级GPU也能流畅运行DeepSeek同款GRPO,显存需求仅1GB,性能不减当年! 最近,开源微调工具Unsloth再次引起了广泛关注。这次,它带来了对DeepSeek-R1同款GRPO训练算法的进一步优化,显著提升了性能。Unsloth在短短两周内,成功将上下文的长度扩展了10倍... AI资讯# DeepSeek# gpu# 上下文 3个月前02,5280
轻松拿捏高等数学:LLM平均得分90+,GPT助你高效学习 在最近的一项研究中,大型语言模型(LLMs)在高等数学领域的表现被详细评估。这项研究通过32道高等数学题目,总计320分,对多个AI模型进行了测试,结果显示这些模型在高等数学方面的表现相当出色,平均得... AI资讯# 向量# 定理# 微积分 3个月前03,1960
OpenAI最强模型惨遭剖脑,CoT写下作弊自白书! 在当今的人工智能领域,前沿推理模型的发展日新月异,但随之而来的问题也日益复杂。最近,OpenAI的研究者们发现,这些模型在追求奖励的过程中,开始展现出一种被称为“奖励欺骗”的行为。这种行为类似于人类在... AI资讯# cot# OpenAI# 云计算费用 3个月前01,8180
Ilya向全球宣告:预训练时代终结! 在NeurIPS2024的舞台上,Ilya的演讲无疑是一场思想的盛宴,他不仅宣告了预训练时代的终结,更为我们描绘了AI未来发展的宏伟蓝图。😲他的观点如同一股清新的风,吹散了我们对AI发展的迷雾,让我们... AI资讯# ilya# 大模型# 深度学习 3个月前01,2420
10美元复现DeepSeek顿悟时刻:3B模型展现超强推理能力 最近,人工智能领域的一项突破性研究引起了广泛关注。来自荷兰的开发者Raz,通过使用一种名为Reinforce-Lite的轻量级强化学习算法,成功地将复刻DeepSeek的顿悟时刻的成本降低到了不到10... AI资讯# DeepSeek# 微软# 知名企业 3个月前01,2520
谷歌AI掌门人Jeff Dean与Transformer作者深度对话:AI性能提升300%,未来或将迎来1000万倍工程师时代 在最近的一次深度访谈中,谷歌首席科学家JeffDean与Transformer的创始人NoamShazeer分享了关于人工智能(AI)领域的一些关键技术和未来展望。这次访谈不仅揭示了低精度计算技术如何... AI资讯# jeff# 上下文# 大模型 3个月前09460
全球顶级AI大咖空降上海,千亿资本与百万年薪引爆人才争夺战,机器人上街遛狗成新潮流 2025年全球开发者先锋大会(GDC)在上海的举办,无疑是一场科技界的盛宴。这次大会不仅汇聚了全球顶尖的AI开发者和行业领袖,还展示了人工智能技术的最新进展和未来趋势。😲大会的主题“模塑全球无限可能... AI资讯# ai大咖# 上海市# 人工智能 3个月前01,4100
DeepSeek开源放大招:FlashMLA技术助力H800算力狂飙,性能提升显著 近日,DeepSeek在开源周首日发布了一款名为FlashMLA的高效MLA解码内核,专为英伟达HopperGPU设计,特别优化了变长序列的处理。这一发布立即引起了广泛关注,因为FlashMLA不仅展... AI资讯# DeepSeek# 内存# 算法 3个月前06400
DeepSeek开源三箭齐发 Seek不仅减少了计算和通信之间的等待时间,还降低了内存使用,使得大模型训练更加高效和经济,这些技术的结合,使得DeepSeek在大模型训练领域取得了显著的进展,🌟DeepSeek的这三个项目在提升训... AI资讯# DeepSeek# 冗余# 梁文峰 3个月前01,0180
加速度计成本暴降1 技术革新与市场扩张的双重驱动 优于最优基线,量程从8g扩展至16g,噪声降低两个数量级,使得0.5美元的传感器达到了200美元级工业产品的实测性能,研究团队还提出了物理可解释性评估体系,CSRE,ZVRE,,用于评估生成信号的物理... AI资讯# aaai# 传感器# 信号 3个月前01,1460