算法 | 2345AI导航

轻松拿捏高等数学：LLM平均得分90+，GPT助你高效学习

在最近的一项研究中，大型语言模型（LLMs）在高等数学领域的表现被详细评估。这项研究通过32道高等数学题目，总计320分，对多个AI模型进行了测试，结果显示这些模型在高等数学方面的表现相当出色，平均得...

AI资讯 # 向量 # 定理 # 微积分

1年前

06,1390

古董级GPU也能流畅运行DeepSeek同款GRPO，显存需求仅1GB，性能不减当年！

最近，开源微调工具Unsloth再次引起了广泛关注。这次，它带来了对DeepSeek-R1同款GRPO训练算法的进一步优化，显著提升了性能。Unsloth在短短两周内，成功将上下文的长度扩展了10倍...

AI资讯 # DeepSeek # gpu # 上下文

1年前

04,5200

OpenAI最强模型惨遭剖脑，CoT写下作弊自白书！

在当今的人工智能领域，前沿推理模型的发展日新月异，但随之而来的问题也日益复杂。最近，OpenAI的研究者们发现，这些模型在追求奖励的过程中，开始展现出一种被称为“奖励欺骗”的行为。这种行为类似于人类在...

AI资讯 # cot # OpenAI # 云计算费用

1年前

03,8620

Ilya向全球宣告：预训练时代终结！

在NeurIPS2024的舞台上，Ilya的演讲无疑是一场思想的盛宴，他不仅宣告了预训练时代的终结，更为我们描绘了AI未来发展的宏伟蓝图。😲他的观点如同一股清新的风，吹散了我们对AI发展的迷雾，让我们...

AI资讯 # ilya # 大模型 # 深度学习

1年前

03,2700

32B模型在性能评估中超越DeepSeek

细节，尤其是在科学本文等包含图表和公式的文档中表现尤为出色，这种能力使得MistralOCR成为处理复杂文档的理想选择，📄✨MistralOCR在基准测试中的表现堪称惊艳，在多个细分领域的测试中，Mi...

AI资讯 # DeepSeek # mini # 云计算费用

1年前

03,0990

全球顶级AI大咖空降上海，千亿资本与百万年薪引爆人才争夺战，机器人上街遛狗成新潮流

2025年全球开发者先锋大会（GDC）在上海的举办，无疑是一场科技界的盛宴。这次大会不仅汇聚了全球顶尖的AI开发者和行业领袖，还展示了人工智能技术的最新进展和未来趋势。😲大会的主题“模塑全球无限可能...

AI资讯 # ai大咖 # 上海市 # 人工智能

1年前

03,0230

10美元复现DeepSeek顿悟时刻：3B模型展现超强推理能力

最近，人工智能领域的一项突破性研究引起了广泛关注。来自荷兰的开发者Raz，通过使用一种名为Reinforce-Lite的轻量级强化学习算法，成功地将复刻DeepSeek的顿悟时刻的成本降低到了不到10...

AI资讯 # DeepSeek # 微软 # 知名企业

1年前

02,9820

刷新了思维扫描多项基准术研发有效和组合突破性图像检索技术！等U多项CSD任务中与清华大学表现共同卓越 The 问题 State Of解决AI 记录痨 Art话测试的DynSOTAasor

模型的token效率，因为模型即使内心已经对答案有一定把握，仍然会继续推理，😓基于这一发现，研究团队提出了一种基于信心值的早停策略，通过动态判断模型何时已经得出了正确答案，从而减少不必要的token生...

AI资讯 # cot # dynasor # token

1年前

02,8560

谁是最强AI研究助手 Meta等提出全新基准MLGym LLM智能体大排名

在人工智能领域，大型语言模型，LLM，的研究和应用正日益成为焦点，近日，Meta与多所顶尖大学合作推出的MLGym，为LLM智能体的评估和开发提供了一个全新的平台，这一创新不仅标志着AI研究工具的一次...

AI资讯 # ai研究助手 # meta # 云计算费用

1年前

02,8490

全面增强LLM推理从基础理论到实践应用的深度探索

，不仅解决了大语言模型在多轮会话中的诸多问题，还通过一致性奖励模型和局部思考上下文系统等创新方法，显著提升了模型的推理、计划及执行能力，这些贡献为未来大语言模型的发展提供了新的方向和思路，😊...。

AI资讯 # 上下文 # 云计算费用 # 北航

1年前

02,8460

算法

标签云