揭秘人工智能在深度搜索技术中的创新应用与未来发展 探索DeepSeek 近日,斯坦福和普林斯顿的研究团队在AI领域取得了突破性进展,他们发现DeepSeek,R1能够生成自定义的CUDA内核,这一成果在推理模型中排名第一,超越了OpenAI的o1和Claude3.5Son... AI资讯# DeepSeek# 信号# 斯坦福 3个月前01,0440
DeepSeek开源三箭齐发 Seek不仅减少了计算和通信之间的等待时间,还降低了内存使用,使得大模型训练更加高效和经济,这些技术的结合,使得DeepSeek在大模型训练领域取得了显著的进展,🌟DeepSeek的这三个项目在提升训... AI资讯# DeepSeek# 冗余# 梁文峰 3个月前01,0380
360与北京大学强强联手,震撼发布最新研究成果 近日,360与北京大学联合研发的中等量级推理模型Tiny-R1-32B-Preview正式亮相,这一成果在AI领域引起了广泛关注。😮该模型仅以32B的参数规模,却能够匹敌DeepSeek-R1-671... AI资讯# 360# DeepSeek# preview 3个月前01,0260
DeepSeek全面开源V3 刚刚 性特点所决定的,每层256个专家中仅激活8个,这就要求采用极大的整体批处理规模,以确保每个专家模块获得足够的批处理量,从而实现更高的吞吐量和更低的延迟,通过dual,batch重叠策略和五阶段流水线技... AI资讯# DeepSeek# 冗余# 大模型 3个月前09780
DeepSeek:探索人工智能在深度学习和数据挖掘中的前沿应用与未来发展 近日,DeepSeek团队再次震撼AI界,发布了其开源系列的第三弹——DeepGEMM,这是一个专为FP8(8位浮点数)通用矩阵乘法(GEMM)设计的计算库,支持稠密模型和混合专家模型(MoE)。这一... AI资讯# DeepSeek# 代码# 寄存器 3个月前09340
R1 部署A100实现50%吞吐提升 美团开源首发INT8无损满血版DeepSeek 近日,美团搜推机器学习团队在3月4日发布了一项重要的开源成果,成功实现了对DeepSeekR1模型的基本无损INT8精度量化,这一成果不仅展示了团队在深度学习模型优化方面的技术实力,也为广大开发者提供... AI资讯# DeepSeek# 开源AI# 美团开源 3个月前09080
DeepSeek下周顶级代码库5连发:巅峰对决OpenAI,正面硬刚GPT,技术革新引领未来 近日,DeepSeek宣布将在下周连续五天开源五个代码仓库,这一消息无疑在技术社区中引起了广泛关注和热烈讨论。😲根据DeepSeek的官方公告,这些代码库不仅是其在线服务的基础构建模块,而且已经通过了... AI资讯# DeepSeek# OpenAI# 代码库 3个月前08100
DeepSeek开源放大招:FlashMLA技术助力H800算力狂飙,性能提升显著 近日,DeepSeek在开源周首日发布了一款名为FlashMLA的高效MLA解码内核,专为英伟达HopperGPU设计,特别优化了变长序列的处理。这一发布立即引起了广泛关注,因为FlashMLA不仅展... AI资讯# DeepSeek# 内存# 算法 3个月前06400