不用GAN 最近,一项名为「直接上升合成」(DirectAscentSynthesis,DAS)的研究引起了广泛关注。这项研究挑战了我们对判别模型和生成模型的传统认知,揭示了判别模型中隐藏的强大生成能力。😮传统上... AI资讯# ai生图# 判别模型# 向量 4个月前02,8160
博士offer一夜变废纸! 近期,美国学术界因特朗普和马斯克推动的科研经费削减政策而陷入动荡。这一政策不仅引发了广泛的抗议,还可能导致大量科学家离开美国,寻找更有利的研究环境。😨NIH(美国国立卫生研究院)宣布削减科研经费,这一... AI资讯# 博士# 唐纳·川普# 学术圈 4个月前01,5340
不懂编程的本科毕业生如何手搓三个APP? 在当今这个AI技术迅猛发展的时代,BlakeAnderson的故事无疑是一个激励人心的例子。他证明了即使没有编程背景,也能通过利用先进的AI工具如ChatGPT,创造出成功的商业产品。以下是对Blak... AI资讯# app# ChatGPT# python 4个月前01,5040
LLM自学成才变身「预言家」! 最近,关于大型语言模型(LLM)的预测能力的研究引起了广泛关注。来自LightningRodLabs和伦敦政治经济学院的研究者们通过自我博弈和直接偏好优化(DPO)技术,成功提升了LLM的预测能力,使... AI资讯# 推理# 样本# 轨迹 4个月前01,2360
官方承认系统「作弊」引发热议 近日,关于「AICUDA工程师」的争议引发了广泛关注。这款号称能让模型训练速度提升100倍的技术,却在实践中遭遇了严重的“翻车”事件。本文将从技术细节、问题根源以及后续处理等方面,对这一事件进行详细分... AI资讯# cuda# mini# 代码 4个月前01,6200
全球首个混合推理模型Claude 3.7震撼发布 近日,Anthropic公司发布了其最新的人工智能模型——Claude3.7Sonnet,这一模型被誉为是扩展思考模式的最强模型。😲在最新的编码测试中,Claude3.7Sonnet不仅超越了o3-m... AI资讯# DeepSeek# 云计算费用# 数学 4个月前01,7380
微软紧急刹车:大规模数据中心租赁计划被曝撤消 近期,DeepSeek的开源行动再次引发了业界的广泛关注。这一次,他们不仅开源了MoE模型内核库,还特别针对HopperGPU设计了FP8支持,旨在实现低延迟和超高速的训练与推理。这一技术突破无疑为A... AI资讯# DeepSeek# OpenAI# 微软 4个月前01,5960
刚刚,DeepSeek开源DeepEP通信库 近日,DeepSeek团队再次震撼开源社区,推出了专为混合专家系统(MoE)和专家并行(EP)设计的通信库——DeepEP。这一开源项目不仅支持FP8低精度运算,还特别针对HopperGPU进行了优化... AI资讯# DeepSeek# gpu# python 4个月前01,7620
360与北京大学强强联手,震撼发布最新研究成果 近日,360与北京大学联合研发的中等量级推理模型Tiny-R1-32B-Preview正式亮相,这一成果在AI领域引起了广泛关注。😮该模型仅以32B的参数规模,却能够匹敌DeepSeek-R1-671... AI资讯# 360# DeepSeek# preview 4个月前01,3860
苹果史上最大投资!4年5000亿美金重注AI+芯片,特朗普专门感谢 在创始人、已故CEO乔布斯诞辰70周年之际,苹果公司宣布了一项雄心勃勃的计划,未来四年内将在美国本土投资5000亿美元,以加速其在人工智能(AI)和半导体领域的发展。这一计划不仅包括新建24家工厂,还... AI资讯# ai+芯片# apple# 史蒂夫·乔布斯 4个月前01,1120