
广告盯上DeepSeek
广告盯上DeepSeekAI搜索加广告,是必然吗?
AI搜索加广告,是必然吗?
本文深入解析一项开创性研究——"Logic-RL: Unleashing LLM Reasoning with Rule-Based Reinforcement Learning",该研究通过基于规则的强化学习技术显著提升了语言模型的推理能力。微软亚洲的研究团队受DeepSeek-R1成功经验的启发,利用结构化的逻辑谜题作为训练场,为模型创建了一个可以系统学习和改进推理技能的环境。
人工智能(AI)系统或将逃脱人类控制,欺骗人类,甚至给全人类带来灾难性的后果。
AI开源潮涌现,推理模型成主流。
谷歌首席科学家Jeff Dean与Transformer作者Noam Shazeer在一场访谈中不仅揭秘了让模型速度提升三倍的低精度计算技术,分享了「猫神经元」等早期AI突破的背后故事,还大胆畅想了AI处理万亿级别Token、实现「1000万倍工程师」的可能性。
在创始人、已故CEO乔布斯诞辰70周年之际,苹果宣布未来4年在本土投资5000亿美元,加速AI和半导体投资进度,将新建24家工厂,创造2万个就业岗位。
自动形式化数学定理证明,是人工智能在数学推理领域的重要应用方向。此类任务需要将数学命题和证明步骤转化为计算机可验证的代码,这不仅能确保推理过程的绝对严谨性,还能构建可复用的数学知识库,为科学研究提供坚实基础。
当很多 AI 公司还就是否该走开源路线而感到左右为难时,阿里的技术团队又开源了一个新的模型 —— 万相(Wan)视频生成大模型(包括全部推理代码和权重,最宽松的开源协议)。
前阵子,我那年过半百的老爸也开始问我这个问题了。别以为AI只是个高级玩具,它跟以前我们用的所有工具都不一样。想想以前的计算机,让我们算数更快;互联网,让我们查资料更快。它们都是工具,帮我们提高效率。
Claude 3.7新鲜出炉全网热议,到底有多强?第一波实测来了!简单粗暴总结,它在编程、现实世界任务上,能力爆表。只需一个样本,就能一下子吐出3200多行代码,做出一个可玩性很高的游戏。
在科技界,快速崛起和巨额交易总是备受关注。本周,MongoDB 宣布以 2.2 亿美元的价格收购 Voyage AI——一家刚成立 17 个月、在嵌入(embedding)和重排序(reranking)模型领域处于行业领先地位的 AI 初创公司。
推理黑马出世,仅以5%参数量撼动AI圈。360、北大团队研发的中等量级推理模型Tiny-R1-32B-Preview正式亮相,32B参数,能够匹敌DeepSeek-R1-671B巨兽。
给AI看一眼图,它就能找到对应音乐。
DeepSeek开源第二弹如期而至。这一次,他们把MoE模型内核库开源了,支持FP8专为Hopper GPU设计,低延迟超高速训练推理。
从大型手办转向智能情侣
当地时间 2 月 25 日,Anthropic 正式发布了 Claude 3.7 Sonnet,“这是迄今为止我们最智能的模型,也是市场上首个混合推理模型。”Anthropic 官方表示。
AI竞争:数据为关键,OpenAI领先缩小。
精准预测和设计蛋白质的序列、结构及模拟其动态变化,一直是科学界的重大挑战。
高调亮相的世界首个「AI CUDA工程师」,宣称能让模型训练速度飙升100倍,如今却上演了一场「作弊」闹剧。OpenAI研究员用o3-mini,11秒便发现了内核代码有bug!
成人版ChatGPT解禁,它搞颜色的水平如何?
近日,Meta等机构发表的论文介绍了一种通过进化算法构造高质量数据集的方法:拒绝指令偏好(RIP),得到了Yann LeCun的转赞。相比未经过滤的数据,使用RIP构建的数据集让模型在多个基准测试中都实现了显著提升。
数据库公司 MongoDB Inc.宣布,将以 2.2 亿美元的现金加股票交易收购 Voyage AI,以加速其帮助客户构建人工智能驱动应用程序的能力。
DeepSeek开源第二弹如期而至。这一次,他们把MoE训推EP通信库DeepEP开源了,支持FP8专为Hopper GPU设计,低延迟超高速训练推理。
只刷逻辑益智题,竟能让 AI 数学竞赛水平大幅提升?
还在惊叹预言家的神奇?如今LLM也掌握了预测未来的「超能力」!研究人员通过自我博弈和直接偏好优化,让LLM摆脱人工数据依赖,大幅提升预测能力。
DeepSeek席卷校园:头部高校开AI大课。
智能创造了巨大的价值,大大提高了效率,所以问题不在于它是否会有回报,问题是我们要进行哪些投资以及在什么时间范围内投资
DeepSeek,就是AI一体机的“瓦特时刻”
“仿真人的感情是否也是仿真的?”
Stop AI组织在旧金山抗议AGI发展,呼吁禁止。