
让AI学着“看菜下碟”!港中大等新框架让推理长度减少90%,准确率反增17%
让AI学着“看菜下碟”!港中大等新框架让推理长度减少90%,准确率反增17%人类在面对简单提问时常常不假思索直接回答,只有遇到复杂难题才会认真推理。
人类在面对简单提问时常常不假思索直接回答,只有遇到复杂难题才会认真推理。
“下一家估值十亿美元的公司,也许只有一个人。”这是 2025 年红杉 AI 峰会(AI Ascent)下午场的开场白。台下本来窃窃私语的投资人一下安静了:如果这句话成真,硅谷几十年建立的“团队规模=护城河”逻辑,将被彻底改写。
Cursor放出了一个接近1小时的内部团队讨论视频,深度分析了他们用到的技术和思考,使得我们有机会深入了解了 Cursor 团队内部关于训练超人级编程模型的讨论,他们的观点让我重新思考了 AI 辅助编程的未来。这些来自一线研究者和工程师的见解,揭示了当前 AI 编程领域最前沿的挑战和突破方向。
上海交通大学联合中科大在本文中指出:现阶段大模型智能体的主要障碍不在于模型能力不足,而在于其「Agentic ROI」尚未达到实用化门槛。研究团队提出 Agentic ROI(Agentic Return on Investment)这一核心指标,用于衡量一个大模型智能体在真实使用场景中所带来的「信息收益」与其「使用成本」之间的比值:
Manus的开放注册标志着其商业化进程的正式启动。但是,Manus到底擅长什么?如果检视Manus的精选用例库,我们会发现约一半的用例是咨询报告(图1),诸如,《B2B供应商寻源报告》、《成衣行业AI产品分析》、《制定门店销售提升策略》等等:
2025年,AMD将推出全新的GPU路线图,瞄准两个竞争激烈的领域:游戏和AI。该公司正在推出一系列重大进展,从简化的产品命名和激进的定价,到尖端的架构和深度AI集成,这表明它决心在多个市场上缩小与英伟达的差距。
上周,有媒体曝出了美团的 AI 零代码工具 NoCode,这是一款无需编程背景和经验,仅通过自然语言和对话形式即可快速生成应用的工具。 顾名思义,NoCode 可帮助很多人以「零代码」的方式创建个人提效工具、产品原型、可交互页面等。它不仅能生成代码,还可以进行实时预览,局部修改并一键部署,大幅降低了开发的门槛,可以帮助更多人释放创意。
昨晚,终于等到了DeepSeek-R1-0528官宣。升级后的模型性能直逼o3和Gemini 2.5 Pro。如今,DeepSeek真正坐实了全球开源王者的称号,并成为了第二大AI实验室。
万元级机器人要来了,下一站可能就是你家楼下商场。
在人类的认知过程中,视觉思维(Visual Thinking)扮演着不可替代的核心角色,这一现象贯穿于各个专业领域和日常生活的方方面面。
在最新的 LangChain Interrupt 峰会上,AI Fund 创始人吴恩达与 LangChain 联合创始人 Harrison Chase 展开了一场对话。
斯坦福Hazy实验室推出新一代低延迟推理引擎「Megakernel」,将Llama-1B模型前向传播完整融合进单一GPU内核,实现推理时间低于1毫秒。在B200上每次推理仅需680微秒,比vLLM快3.5倍。
AI领域的竞争,远未到鸣金收兵的时刻。
3月时候GPT迎来了一波更新,在文生图、图生图领域带来了巨大更新,而紧接而至的却是一些创业公司的哀嚎:
用AI来升级浏览器的使用体验,对于厂商来说稳赚不赔。
“创业没有静态壁垒,只有动态壁垒。”
近日,NVIDIA 联合香港大学、MIT 等机构重磅推出 Fast-dLLM,以无需训练的即插即用加速方案,实现了推理速度的突破!通过创新的技术组合,在不依赖重新训练模型的前提下,该工作为扩散模型的推理加速带来了突破性进展。本文将结合具体技术细节与实验数据,解析其核心优势。
在人工智能技术风起云涌的当下,量化投资行业正迎来新一轮深刻变革。
主席在《矛盾论》中强调"具体问题具体分析,是Marxism的活的灵魂"。而在AI领域,我们终于有了一个能够践行这一哲学思想的技术框架——MAS-ZERO,帮我们构建能够因地制宜、因时制宜的智能系统。
来自上海人工智能实验室团队的最新成果 Linear-MoE,首次系统性地实现了线性序列建模与 MoE 的高效结合,并开源了完整的技术框架,包括 Modeling 和 Training 两大部分,并支持层间混合架构。为下一代基础模型架构的研发提供了有价值的工具和经验。
七万年前,智能人凭借虚构故事的能力完成了第一次认知革命。 一万年前,农业革命让我们从狩猎采集者变成了农民。 三百年前,科学革命让我们成为了地球的主宰。 而今天,我们正站在第三次认知革命的门槛上——这次,讲故事的不再只是人类。
继陆续改变搜索、电商、家电、汽车等诸多行业后,DeepSeek以及其代表的AI技术正在深入改变资讯客户端。
当别人还在抢流量,快手已经在抢效率了。5月27日,快手发布2025年第一季度财报。其营收同比增长10.9%至326亿元,经调整净利润达46亿元,保持8个季度盈利,经调整净利润率提升至14%。
文章探讨人们对AI生成内容的鉴定行为本质:技术层面无意义,因AI可精准模仿人类风格,而内容价值应取决于质量而非来源。分析鉴定行为源于人类中心主义偏见和社会表演需求,预测未来实质性鉴定将消失,但表演性鉴定会因社交攀比持续存在。
AI独角兽Builder.ai通过虚构技术能力和伪造数据骗取微软、软银等超4.5亿美元投资,最终因营收造假、技术谎言曝光而破产。文章揭露其“AI自动化”实为人工外包的骗局,并列举多个类似伪AI公司案例,提出投资者需警惕“AI包装”,加强技术验证与监管审计。
又有一个 AI Scientist 的论文通过了顶会同行评审。
Context 是一家开发人工智能办公套件的初创公司,于5 月 28 日宣布完成 1100 万美元种子轮融资,由 Lux Capital 领投,高通创投和 General Catalyst 跟投。此轮融资使公司总融资额达到约 1575 万美元,估值达 7000 万美元。
AI建模界的“作弊神器”真的来了!
英伟达赚麻了!AI推理全面爆发,芯片巨头2026财年Q1营收达441亿美元,净利润飙升至188亿美元,双双远超市场预期!
智能体作为当前人工智能的一个重要分支,推动了AI技术的深化和发展。通过模拟生物智能的机制,智能体能够在复杂环境中进行自主决策和行动,提升了AI的应用能力和智能化水平。