
谷歌版小钢炮开源!0.27B大模型,4个注意力头,专为终端而生
谷歌版小钢炮开源!0.27B大模型,4个注意力头,专为终端而生谷歌开源Gemma 3 270M闪亮登场!只需几分钟即可完成微调,指令遵循和文本结构化能力更是惊艳,性能超越Qwen 2.5同级模型。
谷歌开源Gemma 3 270M闪亮登场!只需几分钟即可完成微调,指令遵循和文本结构化能力更是惊艳,性能超越Qwen 2.5同级模型。
前沿 AI 模型真的能做到博士级推理吗? 前段时间,谷歌、OpenAI 的模型都在数学奥林匹克(IMO)水平测试中达到了金牌水准,这样的表现让人很容易联想到 LLM 是不是已经具备了解决博士级科研难题的推理能力?
无需人工标注,吞下17亿张图片,Meta用自监督学习炼出「视觉全能王」!NASA已将它送上火星,医疗、卫星、自动驾驶领域集体沸腾。
首个开源多模态Deep Research Agent来了。整合了网页浏览、图像搜索、代码解释器、内部 OCR 等多种工具,通过全自动流程生成高质量推理轨迹,并用冷启动微调和强化学习优化决策,使模型在任务中能自主选择合适的工具组合和推理路径。
加拿大AI新贵Cohere获5亿美元融资、估值68亿美元,前Meta FAIR副总裁、PyTorch与Llama重要推手Joelle Pineau加盟出任首席AI官,或将开启企业AI新战局。
随手拍的一张图,就能秒变3A级游戏大作?! 刚刚,腾讯全新开源游戏视频生成框架Hunyuan-GameCraft,专为游戏环境设计,让任何人都能轻松搞定游戏制作。
10亿用户App转向AI原生应用,大船如何掉头?高德最近打了个样,用AI重构底层技术栈,建立主-从Agent架构,将千问大模型与空间智能结合,展现出了新范式的强大威力,给用户带去了极大便利。
给 Sam 的专业建议:直播选人要小心。 大家都是老朋友,在新 Lab 聚首了。
GPT-5发布以来,路由架构是最受关心的部分之一。它不仅实现了多个模型统一调度,而且还藏着奥特曼的诸多小心思。比如成本更可控、悄悄识别意图插入广告等。
短短两个月前,我们还在感叹 31 家 AI 小团队的高效表现,当时团队平均规模仅 20 人,人均创造收入高达 279 万美元(参见《细数 31 家 AI 应用小团队,平均 20 人、人均创收 279 万美元》)。
疯狂的七月已经落下了帷幕,如果用一个词来形容国产大模型,「开源」无疑是当之无愧的高频词汇。
当大模型在代码世界封神时,一场硬件领域的新战役也在打响——如何让 AI 在物理世界「动手」。这场攻坚战的突破速度比预想快一些,Physical AI 的可行性轮廓已然变得更为清晰。
和马斯克一起创业的人到现在已经离开了四分之一。 2023 年 7 月 12 日,马斯克和其余 11 位联合创始人宣布成立了 xAI,带着「理解宇宙」的使命强势进军 AI 行业。
我们越来越接近AGI——至少看起来是这样。时间表从50年压缩到5年,更有大佬预测2026、2028年。可与此同时,AI在ARC测试的得分却是0%,在人类基本能力上依然像个新手。我们是不是太早以为,它已经准备好了?
服装视频广告太烧钱?卡点变装太难拍? 字节跳动智能创作团队联合清华大学最新推出一款全能的视频换装模型 DreamVVT,为视频虚拟试穿领域带来了突破性进展。
在OpenAI内部,有一个被称为北极星的梦想:让AI成为陪伴每个人一生的良师益友,从而实现真正的教育公平。OpenAI将ChatGPT视为一个致力于弥合教育鸿沟、赋能全球6亿用户的学习平台。
OpenAI 在 AI 领域引领了一波又一波浪潮,想必很多人好奇,这些创新背后的研究人员是如何通过面试的? 尤其是现在,OpenAI 已经成为全球最受瞩目的 AI 公司之一,吸引了无数顶尖人才投递简历。想要加入这个团队,着实不容易。
思维链 (CoT) 提示技术常被认为是让大模型分步思考的关键手段,通过在输入中加入「Let’s think step by step」等提示,模型会生成类似人类的中间推理步骤,显著提升复杂任务的表现。然而,这些流畅的推理链条是否真的反映了模型的推理能力?
GPT-5一上线,用户瞬间破防——太冷漠,太爹味,还我GPT-4o!就在刚刚,奥特曼彻底滑跪了,宣布GPT-4o满血复活,重回默认模型宝座。从曾经的遭人唾弃,到今日的白月光回归,ChatGPT的用户们给奥特曼结结实实上了一课。
印度音频连续剧平台Pocket FM 致力于成为音频界的 Netflix。该公司计划根据用户喜好,为其匹配拥有数百集内容的音频剧集。为实现这一目标,平台需要快速发布内容——这正是其目前借助 AI 技术发力的方向。
在生成式 AI 时代,全球数据总量正以惊人速度增长,据 IDC 预测,2025 年将突破 180ZB,其中 80% 为非结构化内容,传统数据分析在应对多模态信息和打破结构化数据技术壁垒方面尽显乏力,“人工找数 + 手动分析” 的模式严重抑制甚至沉没了数据价值。
Anthropic 已收购 Humanloop 的联合创始人和大部分团队成员,该公司是一个专注于提示管理、LLM 评估和可观测性的平台,此举旨在强化其企业战略。
量子计算领域新里程碑,刷新世界纪录! 潘建伟团队利用AI技术,在60毫秒内成功构建多达2024个原子的无缺陷二维和三维原子阵列,刷新了中性原子体系无缺陷原子阵列规模的世界纪录。
8月6日,谷歌正式发布编程智能体Jules,摘掉了「测试版」标签。Jules具备异步执行能力,依托Gemini2.5Pro模型,可独立修复Bug、更新代码并深度集成GitHub,大幅提升开发效率。
AI图像的水印技术要变天了!一款全新的去水印技术——UnMarker,能在5分钟内去除市面上几乎所有的AI图像水印。
你是不是也有这种感觉——iPhone 虽然年年更新,但在 AI 时代,苹果好像慢了半拍?先别急,在苹果秋季发布会靠近时,苹果内部正在掀起另一套关乎 AI 的硬件革命。
用过 DeepSeek-R1 等推理模型的人,大概都遇到过这种情况:一个稍微棘手的问题,模型像陷入沉思一样长篇大论地推下去,耗时耗算力,结果却未必靠谱。现在,我们或许有了解决方案。
AI大模型的秘密配方是什么?答案可能很简单:海量的“盗版内容”。
近半年,Agentic AI 创新步伐明显加快。更强的自主决策、更丰富的多模态融合,以及与外部系统的深度协作,正推动产品加速落地与商业化。
在复杂的城市场景中,HERMES 不仅能准确预测未来三秒的车辆与环境动态(如红圈中标注的货车),还能对当前场景进行深度理解和问答(如准确识别出 “星巴克” 并描述路况)。