o3/o4-mini幻觉暴增2-3倍!OpenAI官方承认暂无法解释原因
o3/o4-mini幻觉暴增2-3倍!OpenAI官方承认暂无法解释原因OpenAI新模型发布后,大家体感都幻觉更多了。甚至有人测试后发出预警:使用它辅助编程会很危险。当大家带着疑问仔细阅读System Card,发现OpenAI官方也承认了这个问题,与o1相比o3幻觉率是两倍,o4-mini更是达到3倍。
OpenAI新模型发布后,大家体感都幻觉更多了。甚至有人测试后发出预警:使用它辅助编程会很危险。当大家带着疑问仔细阅读System Card,发现OpenAI官方也承认了这个问题,与o1相比o3幻觉率是两倍,o4-mini更是达到3倍。
o3编码直逼全球TOP 200人类选手,却存在一个致命问题:幻觉率高达33%,是o1的两倍。Ai2科学家直指,RL过度优化成硬伤。
鲜为人知的是,目前国内超过60%的AI应用,包括DeepSeek的C端应用,联网搜索能力是通过集成博查AI的Search API实现的。大模型需要通过这类API,才能够动态获取最新信息,并输出给用户。AI搜索和传统搜索在入口端的界面上非常相似,底层技术和最终返回给用户的体验却截然不同。
具身智能的突破离不开高质量数据。目前,具身合成数据有两条主要技术路线之争:“视频合成+3D重建”or “端到端3D生成”。英伟达在CES 2025指出“尚无互联网规模的机器人数据”,自动驾驶已具备城市级仿真,但家庭等复杂室内环境缺乏3D合成平台。
这家名为Nirvana的美国初创公司,成立于2021年,正专注于用AI为卡车提供保险服务。简单来说,就是利用实时驾驶远程信息处理,结合卡车200亿英里(约322亿公里)的驾驶数据,帮卡车司机制定和管理保险。
Nemotron-H模型混合了Transformer和Mamba架构,使长文本推理速度提升3倍,同时还能保持高性能,开源版本包括8B和56B尺寸。训练过程采用FP8训练和压缩技术,进一步提高了20%推理速度
今年3月,阿里巴巴旗下淘天有限公司发文,正式启动2026届春季实习生全球招聘活动。该次招聘开放七大职类,提供超50个不同岗位。此前,阿里巴巴集团CEO吴泳铭曾宣布,未来三年将投入超过3800亿元用于建设云和AI硬件基础设施。2月27日,阿里巴巴启动2026届春季实习生招聘,开放的3000多个岗位中,AI相关岗位占到了五成。
谷歌 Gemma 3 上线刚刚过去一个月,现在又出新版本了。
据外媒报道,OpenAI 正计划以约 30 亿美元收购 AI 编码助手初创公司 Windsurf(前身为 Codeium),以进一步完善其在全栈编码领域的技术布局。
AI智商再创新高!OpenAI o3以惊人的136分刷新门萨智商测试纪录,超越不久前登顶的Gemini 2.5 Pro。更令人瞩目的是其强大的图像理解能力:仅凭一张无EXIF信息的菜单或风景照,o3就能精准推理并反向定位拍摄地点,引发了用AI玩「照片寻址(GeoGuessr)」的新热潮。