AI资讯新闻榜单内容搜索-编程

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 编程
o3/o4-mini幻觉暴增2-3倍!OpenAI官方承认暂无法解释原因

o3/o4-mini幻觉暴增2-3倍!OpenAI官方承认暂无法解释原因

o3/o4-mini幻觉暴增2-3倍!OpenAI官方承认暂无法解释原因

OpenAI新模型发布后,大家体感都幻觉更多了。甚至有人测试后发出预警:使用它辅助编程会很危险。当大家带着疑问仔细阅读System Card,发现OpenAI官方也承认了这个问题,与o1相比o3幻觉率是两倍,o4-mini更是达到3倍。

来自主题: AI资讯
9056 点击    2025-04-21 13:42
杀疯了!Gemini 2.5狂飙「高尔顿板」测试,编码横扫所有OpenAI模型

杀疯了!Gemini 2.5狂飙「高尔顿板」测试,编码横扫所有OpenAI模型

杀疯了!Gemini 2.5狂飙「高尔顿板」测试,编码横扫所有OpenAI模型

谷歌的AI编码能力正在掀起一场风暴!在高尔顿板测试中,Gemini 2.5 Flash以惊艳表现击败OpenAI多款模型,连谷歌首席科学家Jeff Dean都为其点赞。谷歌新模型「dayhush」已在网页开发领域崭露头角,性能超越Gemini 2.5 Pro,被网友称为「AI编码的地震性突破」。

来自主题: AI资讯
7618 点击    2025-04-21 11:54
OpenAI CFO重磅曝料:AGI近在咫尺,全球最强编程智能体已就绪!

OpenAI CFO重磅曝料:AGI近在咫尺,全球最强编程智能体已就绪!

OpenAI CFO重磅曝料:AGI近在咫尺,全球最强编程智能体已就绪!

OpenAI首席财务官Sarah Friar探讨了通往AGI的发展路径,目前OpenAI已到达第三阶段:智能体(Agent)。除Operator和深度研究Deep Research智能体外,OpenAI即将发布全球最强编程智能体。

来自主题: AI资讯
9353 点击    2025-04-20 21:58
Cursor 额度用完了?不存在的,一招教你薅到底。

Cursor 额度用完了?不存在的,一招教你薅到底。

Cursor 额度用完了?不存在的,一招教你薅到底。

想必各位开发者、产品经理或一些有想法的非程序员人士,已经使用了 Cursor 来协助完成一些开发任务,但是由于额度和有效期的问题,每次刚学会几招 Cursor 的使用方式,就用不了了。

来自主题: AI资讯
9901 点击    2025-04-18 15:04
o3全网震撼实测:AGI真来了?最强氛围编程秒杀人类,却被曝捏造事实

o3全网震撼实测:AGI真来了?最强氛围编程秒杀人类,却被曝捏造事实

o3全网震撼实测:AGI真来了?最强氛围编程秒杀人类,却被曝捏造事实

OpenAI新模型全网实测惊艳来袭!o3缩放图像被玩疯,o4-mini速解Project Euler,碾压人类。AI初创CEO说,OpenAI凭此一役已经重回榜首,甚至有经济学家直言AGI已经来临!

来自主题: AI资讯
10426 点击    2025-04-17 14:49
OpenAI开源超火Agent,5小时破5000颗星,霸榜Github

OpenAI开源超火Agent,5小时破5000颗星,霸榜Github

OpenAI开源超火Agent,5小时破5000颗星,霸榜Github

在今天凌晨1点的产品发布中,OpenAI还开源了一个终端轻量级代码Agent智能体——Codex CLI。

来自主题: AI资讯
7620 点击    2025-04-17 11:04