AI资讯新闻榜单内容搜索-Arc

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Arc
Gemini准确率从21%飙到97%!谷歌只用了这一招:复制粘贴

Gemini准确率从21%飙到97%!谷歌只用了这一招:复制粘贴

Gemini准确率从21%飙到97%!谷歌只用了这一招:复制粘贴

简单到难以置信!近日,Google Research一项新研究发现:想让大模型在不启用推理设置时更准确,只需要把问题复制粘贴再说一遍,就能把准确率从21.33%提升到97.33%!

来自主题: AI技术研报
8981 点击    2026-01-18 14:58
解锁任意步数文生图,港大&Adobe全新Self-E框架学会自我评估

解锁任意步数文生图,港大&Adobe全新Self-E框架学会自我评估

解锁任意步数文生图,港大&Adobe全新Self-E框架学会自我评估

香港大学(The University of Hong Kong)与 Adobe Research 联合发布 Self-E(Self-Evaluating Model):一种无需预训练教师蒸馏、从零开始训练的任意步数文生图框架。其目标非常直接:让同一个模型在极少步数也能生成语义清晰、结构稳定的图像,同时在 50 步等常规设置下保持顶级质量,并且随着步数增加呈现单调提升。

来自主题: AI技术研报
8057 点击    2026-01-18 14:57
视觉模型既懂语义,又能还原细节,南洋理工&商汤提出棱镜假说

视觉模型既懂语义,又能还原细节,南洋理工&商汤提出棱镜假说

视觉模型既懂语义,又能还原细节,南洋理工&商汤提出棱镜假说

作者来自 Nanyang Technological University(MMLab) 与 SenseTime Research,提出 Prism Hypothesis(棱镜假说) 与 Unified Autoencoding(UAE),尝试用 “频率谱” 的统一视角,把语义编码器与像素编码器的表示冲突真正 “合并解决”。

来自主题: AI技术研报
9706 点击    2026-01-15 09:20
AI医疗,最正宗的十家公司!

AI医疗,最正宗的十家公司!

AI医疗,最正宗的十家公司!

据Grand View Research报告,2024年全球AI医疗市场规模约为266.5亿美元(约合人民币1861亿元),预计到2033年将飙升至约5055.9亿美元(约合人民币3.5万亿元),年复合增长率达38.8%。

来自主题: AI资讯
9430 点击    2026-01-11 21:42
GPT-5.2考赢人类!OpenAI警告:大模型能力已过剩,AGI天花板不是AI

GPT-5.2考赢人类!OpenAI警告:大模型能力已过剩,AGI天花板不是AI

GPT-5.2考赢人类!OpenAI警告:大模型能力已过剩,AGI天花板不是AI

刚刚,GPT-5.2刷新了一项新纪录!OpenAI联合创始人Greg Brockman发帖称使用GPT-5.2在ARC-AGI-2基准测试上,表现超过了人类基线水平。

来自主题: AI资讯
9706 点击    2026-01-11 10:10
信息论证明,小模型跑在本地才是Agent的终极解法|斯坦福重磅

信息论证明,小模型跑在本地才是Agent的终极解法|斯坦福重磅

信息论证明,小模型跑在本地才是Agent的终极解法|斯坦福重磅

在近一年里,Agentic System(代理系统/智能体系统)正变得无处不在。从Open AI的Deep Research到Claude Code,我们看到越来越多的系统不再依赖单一模型,而是通过多模型协作来完成复杂的长窗口任务。

来自主题: AI技术研报
8424 点击    2026-01-04 10:20
0.002美元撬动顶级研究力,开源AI助手匹敌OpenAI商用系统

0.002美元撬动顶级研究力,开源AI助手匹敌OpenAI商用系统

0.002美元撬动顶级研究力,开源AI助手匹敌OpenAI商用系统

近日,美国华盛顿大学博士生邵如琳和合作团队打造出一个名为 Deep Research Tulu(DR Tulu)的深度研究小助手。使用一次 OpenAI 的 Deep Research 服务可能需要大约 1.8 美元,而 DR Tulu 使用一次的成本却不到 0.002 美元,这几乎是千倍的效率提升,这意味着未来个人或者小团队也能负担得起高质量、高可信度的 AI 研究服务。

来自主题: AI资讯
7618 点击    2026-01-02 15:04
系统学习Deep Research,这一篇综述就够了

系统学习Deep Research,这一篇综述就够了

系统学习Deep Research,这一篇综述就够了

近年来,大模型的应用正从对话与创意写作,走向更加开放、复杂的研究型问题。尽管以检索增强生成(RAG)为代表的方法缓解了知识获取瓶颈,但其静态的 “一次检索 + 一次生成” 范式,难以支撑多步推理与长期

来自主题: AI技术研报
7159 点击    2026-01-02 15:01
奥特曼摊牌:别再比模型跑分了,苹果才是真宿敌

奥特曼摊牌:别再比模型跑分了,苹果才是真宿敌

奥特曼摊牌:别再比模型跑分了,苹果才是真宿敌

别被 2025 年的模型乱战骗了!这可能是一个巨大的误判。 LifeArchitect在上帝视角复盘:当下的喧嚣不过是爆发前的「基建期」。 到2026年,从6T规模的Grok-5到消失在后台的GPT-6,全行业正迎来一场蓄谋已久的「集体解锁」。 真正的换代不再是变聪明,而是像iPhone焊死iOS那样,让AI彻底成为文明的基础设施。

来自主题: AI资讯
9536 点击    2025-12-29 09:04
比 Gemini 更严谨,比 GPT 更靠谱:谷歌这个隐藏功能,太强了!

比 Gemini 更严谨,比 GPT 更靠谱:谷歌这个隐藏功能,太强了!

比 Gemini 更严谨,比 GPT 更靠谱:谷歌这个隐藏功能,太强了!

今天,我想以一个 AI 实战派的身份,再次向大家推荐我目前心中“信息核查”的 No.1 工具——Google 搜索 AI 模式(Google Search AI Mode)。为什么是它?Gemini / ChatGPT 们做不到吗?

来自主题: AI资讯
8495 点击    2025-12-27 22:15