AI资讯新闻榜单内容搜索-不

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 不
专抓AI“看图说谎”,谷歌哥大用三类陷阱触发幻觉,打造可随技术发展动态演进的评估框架

专抓AI“看图说谎”,谷歌哥大用三类陷阱触发幻觉,打造可随技术发展动态演进的评估框架

专抓AI“看图说谎”,谷歌哥大用三类陷阱触发幻觉,打造可随技术发展动态演进的评估框架

幻觉(Hallucination),即生成事实错误或不一致的信息,已成为视觉-语言模型 (VLMs)可靠性面临的核心挑战。随着VLMs在自动驾驶、医疗诊断等关键领域的广泛应用,幻觉问题因其潜在的重大后果而备受关注。

来自主题: AI技术研报
8032 点击    2025-03-29 15:36
单张照片生成360°3D场景,支持灵活视角漫游|人大&北师大&字节

单张照片生成360°3D场景,支持灵活视角漫游|人大&北师大&字节

单张照片生成360°3D场景,支持灵活视角漫游|人大&北师大&字节

从单张图像生成灵活视角3D场景的技术来了,在考古保护、自主导航等直接获取3D数据成本高昂或不可行的领域具有重要应用价值。

来自主题: AI技术研报
7782 点击    2025-03-29 14:34
《连线》杂志长文:疯狂追赶OpenAI的2年,谷歌都做了什么?

《连线》杂志长文:疯狂追赶OpenAI的2年,谷歌都做了什么?

《连线》杂志长文:疯狂追赶OpenAI的2年,谷歌都做了什么?

AGI的这两年,基本OpenAI压着谷歌打的两年,包括但不限于谷歌自己的失误、每次发布会的被截胡。比如这次Gemini 2.5 Pro 被 4o图片生成功能抢走了几乎所有关注点。但谷歌确实也在一直追赶,从最开始的措手不及,到现在已经开始有来有往。著名科技杂志《连线》采访了谷歌前和现员工超50人,发布了一篇长文,深度挖掘了谷歌这两年苦苦追赶Openai的内幕故事,

来自主题: AI技术研报
8418 点击    2025-03-29 14:01
被吉卜力刷屏的背后:OpenAI模型行为负责人揭秘GPT-4o新生成策略

被吉卜力刷屏的背后:OpenAI模型行为负责人揭秘GPT-4o新生成策略

被吉卜力刷屏的背后:OpenAI模型行为负责人揭秘GPT-4o新生成策略

最近几天,OpenAI 革新的 GPT-4o 图像功能给大家带来了不少乐趣,各路社交媒体都被「吉卜力」风格的图像、视频刷了屏。机器之心还尝试了制作了《甄嬛传》的名场面(视频如下,制作方法参见《GPT-4o 整活!3 个小时、6 个镜头重现吉卜力版《甄嬛传》名场面》)。

来自主题: AI资讯
8560 点击    2025-03-29 10:01
红杉合伙人:使用数据(Usage)才是 AI 时代的护城河

红杉合伙人:使用数据(Usage)才是 AI 时代的护城河

红杉合伙人:使用数据(Usage)才是 AI 时代的护城河

护城河是所有投资人和创始人都非常关注的一个概念,因为它涉及到企业的长期价值和生死存亡。AI 时代,大家对护城河同样有执念,但是越来越搞不懂什么才是这个时代的护城河了,甚至是否还有护城河都已经是一个问题。

来自主题: AI资讯
8858 点击    2025-03-29 09:45
Anthropic首次切开Claude大脑,「AI黑箱」彻底破解?心算诡异思考过程曝光

Anthropic首次切开Claude大脑,「AI黑箱」彻底破解?心算诡异思考过程曝光

Anthropic首次切开Claude大脑,「AI黑箱」彻底破解?心算诡异思考过程曝光

AI的运作始终笼罩着一层神秘的「黑箱」迷雾。这种不透明让AI有时会「胡说八道」,甚至故意撒谎。Anthropic刚刚推出了一项突破性研究,用类似大脑扫描的技术,深入Claude 3.5 Haiku的「脑子」,揭开了它运行的一些秘密。

来自主题: AI资讯
10746 点击    2025-03-28 17:45
不再折腾!一个癌症患者的AI重生记

不再折腾!一个癌症患者的AI重生记

不再折腾!一个癌症患者的AI重生记

从春晚舞台上的宇树科技人形机器人惊艳亮相,到深度求索(DeepSeek)以“国产ChatGPT”之姿引爆行业,人工智能正以前所未有的速度重塑生活场景。

来自主题: AI资讯
9086 点击    2025-03-28 15:58
大模型不再是路痴!空间推理的答案是RAG:旅游规划、附近推荐全解锁

大模型不再是路痴!空间推理的答案是RAG:旅游规划、附近推荐全解锁

大模型不再是路痴!空间推理的答案是RAG:旅游规划、附近推荐全解锁

Spatial-RAG结合了空间数据库和大型语言模型(LLM)的能力,能够处理复杂的空间推理问题。通过稀疏和密集检索相结合的方式,Spatial-RAG可以高效地从空间数据库中检索出满足用户查询的空间对象,并利用LLM的语义理解能力对这些对象进行排序和生成最终答案。

来自主题: AI技术研报
7711 点击    2025-03-28 15:47
GPT-4o的多模态生图,让整个设计圈都开始emo了。

GPT-4o的多模态生图,让整个设计圈都开始emo了。

GPT-4o的多模态生图,让整个设计圈都开始emo了。

GPT4o的多模态生图前天上线之后。经过两天的发酵,含金量还在不断提升。

来自主题: AI资讯
10461 点击    2025-03-28 15:28