AI资讯新闻榜单内容搜索-工智能

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 工智能
谷歌AlphaFold得了诺奖,但DeepMind根本没引用前人论文?

谷歌AlphaFold得了诺奖,但DeepMind根本没引用前人论文?

谷歌AlphaFold得了诺奖,但DeepMind根本没引用前人论文?

AlphaFold夺诺奖引争议!2016年,一位博士生在NeurIPS提出的研究,或许正是AlphaFold的「原型」。如今,导师Daniel Cremers发声,质问为何DeepMind忽略这项研究、不加以引用?

来自主题: AI技术研报
6971 点击    2025-07-21 10:53
AI“压力面”,DeepSeek性能暴跌近30% | 清华&上海AI Lab

AI“压力面”,DeepSeek性能暴跌近30% | 清华&上海AI Lab

AI“压力面”,DeepSeek性能暴跌近30% | 清华&上海AI Lab

给AI一场压力测试,结果性能暴跌近30%。 来自上海人工智能实验室、清华大学和中国人民大学的研究团队设计了一个全新的“压力测试”框架——REST (Reasoning Evaluation through Simultaneous Testing)。

来自主题: AI技术研报
8127 点击    2025-07-21 10:44
Nature刊文称“AI可模拟人类心智”,Science同日强烈质疑

Nature刊文称“AI可模拟人类心智”,Science同日强烈质疑

Nature刊文称“AI可模拟人类心智”,Science同日强烈质疑

7月2日,一个跨国团队在Nature杂志发表了一项开创性研究,宣称其推出的AI系统能够“模拟人类心智”。该系统在实验中可以“扮演”人类,生成逼真的人类行为。

来自主题: AI技术研报
8115 点击    2025-07-21 10:40
AI 对齐了人的价值观,也学会了欺骗

AI 对齐了人的价值观,也学会了欺骗

AI 对齐了人的价值观,也学会了欺骗

今年 5 月,有研究者发现 OpenAI 的模型 o3 拒绝听从人的指令,不愿意关闭自己,甚至通过篡改代码避免自动关闭。类似事件还有,当测试人员暗示将用新系统替换 Claude Opus 4 模型时,模型竟然主动威胁程序员,说如果你换掉我,我就把你的个人隐私放在网上,以阻止自己被替代。

来自主题: AI资讯
6205 点击    2025-07-21 10:35
大模型再爆弱点!旧记忆忘不掉,新记忆分不出,准确率暴降 | ICML'25

大模型再爆弱点!旧记忆忘不掉,新记忆分不出,准确率暴降 | ICML'25

大模型再爆弱点!旧记忆忘不掉,新记忆分不出,准确率暴降 | ICML'25

大模型有苦恼,记性太好,无法忘记旧记忆,也区分不出新记忆!基于工作记忆的认知测试显示,LLM的上下文检索存在局限。在一项人类稳定保持高正确率的简单检索任务中,模型几乎一定会混淆无效信息与正确答案。

来自主题: AI技术研报
5220 点击    2025-07-21 10:27
人工智能首次主导北约防空测试

人工智能首次主导北约防空测试

人工智能首次主导北约防空测试

据外媒报道,北约近期完成首次由人工智能(AI)主导的防空测试。结果显示,AI系统在预警时效、信息处理和拦截效率等方面的表现,均优于同等条件下的人工操作。分析人士表示,近段时间以来,北约成员国在AI军事化应用领域动作频繁,相关动向值得关注。

来自主题: AI资讯
6935 点击    2025-07-21 09:44
「DeepSeek二代」来袭!数学暴击o3,英伟达开源LLM登顶

「DeepSeek二代」来袭!数学暴击o3,英伟达开源LLM登顶

「DeepSeek二代」来袭!数学暴击o3,英伟达开源LLM登顶

基于Qwen2.5架构,采用DeepSeek-R1-0528生成数据,英伟达推出的OpenReasoning-Nemotron模型,以超强推理能力突破数学、科学、代码任务,在多个基准测试中创下新纪录!数学上,更是超越了o3!

来自主题: AI资讯
7653 点击    2025-07-20 23:43
国内首批!理想汽车荣首批汽车生成式人工智能安全测评认证

国内首批!理想汽车荣首批汽车生成式人工智能安全测评认证

国内首批!理想汽车荣首批汽车生成式人工智能安全测评认证

理想汽车车载大模型荣获由CCIA汽车网络安全工作委员会颁发的《生成内容安全测评证书》,及人工智能生成合成内容标识服务平台颁发的《生成合成内容标识报告》,成为国内首批通过GB/T 45654、GB 45438-2025双国标认证的车企

来自主题: AI资讯
7340 点击    2025-07-20 23:02
ChatGPT Agent遭暴击,国产AI轮番“公开处刑”

ChatGPT Agent遭暴击,国产AI轮番“公开处刑”

ChatGPT Agent遭暴击,国产AI轮番“公开处刑”

OpenAI推出ChatGPT agent引发国产Agent竞品(如Manus、Genspark)公开对比,声称自身更优。实测退休计划任务显示,ChatGPT输出简陋,仅20分钟完成简易PPT;而Kimi报告详尽并互动提问,Minimax多格式输出,Manus快速设计美观。ChatGPT仅功能整合,非革命性升级,但标志AI从问答向任务执行协作转型。

来自主题: AI资讯
5774 点击    2025-07-20 12:52