AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
全球最强开源「定理证明器」出世!十位华人核心,8B暴击671B DeepSeek

全球最强开源「定理证明器」出世!十位华人核心,8B暴击671B DeepSeek

全球最强开源「定理证明器」出世!十位华人核心,8B暴击671B DeepSeek

迄今为止最强大的开源定理证明器登场!Goedel-Prover-V2仅用8B参数击败671B的DeepSeek-Prover,并再次夺下数学PutnamBench冠军。十位核心贡献者,八大顶尖机构,让AI形式化证明再破纪录。

来自主题: AI资讯
7463 点击    2025-07-18 13:24
500美元刷新SOTA!训练成本砍到1/200,华人团队重构视频生成范式

500美元刷新SOTA!训练成本砍到1/200,华人团队重构视频生成范式

500美元刷新SOTA!训练成本砍到1/200,华人团队重构视频生成范式

你可能听说过OpenAI的Sora,用数百万视频、千万美元训练出的AI视频模型。 但你能想象,有团队只用3860段视频、不到500美元成本,也能在关键任务上做到SOTA?

来自主题: AI技术研报
7710 点击    2025-07-18 13:13
大模型转行土木工程!首个「打灰人」评估基准:检验读、改工程图纸能力

大模型转行土木工程!首个「打灰人」评估基准:检验读、改工程图纸能力

大模型转行土木工程!首个「打灰人」评估基准:检验读、改工程图纸能力

首个工程自动化任务评估基准DrafterBench,可用于测试大语言模型在土木工程图纸修改任务中的表现。通过模拟真实工程命令,全面考察模型的结构化数据理解、工具调用、指令跟随和批判性推理能力,研究结果发现当前主流大模型虽有一定能力,但整体水平仍不足以满足工程一线需求。

来自主题: AI技术研报
6839 点击    2025-07-18 12:58
ChatGPT还没学会打电话,谷歌搜索AI已经替你电话约服务,还会谈价砍单!

ChatGPT还没学会打电话,谷歌搜索AI已经替你电话约服务,还会谈价砍单!

ChatGPT还没学会打电话,谷歌搜索AI已经替你电话约服务,还会谈价砍单!

谷歌搜索迎来三大AI革新:集成最强Gemini 2.5 Pro模型、Deep Search功能随便用、最引人注目的是AI代打电话功能。目前功能在美国上线,未来将全球推广。

来自主题: AI资讯
7117 点击    2025-07-18 12:15
当 AI 学会“为我代言”:Second Me 如何重新定义数字时代的身份主权

当 AI 学会“为我代言”:Second Me 如何重新定义数字时代的身份主权

当 AI 学会“为我代言”:Second Me 如何重新定义数字时代的身份主权

2025 年初,AI 应用领域出现了一个引人注目的转折点 —— 个人 AI 分身从实验室走向大规模应用。与以往的虚拟助手或聊天机器人不同,大家对新一代数字分身的预期是开始承担实质性的社交和工作职能:代替本人参加次要会议、维护社交关系、甚至进行创意协作。

来自主题: AI资讯
6987 点击    2025-07-18 12:10
「有望成为Transformer杀手」,谷歌DeepMind新架构MoR实现两倍推理速度

「有望成为Transformer杀手」,谷歌DeepMind新架构MoR实现两倍推理速度

「有望成为Transformer杀手」,谷歌DeepMind新架构MoR实现两倍推理速度

大型语言模型已展现出卓越的能力,但其部署仍面临巨大的计算与内存开销所带来的挑战。随着模型参数规模扩大至数千亿级别,训练和推理的成本变得高昂,阻碍了其在许多实际应用中的推广与落地。

来自主题: AI技术研报
7566 点击    2025-07-18 11:58
免剪辑直出!AI生成多角色同框对话视频,动态路由精准绑定音频

免剪辑直出!AI生成多角色同框对话视频,动态路由精准绑定音频

免剪辑直出!AI生成多角色同框对话视频,动态路由精准绑定音频

Bind-Your-Avatar是一个基于扩散Transformer(MM-DiT)的框架,通过细粒度嵌入路由将语音与角色绑定,实现精准的音画同步,并支持动态背景生成。该框架还引入了首个针对多角色对话视频生成的数据集MTCC和基准测试,实验表明其在身份保真和音画同步上优于现有方法。

来自主题: AI技术研报
8094 点击    2025-07-18 11:44
AI编程,LLM会写代码,但“不懂”代码,来自两篇顶级研究的“人机协作避坑指南”

AI编程,LLM会写代码,但“不懂”代码,来自两篇顶级研究的“人机协作避坑指南”

AI编程,LLM会写代码,但“不懂”代码,来自两篇顶级研究的“人机协作避坑指南”

从Cursor到Claude Code和最近很火的Kiro,AI编程能在几秒钟内生成完整的函数,但它真的理解代码在做什么吗?最近两项突破性研究发现了一个让人意外的结果:现在的AI虽然"会写",但还远没有"真懂"。

来自主题: AI技术研报
9365 点击    2025-07-18 11:24
K2发布后,Kimi 研究员集体在X和知乎上搞起了“团建”

K2发布后,Kimi 研究员集体在X和知乎上搞起了“团建”

K2发布后,Kimi 研究员集体在X和知乎上搞起了“团建”

imi K2的发布几乎没什么预兆。 2025年7月11日深夜,月之暗面直接开源了这个万亿参数模型,整个AI圈子一下子就热闹起来。模型的能力很强

来自主题: AI资讯
10221 点击    2025-07-18 11:18