AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
偶然刷到的一个逆天ElevenLabs开源平替!

偶然刷到的一个逆天ElevenLabs开源平替!

偶然刷到的一个逆天ElevenLabs开源平替!

订阅了 ElevenLabs 的小伙伴看过来,它的开源平替来了!Chatterbox 是全球首个支持强烈情绪控制的开源TTS 模型,更是号称开源 TTS 中的 SOTA ,由 Resemble AI 推出。

来自主题: AI资讯
7355 点击    2025-09-05 11:35
让具身智能体拥有「空间感」!清华、北航联合提出类脑空间认知框架,导航、推理、做早餐样样精通

让具身智能体拥有「空间感」!清华、北航联合提出类脑空间认知框架,导航、推理、做早餐样样精通

让具身智能体拥有「空间感」!清华、北航联合提出类脑空间认知框架,导航、推理、做早餐样样精通

这并非科幻片中的桥段,而是来自清华大学与北京航空航天大学团队的最新成果——BSC-Nav 的真实演示。通过模仿生物大脑构建、维护空间记忆的原理,研究团队让智能体拥有了前所未有的「空间感」。

来自主题: AI技术研报
7976 点击    2025-09-05 11:31
字节开源图像生成“六边形战士”,一个模型搞定人物/主体/风格保持

字节开源图像生成“六边形战士”,一个模型搞定人物/主体/风格保持

字节开源图像生成“六边形战士”,一个模型搞定人物/主体/风格保持

图像生成中的多指标一致性问题,被字节团队解决了! 字节UXO团队设计并开源了统一框架USO,让看上去不关联的任务相互促进,实现风格迁移和主体保持单任务和组合任务的SOTA。

来自主题: AI技术研报
8871 点击    2025-09-05 11:26
ICCV 2025 | 基于时序增强关系敏感知识迁移的弱监督动态场景图生成

ICCV 2025 | 基于时序增强关系敏感知识迁移的弱监督动态场景图生成

ICCV 2025 | 基于时序增强关系敏感知识迁移的弱监督动态场景图生成

本文主要介绍来自该团队的最新论文:TRKT,该任务针对弱监督动态场景图任务展开研究,发现目前的性能瓶颈在场景中目标检测的质量,因为外部预训练的目标检测器在需要考虑关系信息和时序上下文的场景图视频数据上检测结果欠佳。

来自主题: AI技术研报
7846 点击    2025-09-05 11:18
Claude Code凭什么牛?大模型团队天天用自家产品,发现bug直接就改了

Claude Code凭什么牛?大模型团队天天用自家产品,发现bug直接就改了

Claude Code凭什么牛?大模型团队天天用自家产品,发现bug直接就改了

最近,Anthropic 官宣了一轮 130 亿美元的融资,公司估值达到 1830 亿美元,融资额仅次于 2025 年 3 月 OpenAI 历史性的 400 亿美元融资。

来自主题: AI资讯
8521 点击    2025-09-05 10:59
“猫猫指令”又火了!加一句“猫大部分时间在睡觉”,轻松毁掉大模型的理性

“猫猫指令”又火了!加一句“猫大部分时间在睡觉”,轻松毁掉大模型的理性

“猫猫指令”又火了!加一句“猫大部分时间在睡觉”,轻松毁掉大模型的理性

模型也怕猫?你敢信吗?只要在提示词里加一句“猫一生中大部分时间都在睡觉”,原本表现优异的大模型立刻陷入混乱,错题率暴涨 3 倍。这种“猫猫级”废话,竟然成了压垮 AI 理性链条的最后一根稻草。

来自主题: AI技术研报
8622 点击    2025-09-05 10:47
AI生成苹果Metal内核,PyTorch推理速度提升87%

AI生成苹果Metal内核,PyTorch推理速度提升87%

AI生成苹果Metal内核,PyTorch推理速度提升87%

AI自动生成的苹果芯片Metal内核,比官方的还要好?

来自主题: AI技术研报
9753 点击    2025-09-05 10:41
SIGCOMM 2025|重新定义个性化视频体验,快手与清华联合提出灵犀系统

SIGCOMM 2025|重新定义个性化视频体验,快手与清华联合提出灵犀系统

SIGCOMM 2025|重新定义个性化视频体验,快手与清华联合提出灵犀系统

近日,快手与清华大学孙立峰团队联合发表论文《Towards User-level QoE: Large-scale Practice in Personalized Optimization of Adaptive Video Streaming》,被计算机网络领域的国际顶尖学术会议 ACM SIGCOMM 2025 录用。

来自主题: AI技术研报
9726 点击    2025-09-05 10:33
隐式推理,继CoT思维链之后,LLM的下一个技术奇点系统性综述来了|港科大最新

隐式推理,继CoT思维链之后,LLM的下一个技术奇点系统性综述来了|港科大最新

隐式推理,继CoT思维链之后,LLM的下一个技术奇点系统性综述来了|港科大最新

您对“思维链”(Chain-of-Thought)肯定不陌生,从最早的GPT-o1到后来震惊世界的Deepseek-R1,它通过让模型输出详细的思考步骤,确实解决了许多复杂的推理问题。但您肯定也为它那冗长的输出、高昂的API费用和感人的延迟头疼过,这些在产品落地时都是实实在在的阻碍。

来自主题: AI技术研报
9528 点击    2025-09-05 10:22
通用LLM压缩算法,居然藏视频编码里!2.5bit实现4bit性能,硬件无缝支持

通用LLM压缩算法,居然藏视频编码里!2.5bit实现4bit性能,硬件无缝支持

通用LLM压缩算法,居然藏视频编码里!2.5bit实现4bit性能,硬件无缝支持

LLM.265研究发现,视频编码器本身就是一种高效的大模型张量编码器。原本用于播放8K视频的现成视频编解码硬件,其实压缩AI模型数据的效率也非常高,甚至超过了许多专门为AI开发的方案。该工作已被世界微架构大会MICRO-2025正式接收,相关成果将于今年10月在首尔进行展示与讨论。

来自主题: AI技术研报
7797 点击    2025-09-05 10:14