AI资讯新闻榜单内容搜索-训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 训练

视听分离SOTA提速6倍！清华发布首个6M高性能模型｜ICLR'26

视听分离SOTA提速6倍！清华发布首个6M高性能模型｜ICLR'26

视听分离SOTA提速6倍！清华发布首个6M高性能模型｜ICLR'26

清华大学团队推出的Dolphin模型突破了「高性能必高能耗」的瓶颈：仅用6M参数（较主流模型减半），通过离散化视觉编码和物理启发的热扩散注意力机制，实现单次推理即可精准分离语音，速度提升6倍以上，在多项基准测试中刷新纪录，为智能助听器、手机等端侧设备部署高清语音分离开辟新路。

来自主题: AI技术研报

8733 点击 2026-02-14 10:28

开源：参考OpenClaw，我们给 Claude Code 加上了轻量化的永久透明记忆

开源：参考OpenClaw，我们给 Claude Code 加上了轻量化的永久透明记忆

开源：参考OpenClaw，我们给 Claude Code 加上了轻量化的永久透明记忆

但考虑到在代码领域，如何做好记忆与检索，相比其他场景又有所不同，因此，基于 memsearch CLI ，我们同时也为Claude Code 做了个永久记忆的 plugin——memsearch ccplugin（可适用所有AI coding软件）。

来自主题: AI技术研报

8238 点击 2026-02-14 10:11

ICLR 2026 | 异常需要定义！中传团队提出开放世界视频异常检测新范式

ICLR 2026 | 异常需要定义！中传团队提出开放世界视频异常检测新范式

ICLR 2026 | 异常需要定义！中传团队提出开放世界视频异常检测新范式

针对这一问题，中国传媒大学媒体融合与传播国家重点实验室的吴晓雨教授团队于 ICLR 2026 发表论文《Language-guided Open-world Video Anomaly Detection under Weak Supervision》，直面 VAD 领域的核心问题 —— 什么是异常？

来自主题: AI技术研报

7963 点击 2026-02-14 10:03

具身智能的「GPT时刻」？高德连发两个全面SOTA的ABot具身基座模型

具身智能的「GPT时刻」？高德连发两个全面SOTA的ABot具身基座模型

具身智能的「GPT时刻」？高德连发两个全面SOTA的ABot具身基座模型

过去几年，大模型把自然语言处理彻底重塑了。GPT 出来之前，NLP 领域的状态是：每个任务一套模型，每个场景一批数据，每个公司一条流水线，互不通用，边界清晰。GPT 之后，这套逻辑被一个预训练底座 + 任务微调的范式整个替换掉了。

来自主题: AI技术研报

6002 点击 2026-02-13 12:02

Loop-ViT：让AI学会「反复思考」，3.8M参数小模型追平人类平均水平

Loop-ViT：让AI学会「反复思考」，3.8M参数小模型追平人类平均水平

Loop-ViT：让AI学会「反复思考」，3.8M参数小模型追平人类平均水平

当我们解一道复杂的数学题或观察一幅抽象图案时，大脑往往需要反复思考、逐步推演。然而，当前主流的深度学习模型却走的是「一次通过」的路线——输入数据，经过固定层数的网络，直接输出答案。

来自主题: AI技术研报

9664 点击 2026-02-13 11:08

我们离Coding领域的「AGI时刻」还有多远？字节跳动Seed发布NL2Repo-Bench仓库级长程代码生成基准

我们离Coding领域的「AGI时刻」还有多远？字节跳动Seed发布NL2Repo-Bench仓库级长程代码生成基准

我们离Coding领域的「AGI时刻」还有多远？字节跳动Seed发布NL2Repo-Bench仓库级长程代码生成基准

在 AI 编程领域，大家似乎正处于一个认知错觉的顶点：随着 Coding Agents 独立完成任务的难度和范围逐渐增加，Coding 领域的 AGI 似乎就可以实现？

来自主题: AI技术研报

9405 点击 2026-02-13 11:06

当 AI，开始设计 AI

当 AI，开始设计 AI

当 AI，开始设计 AI

这不是科幻片，而是 2026 年 2 月刚刚发生的现实。

来自主题: AI资讯

8277 点击 2026-02-12 14:57

ICLR 2026 oral | AI代码真能进生产环境？SwingArena：从「写对代码Commit」到「通过CI审查」

ICLR 2026 oral | AI代码真能进生产环境？SwingArena：从「写对代码Commit」到「通过CI审查」

ICLR 2026 oral | AI代码真能进生产环境？SwingArena：从「写对代码Commit」到「通过CI审查」

过去一年，大模型写代码的能力几乎以肉眼可见的速度提升。从简单脚本到完整功能模块，GPT、Claude、DeepSeek 等模型已经能够在几秒钟内生成看起来相当 “专业” 的代码。

来自主题: AI技术研报

7484 点击 2026-02-12 14:56

千星项目LLMRouter：多模型路由，16+策略优化推理

千星项目LLMRouter：多模型路由，16+策略优化推理

千星项目LLMRouter：多模型路由，16+策略优化推理

UIUC开源的智能模型路由框架LLMRouter可以自动为大模型应用选择最优模型，提供16+路由策略，覆盖单轮选择、多轮协作、个性化偏好和Agent式流程，在性能、成本与延迟间灵活权衡。

来自主题: AI技术研报

9346 点击 2026-02-12 14:55

9B端侧开源模型跑通百万上下文，面壁全新稀疏-线性混合注意力架构SALA立功了！

9B端侧开源模型跑通百万上下文，面壁全新稀疏-线性混合注意力架构SALA立功了！

9B端侧开源模型跑通百万上下文，面壁全新稀疏-线性混合注意力架构SALA立功了！

最强的大模型，已经把scaling卷到了一个新维度：百万级上下文。

来自主题: AI技术研报

10050 点击 2026-02-12 10:35

上一页当前第13页,共422页下一页