AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
AgentIF-OneDay 发布,评估全场景长时复杂任务

AgentIF-OneDay 发布,评估全场景长时复杂任务

AgentIF-OneDay 发布,评估全场景长时复杂任务

随着大模型在单点推理上日益逼近 PhD 水平,Agent 领域迎来了新的分水岭:短程任务表现惊艳,长程任务却显乏力。为精准评估大模型的多模态理解与复杂问题解决能力,红杉中国在两周内连续发布两篇论文,旨在通过构建更科学的评估基准,预判技术演进的未来方向。

来自主题: AI技术研报
8027 点击    2026-01-22 10:06
速递|“新实验室”浪潮汹涌:前OpenAI团队创立的AI公司Applied Compute,13亿美元估值融资在即

速递|“新实验室”浪潮汹涌:前OpenAI团队创立的AI公司Applied Compute,13亿美元估值融资在即

速递|“新实验室”浪潮汹涌:前OpenAI团队创立的AI公司Applied Compute,13亿美元估值融资在即

由三位前 OpenAI 研究人员创立的初创公司 Applied Compute 正就以 13 亿美元估值筹集新资金进行谈判,包括该项投资在内。据透露,该公司致力于帮助企业使用自有数据定制模型。若融资成功,其估值将较不到三个月前公布的上一轮融资( 估值约 5 亿美元 )增长逾一倍。

来自主题: AI资讯
7842 点击    2026-01-21 22:57
中国团队首次在Nature子刊发布医疗AI标准,未来医生MedGPT摘得全球桂冠

中国团队首次在Nature子刊发布医疗AI标准,未来医生MedGPT摘得全球桂冠

中国团队首次在Nature子刊发布医疗AI标准,未来医生MedGPT摘得全球桂冠

中国团队首次在全球顶尖期刊发表“大模型+医疗”领域的相关标准研究! 作为Nature体系中专注于数字医疗的旗舰期刊,《npj Digital Medicine》(JCR影响因子15.1,中科院医学大类1区Top期刊)此次收录的CSEDB研究,首次提出了一套用于评估医疗大模型真实临床能力的系统性框架。

来自主题: AI技术研报
7324 点击    2026-01-21 17:34
中国团队一夜封神,AI出海「全球第一」!曾靠游戏狂赚10亿美金

中国团队一夜封神,AI出海「全球第一」!曾靠游戏狂赚10亿美金

中国团队一夜封神,AI出海「全球第一」!曾靠游戏狂赚10亿美金

大模型卷到第三年,谁在偷偷赚钱?刚刚,一家中国团队,不声不响地拿到了全球第一。它不拼参数、不造模型,却用2.5年跑赢Midjourney,为什么?答案就在它的产品里。

来自主题: AI资讯
9390 点击    2026-01-21 17:28
世界模型+强化学习=具身智能性能翻倍!清华&加州伯克利最新开源

世界模型+强化学习=具身智能性能翻倍!清华&加州伯克利最新开源

世界模型+强化学习=具身智能性能翻倍!清华&加州伯克利最新开源

在具身智能(Embodied AI)的快速发展中,样本效率已成为制约智能体从实验室环境走向复杂开放世界的瓶颈问题。

来自主题: AI技术研报
10072 点击    2026-01-21 16:09
击败GPT、Gemini,复旦×创智孵化创业团队「模思智能」,语音模型上新了

击败GPT、Gemini,复旦×创智孵化创业团队「模思智能」,语音模型上新了

击败GPT、Gemini,复旦×创智孵化创业团队「模思智能」,语音模型上新了

近日,由复旦邱锡鹏担任首席科学家的模思智能发布了多说话人自动语音识别(ASR)模型 MOSS-Transcribe-Diarize,不但可以语音转文字,还可以将音频片段与对话中不同的说话者关联起来,性能超过了 GPT-4o、Gemini、豆包等一众模型。

来自主题: AI资讯
8247 点击    2026-01-21 12:05
Skills也能自进化:Claudeception把你的踩坑经验自动变成Skills |CC直接用

Skills也能自进化:Claudeception把你的踩坑经验自动变成Skills |CC直接用

Skills也能自进化:Claudeception把你的踩坑经验自动变成Skills |CC直接用

这不是一个普通的Skill,而是一把“把经验变成Skill”的工具:Claudeception是一个Meta-Skill,即专门用来“生产技能”的技能。

来自主题: AI技术研报
5668 点击    2026-01-21 12:05