AI资讯新闻榜单内容搜索-Mila

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Mila
算力成本大降!马尔可夫思考机来了,LLM推理成本直接降为线性

算力成本大降!马尔可夫思考机来了,LLM推理成本直接降为线性

算力成本大降!马尔可夫思考机来了,LLM推理成本直接降为线性

Mila 和微软研究院等多家机构的一个联合研究团队却另辟蹊径,提出了一个不同的问题:如果环境从一开始就不会造成计算量的二次级增长呢?他们提出了一种新的范式,其中策略会在基于一个固定大小的状态上进行推理。他们将这样的策略命名为马尔可夫式思考机(Markovian Thinker)。

来自主题: AI技术研报
8133 点击    2025-10-11 11:31
又一推理新范式:将LLM自身视作「改进操作符」,突破长思维链极限

又一推理新范式:将LLM自身视作「改进操作符」,突破长思维链极限

又一推理新范式:将LLM自身视作「改进操作符」,突破长思维链极限

Meta 超级智能实验室、伦敦大学学院、Mila、Anthropic 等机构的研究者进行了探索。从抽象层面来看,他们将 LLM 视为其「思维」的改进操作符,实现一系列可能的策略。研究者探究了一种推理方法家族 —— 并行 - 蒸馏 - 精炼(Parallel-Distill-Refine, PDR),

来自主题: AI技术研报
8086 点击    2025-10-10 10:33
EMNLP 2025 | CARE:无需外部工具,让大模型原生检索增强推理实现上下文高保真

EMNLP 2025 | CARE:无需外部工具,让大模型原生检索增强推理实现上下文高保真

EMNLP 2025 | CARE:无需外部工具,让大模型原生检索增强推理实现上下文高保真

近日,来自 MetaGPT、蒙特利尔大学和 Mila 研究所、麦吉尔大学、耶鲁大学等机构的研究团队发布 CARE 框架,一个新颖的原生检索增强推理框架,教会 LLM 将推理过程中的上下文事实与模型自身的检索能力有机结合起来。该框架现已全面开源,包括训练数据集、训练代码、模型 checkpoints 和评估代码,为社区提供一套完整的、可复现工作。

来自主题: AI技术研报
6735 点击    2025-10-07 22:10
新里程碑!英伟达祭出AI生物模型La-Proteina,解决蛋白质设计最难问题!

新里程碑!英伟达祭出AI生物模型La-Proteina,解决蛋白质设计最难问题!

新里程碑!英伟达祭出AI生物模型La-Proteina,解决蛋白质设计最难问题!

最近,AI霸主英伟达市值突破了4万亿美元,成为全球最重要的股票之一。同样,黄仁勋造就了一个财富奇迹,从不善言辞的工程师,到财富超越巴菲特老爷子。

来自主题: AI资讯
6989 点击    2025-07-17 12:35
264页 Agent 综述!MetaGPT、Mila、斯坦福、耶鲁、谷歌半年共同撰写

264页 Agent 综述!MetaGPT、Mila、斯坦福、耶鲁、谷歌半年共同撰写

264页 Agent 综述!MetaGPT、Mila、斯坦福、耶鲁、谷歌半年共同撰写

,MetaGPT & Mila 联合全球范围内 20 个顶尖研究机构的 47 位学者,共同撰写并发布了长篇综述《Advances and Challenges in Foundation Agents:

来自主题: AI技术研报
11098 点击    2025-04-27 10:41
扩散模型奖励微调新突破:Nabla-GFlowNet让多样性与效率兼得

扩散模型奖励微调新突破:Nabla-GFlowNet让多样性与效率兼得

扩散模型奖励微调新突破:Nabla-GFlowNet让多样性与效率兼得

本文作者刘圳是香港中文大学(深圳)数据科学学院的助理教授,肖镇中是德国马克思普朗克-智能系统研究所和图宾根大学的博士生,刘威杨是德国马克思普朗克-智能系统研究所的研究员,Yoshua Bengio 是蒙特利尔大学和加拿大 Mila 研究所的教授,张鼎怀是微软研究院的研究员。此论文已收录于 ICLR 2025。

来自主题: AI技术研报
7601 点击    2025-04-13 15:49
DeepSeek占比升至9.6%,稳居全球第二!「全球生成式AI行业趋势」发布

DeepSeek占比升至9.6%,稳居全球第二!「全球生成式AI行业趋势」发布

DeepSeek占比升至9.6%,稳居全球第二!「全球生成式AI行业趋势」发布

生成式AI正重塑众多行业格局!传统搜索、网站与自由开发者、教育科技等行业受到冲击。AI对行业变革又有哪些推动作用?答案就在报告中。

来自主题: AI技术研报
5873 点击    2025-03-09 11:49
月流量超千万,中国大厂走出的创始团队做AI视频应用,流量超字节的CapCut

月流量超千万,中国大厂走出的创始团队做AI视频应用,流量超字节的CapCut

月流量超千万,中国大厂走出的创始团队做AI视频应用,流量超字节的CapCut

Similarweb 数据显示,在网站端,过去28天,视频编辑类产品Zeemo和Vizard的日平均访问量均超CapCut,在功能上,Zeemo和CapCut相似度更高,而在商业化范围的广度方面,Vizard的专业性更强。

来自主题: AI资讯
9882 点击    2025-02-11 10:57
从线性注意力视角揭秘视觉Mamba,清华、阿里合作提出全新MILA模型

从线性注意力视角揭秘视觉Mamba,清华、阿里合作提出全新MILA模型

从线性注意力视角揭秘视觉Mamba,清华、阿里合作提出全新MILA模型

Mamba 是一种具有线性计算复杂度的状态空间模型,它能够以线性计算复杂度实现对输入序列的有效建模,在近几个月受到了广泛的关注。

来自主题: AI技术研报
7310 点击    2024-12-11 09:33