AI资讯新闻榜单内容搜索-LiT

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: LiT
ICLR 2026 | ESC — 解构一步生成,厘清细节,探寻本质

ICLR 2026 | ESC — 解构一步生成,厘清细节,探寻本质

ICLR 2026 | ESC — 解构一步生成,厘清细节,探寻本质

近期,基于捷径化概率流路径(shortcut probability flow trajectory)并从头训练的一步扩散生成模型,展现出强大的实证有效性。然而,这类方法的提出通常建立在较为复杂的理论推导之上,并且往往与具体实现细节高度耦合。这带来一个直接的问题:究竟哪些设计是方法成立的本质要素,哪些又只是可以灵活替换的实现组件。

来自主题: AI技术研报
7333 点击    2026-03-24 17:19
突破一亿Token极限:EverMind提出MSA架构,实现大模型高效端到端长时记忆

突破一亿Token极限:EverMind提出MSA架构,实现大模型高效端到端长时记忆

突破一亿Token极限:EverMind提出MSA架构,实现大模型高效端到端长时记忆

人的智能能力主要由推理能力和长期记忆能力构成。近年来,大模型的推理能力一直处于快速发展过程,但大模型的长期记忆能力一直受限于上下文长度,无法取得突破。在历史上,曾经有多种路线进行尝试,但都无法突破扩展性(Scalability)、精度(Precision)和效率(Efficiency)的不可能三角。

来自主题: AI技术研报
9894 点击    2026-03-19 17:02
谷歌、OpenAI同日发布模型,一个最快最具性价比,一个主打「人情味」

谷歌、OpenAI同日发布模型,一个最快最具性价比,一个主打「人情味」

谷歌、OpenAI同日发布模型,一个最快最具性价比,一个主打「人情味」

深夜,两大科技巨头谷歌和 OpenAI 硬刚起来,相继推出了新版本大模型,分别是 Gemini 3.1 Flash-Lite、GPT‑5.3 Instant。

来自主题: AI资讯
6463 点击    2026-03-04 14:37
DeepSeek V4 更多细节曝光,最快下周发布

DeepSeek V4 更多细节曝光,最快下周发布

DeepSeek V4 更多细节曝光,最快下周发布

科技账号 Legit 率先披露,V4 的轻量版本代号为「sealion-lite(海狮轻量版)」,目前已在至少一家推理服务商处展开内测,相关方均签署了严格的保密协议。

来自主题: AI资讯
9856 点击    2026-02-26 10:37
大模型哪里出问题、怎么修,这篇可解释性综述一次讲清

大模型哪里出问题、怎么修,这篇可解释性综述一次讲清

大模型哪里出问题、怎么修,这篇可解释性综述一次讲清

过去几年,机制可解释性(Mechanistic Interpretability)让研究者得以在 Transformer 这一 “黑盒” 里追踪信息如何流动、表征如何形成:从单个神经元到注意力头,再到跨层电路。但在很多场景里,研究者真正关心的不只是 “模型为什么这么答”,还包括 “能不能更稳、更准、更省,更安全”。

来自主题: AI技术研报
10885 点击    2026-01-28 10:13
AI编程独角兽Replit即将完成4亿元巨额融资,估值达到90亿美元,3个月估值翻3倍

AI编程独角兽Replit即将完成4亿元巨额融资,估值达到90亿美元,3个月估值翻3倍

AI编程独角兽Replit即将完成4亿元巨额融资,估值达到90亿美元,3个月估值翻3倍

今天,据彭博社报道,美国Vibe Coding(氛围编程)独角兽Replit即将完成一笔新的融资交易,计划筹集大约4亿美元(约合人民币27.87亿元)的资金,其投后估值或将达到约90亿美元(约合人民币627.15亿元),大约是上轮融资时估值的3倍。

来自主题: AI资讯
9447 点击    2026-01-16 20:05
路线图彻底失效了!Replit CEO曝自家核心模型;除了写代码和客服,其他Agent都是玩具!回应误删数据库风波;要想赢得持续发布“烂产品”

路线图彻底失效了!Replit CEO曝自家核心模型;除了写代码和客服,其他Agent都是玩具!回应误删数据库风波;要想赢得持续发布“烂产品”

路线图彻底失效了!Replit CEO曝自家核心模型;除了写代码和客服,其他Agent都是玩具!回应误删数据库风波;要想赢得持续发布“烂产品”

“99%的企业级 Agent 都只是玩具!”

来自主题: AI资讯
11343 点击    2026-01-08 16:15