李飞飞团队提出架构设计新思路!无需从头训练,直接“嫁接”预训练模型关键组件
李飞飞团队提出架构设计新思路!无需从头训练,直接“嫁接”预训练模型关键组件预训练模型能否作为探索新架构设计的“底座” ? 最新答案是:yes!
预训练模型能否作为探索新架构设计的“底座” ? 最新答案是:yes!
清华大学软件学院发布生成式时序大模型——日晷(Sundial)。告别离散化局限,无损处理连续值,基于流匹配生成预测,缓解预训练模式坍塌,支持非确定性概率预测,为决策过程提供动态支持。
长期以来主流的代码修复评测基准SWE-bench面临数据过时、覆盖面窄、手动维护成本高等问题,严重制约了AI模型真实能力的展现。
AI视频生成,Midjourney终于落下大锤了!今天,V1视频生成模型正式上线,每一帧效果超逼真,网友上手实测惊掉下巴。
人人都绕不开的推荐系统,如今正被注入新的 AI 动能。 随着 AI 领域掀起一场由大型语言模型(LLM)引领的生成式革命,它们凭借着强大的端到端学习能力、海量数据理解能力以及前所未有的内容生成潜力,开始重塑各领域的传统技术栈。
近年来,强化学习 (RL) 在提升大型语言模型 (LLM) 的链式思考 (CoT) 推理能力方面展现出巨大潜力,其中直接偏好优化 (DPO) 和组相对策略优化 (GRPO) 是两大主流算法。
Midjourney sref 分享还没写完,视频模型直接上了,今天啥也别说了,先把体验分享端上来。
从 8.8 万篇文献中提取 1.4 万种材料的化学组成
生成模型会重现识别模型的历史吗?
大语言模型解决不等式证明问题时,可以给出正确答案,但大多数时候是靠猜。推理过程经不起推敲,逻辑完全崩溃。