思维链可无限延伸了,MIT等打破大模型上下文天花板
思维链可无限延伸了,MIT等打破大模型上下文天花板大模型的记忆墙,被MIT撬开了一道口子。 MIT等机构最新提出了一种新架构,让推理大模型的思考长度突破物理限制,理论上可以无限延伸。 这个新架构名叫Thread Inference Model,简称TIM。
大模型的记忆墙,被MIT撬开了一道口子。 MIT等机构最新提出了一种新架构,让推理大模型的思考长度突破物理限制,理论上可以无限延伸。 这个新架构名叫Thread Inference Model,简称TIM。
情感语音交互模型初创公司宇生月伴近日完成新一轮融资,由靖亚资本和小苗朗程领投,菡源资产(上海交大母基金)跟投,心流资本FlowCapital担任长期财务顾问。本轮融资将用于语音模型的持续优化、产品矩阵拓展及国际化商业落地。作为国内首家聚焦“情感语音交互”的模型公司,宇生月伴正重新定义AI时代的语音交互范式。
大模型OUT,小模型才是智能体的未来! 这可不是标题党,而是英伟达最新论文观点: 在Agent任务中,大语言模型经常处理重复、专业化的子任务,这让它们消耗大量计算资源,且成本高、效率低、灵活性差。
据新华社报道, 15 日晚间,神舟二十号航天员乘组圆满完成了第三次出舱活动。其间,一个名叫“悟空 AI”的大模型发挥了重要的辅助支撑作用,为航天员在轨工作提供了智能化、专业化支持。
提示词才是AI隐藏的王牌!马里兰MIT等顶尖机构研究证明,一半提示词,是让AI性能飙升49%的关键。
在大语言模型(LLMs)领域,自回归(AR)范式长期占据主导地位,但其逐 token 生成也带来了固有的推理效率瓶颈。此前,谷歌的 Gemini Diffusion 和字节的 Seed Diffusion 以每秒千余 Tokens 的惊人吞吐量,向业界展现了扩散大语言模型(dLLMs)在推理速度上的巨大潜力。
我们需要「AI母亲」,而非「AI助手」!在Ai4 2025大会上,「AI教父」再次表达了他对AI安全的担忧。他警告说人类要继续控制AI是虚幻的希望,并提出与之相反的有趣视角:为AI建立「母性本能」。
随着ChatGPT,DeepSeek等一批AI大模型被人们越来越多运用到日常生活和工作中,用ChatGPT解答疑问,编写程序,创作音乐和写作,成为了越来越多人的日常。
感谢 Moose 老师非常细致地分享了: 他从WAIC 大会现场观察了国内 AI 的最新动向——从大厂展区的大模型生态,到独立团队的创意产品,涵盖办公、教育、设计、视频等多个场景。通过这些案例,可以更清晰地看到 AI 在 2025 年的三种趋势:套壳的传统产品、短期的效率工具,以及真正有潜力的垂直平台与智能体(Agent)
最近一段时间,经常能听到把“枯燥乏味”的工作交给AI的说法。