现代认知科学认为,人类会在头脑中构建关于周围真实世界的抽象模型——世界模型(world model)。获取“世界模型”的问题一直是人工智能研究的焦点。OpenAI 联合创始人兼首席科学家 Ilya Sutskever 认为, ChatGPT 已经学到了关于真实世界的复杂抽象模型。
现代认知科学认为,人类会在头脑中构建关于周围真实世界的抽象模型——世界模型(world model)。获取“世界模型”的问题一直是人工智能研究的焦点。OpenAI 联合创始人兼首席科学家 Ilya Sutskever 认为, ChatGPT 已经学到了关于真实世界的复杂抽象模型。
视觉幻觉是常见于多模态大语言模型的一个典型问题。最近,来自中科大等机构的研究人员提出了首个多模态修正架构「啄木鸟」,可有效解决MLLM输出幻觉的问题。
即便大语言模型的参数规模日渐增长,其模型中的参数到底是如何发挥作用的还是让人难以琢磨,直接对大模型进行分析又费钱费力。针对这种情况,微软的两位研究员想到了一个绝佳的切入点
过去将近一年的时间里,大模型几乎可以说是最炙手可热的一种技术、趋势和概念,一方面从大众到全球各国政府的关注,另一方面是所有科技互联网公司都在加速布局大模型
在2023中国移动全球合作伙伴大会主论坛上,中国移动重磅发布“九天•众擎基座大模型”。
悟道·天鹰Aquila大语言模型系列全面升级到Aquila2,并再添 340亿参数(34B)重量级新成员,带来当前最强的开源中英双语大模型。
在自己的系统上部署大型语言模型可能会出人意料地简单 - 前提是你拥有正确的工具。以下是如何在桌面上使用像Meta的新Code Llama这样的LLM的方法。
在 Current Biology 上,十位意识领域的研究专家受到了 Joseph LeDoux 和 Jonathan Birch 的邀请,从意识的三层级以及感知这一问题入手,对动物意识和 AI 意识的问题展开了讨论
在大语言模型内部,是否有一个世界模型?LLM是否具有空间感?并且在多个时空尺度上都是如此? 最近,MIT的几位研究者发现,答案是肯定的!
上海AI实验室与商汤科技联合香港中文大学和复旦大学正式推出书生·浦语大模型(InternLM)200亿参数版本InternLM-20B,并在阿里云魔搭社区(ModelScope)开源首发。