AI资讯新闻榜单内容搜索-语言模型

TypedThinker框架，多维度推理Prompt让LLM推理更精准，卡梅隆和Qwen团队最新

大语言模型（LLMs）在推理任务上展现出了令人瞩目的能力，但其推理思维方式的单一性一直是制约性能提升的关键瓶颈。目前的研究主要关注如何通过思维链（Chain-of-Thought）等方法来提升推理的质量，却忽视了一个重要维度——推理类型的多样性。

来自主题: AI技术研报

9069 点击 2024-12-11 10:16

随着 ChatGPT 掀起的 AI 浪潮进入第三年，人工智能体（AI Agent）作为大语言模型（LLM）落地应用的关键载体，正受到学术界和产业界的持续关注。

来自主题: AI技术研报

7927 点击 2024-12-11 09:48

Allen Institute for AI（AI2）发布了Tülu 3系列模型，一套开源的最先进的语言模型，性能与GPT-4o-mini等闭源模型相媲美。Tülu 3包括数据、代码、训练配方和评估框架，旨在推动开源模型后训练技术的发展。

来自主题: AI技术研报

8276 点击 2024-12-10 16:23

自从去年ChatGPT4出现以来，以大语言模型为主的AI和星舰一样，在中文网络上愈发被一些群体当成美国对中国的某种决战兵器而极尽吹捧。比如最近风头正盛的某“经济学家”一直在各种场合鼓吹AI将带领美国实现产业升级。

来自主题: AI资讯

6325 点击 2024-12-10 10:40

自从 Chatgpt 诞生以来，LLM（大语言模型）的参数量似乎就成为了各个公司的竞赛指标。GPT-1 参数量为 1.17 亿（1.17M），而它的第四代 GPT-4 参数量已经刷新到了 1.8 万亿（1800B）。

来自主题: AI技术研报

8399 点击 2024-12-08 12:20

知识密集型工作也败了！大型语言模型在预测神经科学结果方面超越了人类专家，平均准确率达到81%，而人类专家仅为63%；模型通过整合大量文献数据，展现出了惊人的前瞻性预测能力，预示着未来科研工作中人机协作的巨大潜力。

来自主题: AI技术研报

8211 点击 2024-12-07 15:20

以 GPT4V 为代表的多模态大模型（LMMs）在大语言模型（LLMs）上增加如同视觉的多感官技能，以实现更强的通用智能。虽然 LMMs 让人类更加接近创造智慧，但迄今为止，我们并不能理解自然与人工的多模态智能是如何产生的。

来自主题: AI技术研报

7367 点击 2024-12-07 15:02

最近从由大型语言模型（LLM）驱动的聊天机器人向如今该领域所定义的 Agent 系统或 Agentic AI 的转变，可以用一句老话来概括：“少说话，多做事。”

来自主题: AI资讯

7074 点击 2024-12-07 10:44

在 Minecraft 中构造一个能完成各种长序列任务的智能体，颇有挑战性。现有的工作利用大语言模型 / 多模态大模型生成行动规划，以提升智能体执行长序列任务的能力。

来自主题: AI技术研报

7497 点击 2024-12-06 17:58

融合物理知识的大型视频语言模型PhysVLM，开源了！它不仅在 PhysGame 基准上展现出最先进的性能，还在通用视频理解基准上（Video-MME, VCG）表现出领先的性能。

来自主题: AI技术研报

8420 点击 2024-12-06 17:45