AI资讯新闻榜单内容搜索-LLM

数字比你想得更复杂——一文带你了解大模型数字处理能力的方方面面

目前大语言模型（Large Language Models, LLMs）的推理能力备受关注。从思维链（Chain of Thought，CoT）技术提出，到以 o1 为代表的长思考模型发布，大模型正在展现出接近人类甚至领域专家的水平，其中数学推理是一个典型任务。

来自主题: AI技术研报

7688 点击 2024-12-12 10:06

LLM 作为推理引擎，coding 是最好的应用场景：代码的逻辑比自然语言更清晰，执行的结果能由 AI 自动化验证。因此我们看到从 Sonnet 3.5 到 o1 pro，每一次模型能力的提升都会反映在 coding 能力的提升上，这一领域的应用进步就尤其显著。

来自主题: AI资讯

7159 点击 2024-12-11 14:33

大语言模型（LLMs）在推理任务上展现出了令人瞩目的能力，但其推理思维方式的单一性一直是制约性能提升的关键瓶颈。目前的研究主要关注如何通过思维链（Chain-of-Thought）等方法来提升推理的质量，却忽视了一个重要维度——推理类型的多样性。

来自主题: AI技术研报

7943 点击 2024-12-11 10:16

随着 ChatGPT 掀起的 AI 浪潮进入第三年，人工智能体（AI Agent）作为大语言模型（LLM）落地应用的关键载体，正受到学术界和产业界的持续关注。

来自主题: AI技术研报

7057 点击 2024-12-11 09:48

有研究预计，如果 LLM 保持现在的发展势头，预计在 2028 年左右，已有的数据储量将被全部利用完。届时，基于大数据的大模型的发展将可能放缓甚至陷入停滞。

来自主题: AI资讯

6898 点击 2024-12-10 11:38

支持大模型一路狂飙的 Scaling Law 到头了？近期，AI 圈针对 Scaling Law 是否到头产生了分歧。一派观点认为 Scaling Law 已经「撞墙」了，另一派观点（如 OpenAI CEO Sam Altman）仍然坚定 Scaling Law 的潜力尚未穷尽。

来自主题: AI技术研报

6632 点击 2024-12-09 14:59

自从 Chatgpt 诞生以来，LLM（大语言模型）的参数量似乎就成为了各个公司的竞赛指标。GPT-1 参数量为 1.17 亿（1.17M），而它的第四代 GPT-4 参数量已经刷新到了 1.8 万亿（1800B）。

来自主题: AI技术研报

6955 点击 2024-12-08 12:20

人类离AGI究竟还有多远？最新一期Nature文章，从以往研究分析、多位大佬言论深入探讨了LLM在智能化道路上突破与局限。

来自主题: AI资讯

5608 点击 2024-12-07 15:07

以 GPT4V 为代表的多模态大模型（LMMs）在大语言模型（LLMs）上增加如同视觉的多感官技能，以实现更强的通用智能。虽然 LMMs 让人类更加接近创造智慧，但迄今为止，我们并不能理解自然与人工的多模态智能是如何产生的。

来自主题: AI技术研报

6190 点击 2024-12-07 15:02

最近从由大型语言模型（LLM）驱动的聊天机器人向如今该领域所定义的 Agent 系统或 Agentic AI 的转变，可以用一句老话来概括：“少说话，多做事。”

来自主题: AI资讯

6387 点击 2024-12-07 10:44