AI资讯新闻榜单内容搜索-模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型

DeepSeek的MLA，任意大模型都能轻松迁移了

DeepSeek的MLA，任意大模型都能轻松迁移了

DeepSeek的MLA，任意大模型都能轻松迁移了

DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界，特别是其训练与推理成本仅为同等性能大模型的数十分之一。多头潜在注意力网络（Multi-head Latent Attention, MLA）是其经济推理架构的核心之一，通过对键值缓存进行低秩压缩，显著降低推理成本 [1]。

来自主题: AI技术研报

6771 点击 2025-03-07 10:24

腾讯元宝用户协议“三次变脸”，AI生成的内容归属于谁？

腾讯元宝用户协议“三次变脸”，AI生成的内容归属于谁？

腾讯元宝用户协议“三次变脸”，AI生成的内容归属于谁？

腾讯AI助手腾讯元宝APP近期修改用户协议内容一事引发关注，成为热搜。焦点是使用AI应用或者产品的用户上传和生成内容的权利归属问题。自2月以来，有网友发现腾讯元宝的用户服务协议中，知识产权和其他权利的部分，包括了用户上传的内容，以及用元宝大模型生成的内容。

来自主题: AI资讯

11852 点击 2025-03-07 10:15

GPT 5/o3欠拟合与过拟合详细分析与深度思考(三万字超长洞察，慎入)

GPT 5/o3欠拟合与过拟合详细分析与深度思考(三万字超长洞察，慎入)

GPT 5/o3欠拟合与过拟合详细分析与深度思考(三万字超长洞察，慎入)

当模型复杂度增加到一定程度后，模型开始对训练数据中的噪声和异常值进行拟合，而不是仅仅学习数据中的真实模式。这导致模型在训练数据上表现得非常好，但在新的数据上表现不佳，因为新的数据中噪声和异常值的分布与训练数据不同。

来自主题: AI技术研报

12526 点击 2025-03-06 23:31

司南首期多模态模型闭源榜单发布！48个模型同台竞技，谁将脱颖而出？

司南首期多模态模型闭源榜单发布！48个模型同台竞技，谁将脱颖而出？

司南首期多模态模型闭源榜单发布！48个模型同台竞技，谁将脱颖而出？

基于闭源评测基准，近期司南针对国内外主流多模态大模型进行了全面评测，现公布司南首期多模态模型闭源评测榜单。首期榜单共包含 48 个多模态模型，其中包含：3 个国内 API 模型：GLM-4v-Plus-20250111 (智谱)，Step-1o (阶跃)，BailingMM-Pro-0120 (蚂蚁)

来自主题: AI技术研报

11549 点击 2025-03-06 19:45

AI话痨终结者！UCSD清华提出「思维扫描术」Dynasor-CoT，推理巨省token

AI话痨终结者！UCSD清华提出「思维扫描术」Dynasor-CoT，推理巨省token

AI话痨终结者！UCSD清华提出「思维扫描术」Dynasor-CoT，推理巨省token

推理模型在复杂任务上表现惊艳，缺点是低下的token效率。UCSD清华等机构的研究人员发现，问题根源在于模型的「自我怀疑」！研究团队提出了Dynasor-CoT，一种无需训练、侵入性小且简单的方法。

来自主题: AI技术研报

10120 点击 2025-03-06 17:15

智源开源多模态向量模型BGE-VL：多模态检索新突破

智源开源多模态向量模型BGE-VL：多模态检索新突破

智源开源多模态向量模型BGE-VL：多模态检索新突破

BGE 系列模型自发布以来广受社区好评。近日，智源研究院联合多所高校开发了多模态向量模型 BGE-VL，进一步扩充了原有生态体系。

来自主题: AI技术研报

9786 点击 2025-03-06 17:05

谷歌最新PlanGEN框架，开发自适应Multi-Agent，错过太可惜，不用邀请码

谷歌最新PlanGEN框架，开发自适应Multi-Agent，错过太可惜，不用邀请码

谷歌最新PlanGEN框架，开发自适应Multi-Agent，错过太可惜，不用邀请码

Agent这两天随着邀请码进入公众视野，展示了不凡的推理能力。然而，当面对需要精确规划和深度推理的复杂问题时，即使是最先进的LLMs也常常力不从心。Google研究团队提出的PlanGEN框架，正是为解决这一挑战而生。

来自主题: AI技术研报

5226 点击 2025-03-06 16:55

万字解构“幻觉陷阱”：人类与AI共生的长期难题丨AGI之路04期

万字解构“幻觉陷阱”：人类与AI共生的长期难题丨AGI之路04期

万字解构“幻觉陷阱”：人类与AI共生的长期难题丨AGI之路04期

人类实现AGI之前，在技术、商业、治理方面仍然存在诸多问题——“人与AI能否共处” “算力叙事是否依然奏效” “开源有多大商业价值”等，腾讯科技策划《AGI之路》系列直播，联合合作伙伴，特邀专家、学者直播解读相关议题，对齐AGI共识，探寻AGI可行之路。

来自主题: AI资讯

8550 点击 2025-03-06 16:10

ET-SEED：提升机器人操作泛化能力的高效等变扩散策略

ET-SEED：提升机器人操作泛化能力的高效等变扩散策略

ET-SEED：提升机器人操作泛化能力的高效等变扩散策略

本文提出了一种轨迹级别 SE (3) 等变的扩散策略（ET-SEED），通过将等变表示学习和扩散策略结合，使机器人能够在极少的示范数据下高效学习复杂操作技能，并能够泛化到不同物体姿态和环境中。

来自主题: AI技术研报

5839 点击 2025-03-06 15:24

离谱！OpenAI被曝博士级AI智能体2万美元/月，网友：DeepSeek快把价格打下去

离谱！OpenAI被曝博士级AI智能体2万美元/月，网友：DeepSeek快把价格打下去

离谱！OpenAI被曝博士级AI智能体2万美元/月，网友：DeepSeek快把价格打下去

刚刚，OpenAI被爆三类智能体定价！价格从每月2k美元到20k美元不等，用于自动化编码和博士级别的研究等任务。此前，美国国家实验室使用OpenAI的o1模型来解决了与核聚变相关的问题。

来自主题: AI资讯

10445 点击 2025-03-06 12:17

上一页当前第585页,共1129页下一页