AI资讯新闻榜单内容搜索-大语言模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 大语言模型

3500万美元押注一个疯狂想法：Viven让每个员工都有数字分身

3500万美元押注一个疯狂想法：Viven让每个员工都有数字分身

3500万美元押注一个疯狂想法：Viven让每个员工都有数字分身

Viven 的核心创新在于，它为每个员工创建了一个个性化的大语言模型，实质上就是一个数字分身。这个分身通过访问员工的内部电子文档，包括邮件、Slack 消息、Google Docs、会议记录等，学习这个人如何思考、如何沟通、拥有什么知识。关键是，这个学习过程是自动进行的，不需要员工做任何额外工作。你只需正常工作，你的数字分身就会不断更新和进化。

来自主题: AI资讯

7323 点击 2025-10-26 11:20

AI模型守法率提升11%，港科大首次用法案构建安全benchmark

AI模型守法率提升11%，港科大首次用法案构建安全benchmark

AI模型守法率提升11%，港科大首次用法案构建安全benchmark

香港科技大学KnowComp实验室提出基于《欧盟人工智能法案》和《GDPR》的LLM安全新范式，构建合规测试基准并训练出性能优异的推理模型，为大语言模型安全管理提供了新方向。

来自主题: AI技术研报

8062 点击 2025-10-23 12:20

RewardMap: 通过多阶段强化学习解决细粒度视觉推理的Sparse Reward

RewardMap: 通过多阶段强化学习解决细粒度视觉推理的Sparse Reward

RewardMap: 通过多阶段强化学习解决细粒度视觉推理的Sparse Reward

近年来，大语言模型（LLMs）以及多模态大模型（MLLMs）在多种场景理解和复杂推理任务中取得突破性进展。

来自主题: AI技术研报

5541 点击 2025-10-21 15:53

微软BitDistill将LLM压缩到1.58比特：10倍内存节省、2.65倍CPU推理加速

微软BitDistill将LLM压缩到1.58比特：10倍内存节省、2.65倍CPU推理加速

微软BitDistill将LLM压缩到1.58比特：10倍内存节省、2.65倍CPU推理加速

大语言模型（LLM）不仅在推动通用自然语言处理方面发挥了关键作用，更重要的是，它们已成为支撑多种下游应用如推荐、分类和检索的核心引擎。尽管 LLM 具有广泛的适用性，但在下游任务中高效部署仍面临重大挑战。

来自主题: AI技术研报

5868 点击 2025-10-21 11:43

AI智能编程新框架，节省一半时间就能“聪明”地写代码丨上海AI Lab&华师大

AI智能编程新框架，节省一半时间就能“聪明”地写代码丨上海AI Lab&华师大

AI智能编程新框架，节省一半时间就能“聪明”地写代码丨上海AI Lab&华师大

在代码层面，大语言模型已经能够写出正确而优雅的程序。但在机器学习工程场景中，它离真正“打赢比赛”仍有不小差距。

来自主题: AI技术研报

7517 点击 2025-10-19 12:10

「重要性采样」并不「重要」？快手清华ASPO攻克重要性采样权重错配

「重要性采样」并不「重要」？快手清华ASPO攻克重要性采样权重错配

「重要性采样」并不「重要」？快手清华ASPO攻克重要性采样权重错配

从ChatGPT到DeepSeek，强化学习（Reinforcement Learning, RL）已成为大语言模型（LLM）后训练的关键一环。

来自主题: AI技术研报

6656 点击 2025-10-18 11:41

不再靠「猜坐标」！颜水成团队等联合发布PaDT多模态大模型：实现真正的多模态表征输出

不再靠「猜坐标」！颜水成团队等联合发布PaDT多模态大模型：实现真正的多模态表征输出

不再靠「猜坐标」！颜水成团队等联合发布PaDT多模态大模型：实现真正的多模态表征输出

近年来，多模态大语言模型（Multimodal Large Language Models, MLLMs）在图文理解、视觉问答等任务上取得了令人瞩目的进展。然而，当面对需要精细空间感知的任务 —— 比如目标检测、实例分割或指代表达理解时，现有模型却常常「力不从心」。

来自主题: AI技术研报

8969 点击 2025-10-16 12:31

LLaVA-OneVision-1.5全流程开源，8B模型预训练只需4天、1.6万美元

LLaVA-OneVision-1.5全流程开源，8B模型预训练只需4天、1.6万美元

LLaVA-OneVision-1.5全流程开源，8B模型预训练只需4天、1.6万美元

LLaVA 于 2023 年提出，通过低成本对齐高效连接开源视觉编码器与大语言模型，使「看图 — 理解 — 对话」的多模态能力在开放生态中得以普及，明显缩小了与顶级闭源模型的差距，标志着开源多模态范式的重要里程碑。

来自主题: AI技术研报

8452 点击 2025-10-15 12:12

拒绝“熵崩塌”和“熵爆炸”！这项研究让大模型学会“精确探索”，推理成绩飙升

拒绝“熵崩塌”和“熵爆炸”！这项研究让大模型学会“精确探索”，推理成绩飙升

拒绝“熵崩塌”和“熵爆炸”！这项研究让大模型学会“精确探索”，推理成绩飙升

大语言模型在RLVR训练中面临的“熵困境”，有解了！

来自主题: AI技术研报

7498 点击 2025-10-14 10:57

超越ZIP的无损压缩来了！华盛顿大学让大模型成为无损文本压缩器

超越ZIP的无损压缩来了！华盛顿大学让大模型成为无损文本压缩器

超越ZIP的无损压缩来了！华盛顿大学让大模型成为无损文本压缩器

当大语言模型生成海量数据时，数据存储的难题也随之而来。对此，华盛顿大学（UW）SyFI实验室的研究者们提出了一个创新的解决方案：LLMc，即利用大型语言模型自身进行无损文本压缩的引擎。

来自主题: AI技术研报

6147 点击 2025-10-12 11:00

上一页当前第1页,共55页下一页