AI资讯新闻榜单内容搜索-LLM

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: LLM
企业Multi-Agent协作通用框架设计揭秘,突破90%成功率,AWS最新

企业Multi-Agent协作通用框架设计揭秘,突破90%成功率,AWS最新

企业Multi-Agent协作通用框架设计揭秘,突破90%成功率,AWS最新

随着大语言模型(LLM)技术的快速发展,单一AI智能体已经展现出强大的问题解决能力。然而,在面对复杂的企业级应用场景时,单一智能体的能力往往显得捉襟见肘。

来自主题: AI技术研报
6294 点击    2025-01-09 10:28
GPT-4o最自私,Claude更慷慨!DeepMind发布全新「AI道德测试」

GPT-4o最自私,Claude更慷慨!DeepMind发布全新「AI道德测试」

GPT-4o最自私,Claude更慷慨!DeepMind发布全新「AI道德测试」

智能体在模拟人类合作行为的捐赠者游戏中表现出不同策略,其中Claude 3.5智能体展现出更有效的合作和惩罚搭便车行为的能力,而Gemini 1.5 Flash和GPT-4o则表现得更自私,结果揭示了不同LLM智能体在合作任务中的道德和行为差异,对未来人机协同社会具有重要意义。

来自主题: AI技术研报
8343 点击    2025-01-06 15:21
DeepMind重磅,用PC-SUBQ提示策略让LLM从相关性推断因果关系

DeepMind重磅,用PC-SUBQ提示策略让LLM从相关性推断因果关系

DeepMind重磅,用PC-SUBQ提示策略让LLM从相关性推断因果关系

在人工智能领域,大语言模型(LLMs)展现出了令人惊叹的能力,但在因果推理这一人类智能的核心能力上仍面临重大挑战。特别是在从相关性信息推断因果关系这一任务上,现有的大语言模型表现出明显的不足。

来自主题: AI技术研报
3822 点击    2025-01-06 13:39
AI 医疗赛道最受关注的独角兽:5000万ARR、25亿估值,AI Scribe场景PMF已验证

AI 医疗赛道最受关注的独角兽:5000万ARR、25亿估值,AI Scribe场景PMF已验证

AI 医疗赛道最受关注的独角兽:5000万ARR、25亿估值,AI Scribe场景PMF已验证

在 LLM 落地场景中,医疗领域的应用开始展现出比较高的确定性,尤其是 AI scribe 产品能解决临床文档记录枯燥、耗时这一行业痛点。Abridge 是其中最有代表性的公司,训练了专用于临床文档的 ASR 和文本生成模型,能够替代 90% 左右的人工工作量。

来自主题: AI资讯
4407 点击    2025-01-04 15:54
Just keep scaling!思维链作者Jason Wei 40分钟讲座剖析LLM扩展范式

Just keep scaling!思维链作者Jason Wei 40分钟讲座剖析LLM扩展范式

Just keep scaling!思维链作者Jason Wei 40分钟讲座剖析LLM扩展范式

2023 年初,Jason Wei 加入了 OpenAI,参与了 ChatGPT 的构建以及 o1 等重大项目。他的工作使思维链提示、指令微调和涌现现象等技术和概念变得广为人知。

来自主题: AI资讯
7059 点击    2025-01-04 14:32
Agent 炒作一年仍未落地,99% 不懂 AI 的人和剩下 1 % 产生了鸿沟

Agent 炒作一年仍未落地,99% 不懂 AI 的人和剩下 1 % 产生了鸿沟

Agent 炒作一年仍未落地,99% 不懂 AI 的人和剩下 1 % 产生了鸿沟

万字长文盘点 2024,展望 2025 2024 年,大语言模型(LLM)迎来了翻天覆地的变化。让我们一起回顾过去一年中这个领域的重大发现,梳理其中的关键主题和标志性时刻。

来自主题: AI资讯
7885 点击    2025-01-04 12:24
数据不够致Scaling Law撞墙?CMU和DeepMind新方法可让VLM自己生成记忆

数据不够致Scaling Law撞墙?CMU和DeepMind新方法可让VLM自己生成记忆

数据不够致Scaling Law撞墙?CMU和DeepMind新方法可让VLM自己生成记忆

最近 AI 社区很多人都在讨论 Scaling Law 是否撞墙的问题。其中,一个支持 Scaling Law 撞墙论的理由是 AI 几乎已经快要耗尽已有的高质量数据,比如有一项研究就预计,如果 LLM 保持现在的发展势头,到 2028 年左右,已有的数据储量将被全部利用完。

来自主题: AI技术研报
9341 点击    2025-01-03 15:46
人工智能2024:模型端OpenAI走下神坛,应用端商业化渐清晰

人工智能2024:模型端OpenAI走下神坛,应用端商业化渐清晰

人工智能2024:模型端OpenAI走下神坛,应用端商业化渐清晰

将时间拨回到两年之前,彼时,ChatGPT刚刚问世就引起了广泛的关注。不过,虽然当时大家惊艳于LLM带来的震撼,但也没有想到在短短两年之后,人工智能就已经以包括Chat在内的各种不同形式融入了我们的日常,并正以前所未有的速度、广度和深度重塑生产生活方式。

来自主题: AI资讯
7797 点击    2025-01-01 11:41
小身板大能量:树莓派玩转 Phi-2、Mistral 和 LLaVA 等AI大模型~

小身板大能量:树莓派玩转 Phi-2、Mistral 和 LLaVA 等AI大模型~

小身板大能量:树莓派玩转 Phi-2、Mistral 和 LLaVA 等AI大模型~

你是否想过在自己的设备上运行自己的大型语言模型(LLMs)或视觉语言模型(VLMs)?你可能有过这样的想法,但是一想到要从头开始设置、管理环境、下载正确的模型权重,以及你的设备是否能处理这些模型的不确定性,你可能就犹豫了。

来自主题: AI技术研报
9220 点击    2024-12-30 16:53
Deepmind 重磅开源:消除幻觉,让 LLMs 学会规则库和多步推理

Deepmind 重磅开源:消除幻觉,让 LLMs 学会规则库和多步推理

Deepmind 重磅开源:消除幻觉,让 LLMs 学会规则库和多步推理

大模型的的发布固然令人欣喜,但是各类测评也是忙坏了众多 AI 工作者。大模型推理的幻觉问题向来是 AI 测评的重灾区,诸如 9.9>9.11 的经典幻觉问题,各大厂家恨不得直接把问题用 if-else 写进来。

来自主题: AI技术研报
8541 点击    2024-12-30 10:39