AI资讯新闻榜单内容搜索-大语言模型

字节跳动计划在欧洲设立AI研发中心，已开始招募大模型等领域技术人才

10月28日，澎湃新闻记者获悉，字节跳动准备在欧洲设立AI研发中心，已开始在欧洲积极招募LLM（大语言模型）和AI领域的顶尖技术人才，以加强其在全球第二大经济体中的人工智能研发能力。

来自主题: AI资讯

5740 点击 2024-10-28 20:34

谷歌AI播客刚火，Meta就开源了平替，效果一言难尽

随着谷歌和 Meta 相继推出基于大语言模型的 AI 播客功能，将极大地丰富人类用户与 AI 智能体互动的体验。

来自主题: AI资讯

4703 点击 2024-10-28 14:57

惊雷又来了，用含义类型化提示MTP：更高效地提示LLM结构化输出，支持图片视频

在人工智能技术快速发展的今天，大语言模型(LLM)已经展现出惊人的能力。然而，让这些模型生成规范的结构化输出仍然是一个难以攻克的技术难题。不论是在开发自动化工具、构建特定领域的解决方案，还是在进行开发工具集成时，都迫切需要LLM能够产生格式严格、内容可靠的输出。

来自主题: AI技术研报

8718 点击 2024-10-28 11:55

斯坦福开源学术研究神器STORM再进化，AI智能体像人一样进行圆桌讨论

今年 4 月，斯坦福大学推出了一款利用大语言模型（LLM）辅助编写类维基百科文章的神器。它就是开源的 STORM，可以在三分钟左右将你输入的主题转换为长篇文章或者研究论文，并能够以 PDF 格式直接下载。

来自主题: AI技术研报

6457 点击 2024-10-27 15:43

与OpenAI o1技术理念相似，TDPO-R算法有效缓解奖励过优化问题

OpenAI 最近发布的 o1 模型在数学、代码生成和长程规划等复杂任务上取得了突破性进展，据业内人士分析披露，其关键技术在于基于强化学习的搜索与学习机制。通过迭代式的自举过程，o1 基于现有大语言模型的强大推理能力，生成合理的推理过程，并将这些推理融入到其强化学习训练过程中。

来自主题: AI技术研报

10733 点击 2024-10-26 17:01

在Claude 3.5 Sonnet之前，这些AI Agent已能像人类一样操作电脑

这两天，Claude 3.5 Sonnet升级版刷爆了朋友圈，满屏都是：它能像人一样操作电脑。大语言模型（Large Language Model，LLM）能够像人一样操作电脑这件事，看起来蛮炸裂的，但在AI Agent圈子里早已经见多不怪了。

来自主题: AI技术研报

6753 点击 2024-10-25 16:40

MIT韩松团队长上下文LLM推理高效框架DuoAttention：单GPU实现330万Token上下文推理

TL;DR：DuoAttention 通过将大语言模型的注意力头分为检索头（Retrieval Heads，需要完整 KV 缓存）和流式头（Streaming Heads，只需固定量 KV 缓存），大幅提升了长上下文推理的效率，显著减少内存消耗、同时提高解码（Decoding）和预填充（Pre-filling）速度，同时在长短上下文任务中保持了准确率。

来自主题: AI技术研报

5075 点击 2024-10-24 11:33

自动化、可复现，基于大语言模型群体智能的多维评估基准Decentralized Arena来了

Maitrix.org 是由 UC San Diego, John Hopkins University, CMU， MBZUAI 等学术机构学者组成的开源组织，致力于发展大语言模型 (LLM)、世界模型 (World Model)、智能体模型 (Agent Model) 的技术以构建 AI 驱动的现实。

来自主题: AI技术研报

6646 点击 2024-10-22 14:38

深度｜如何最大化 GPU 利用效率，让 ROI 最大化？

前不久在人工智能的帮助下，两位科学家获得了诺贝尔物理学奖。可以说人工智能已经在很多领域被广泛应用了。随着大语言模型（LLM）和深度学习的广泛应用，GPU 也已成为机器学习工程师和研究人员最重要的计算资源之一。

来自主题: AI资讯

8840 点击 2024-10-21 14:14

以图灵机为师：通过微调训练让大语言模型懂执行计算过程

大型语言模型（LLM）在各种自然语言处理和推理任务中表现出卓越的能力，某些应用场景甚至超越了人类的表现。然而，这类模型在最基础的算术问题的表现上却不尽如人意。

来自主题: AI技术研报

5484 点击 2024-10-18 13:54