AI资讯新闻榜单内容搜索-大语言模型

扔掉 Google 翻译！这个超强 AI 翻译工作流才是你的最佳选择

吴恩达老师提出了一种反思翻译的大语言模型 (LLM) AI 翻译工作流程

来自主题: AI技术研报

6489 点击 2024-10-29 09:56

AutoBA：一个用于生信多组学分析的完全自动化AI代理

分享一篇近期由华为和阿卜杜拉国王科技大学合作完成的一项生信分析与大语言模型相结合的工作，相关成果发表在《Advanced Science》上。

来自主题: AI技术研报

6464 点击 2024-10-29 09:53

字节跳动计划在欧洲设立AI研发中心，已开始招募大模型等领域技术人才

10月28日，澎湃新闻记者获悉，字节跳动准备在欧洲设立AI研发中心，已开始在欧洲积极招募LLM（大语言模型）和AI领域的顶尖技术人才，以加强其在全球第二大经济体中的人工智能研发能力。

来自主题: AI资讯

6175 点击 2024-10-28 20:34

谷歌AI播客刚火，Meta就开源了平替，效果一言难尽

随着谷歌和 Meta 相继推出基于大语言模型的 AI 播客功能，将极大地丰富人类用户与 AI 智能体互动的体验。

来自主题: AI资讯

5173 点击 2024-10-28 14:57

惊雷又来了，用含义类型化提示MTP：更高效地提示LLM结构化输出，支持图片视频

在人工智能技术快速发展的今天，大语言模型(LLM)已经展现出惊人的能力。然而，让这些模型生成规范的结构化输出仍然是一个难以攻克的技术难题。不论是在开发自动化工具、构建特定领域的解决方案，还是在进行开发工具集成时，都迫切需要LLM能够产生格式严格、内容可靠的输出。

来自主题: AI技术研报

9195 点击 2024-10-28 11:55

斯坦福开源学术研究神器STORM再进化，AI智能体像人一样进行圆桌讨论

今年 4 月，斯坦福大学推出了一款利用大语言模型（LLM）辅助编写类维基百科文章的神器。它就是开源的 STORM，可以在三分钟左右将你输入的主题转换为长篇文章或者研究论文，并能够以 PDF 格式直接下载。

来自主题: AI技术研报

6978 点击 2024-10-27 15:43

与OpenAI o1技术理念相似，TDPO-R算法有效缓解奖励过优化问题

OpenAI 最近发布的 o1 模型在数学、代码生成和长程规划等复杂任务上取得了突破性进展，据业内人士分析披露，其关键技术在于基于强化学习的搜索与学习机制。通过迭代式的自举过程，o1 基于现有大语言模型的强大推理能力，生成合理的推理过程，并将这些推理融入到其强化学习训练过程中。

来自主题: AI技术研报

11266 点击 2024-10-26 17:01

在Claude 3.5 Sonnet之前，这些AI Agent已能像人类一样操作电脑

这两天，Claude 3.5 Sonnet升级版刷爆了朋友圈，满屏都是：它能像人一样操作电脑。大语言模型（Large Language Model，LLM）能够像人一样操作电脑这件事，看起来蛮炸裂的，但在AI Agent圈子里早已经见多不怪了。

来自主题: AI技术研报

7446 点击 2024-10-25 16:40

MIT韩松团队长上下文LLM推理高效框架DuoAttention：单GPU实现330万Token上下文推理

TL;DR：DuoAttention 通过将大语言模型的注意力头分为检索头（Retrieval Heads，需要完整 KV 缓存）和流式头（Streaming Heads，只需固定量 KV 缓存），大幅提升了长上下文推理的效率，显著减少内存消耗、同时提高解码（Decoding）和预填充（Pre-filling）速度，同时在长短上下文任务中保持了准确率。

来自主题: AI技术研报

5562 点击 2024-10-24 11:33

自动化、可复现，基于大语言模型群体智能的多维评估基准Decentralized Arena来了

Maitrix.org 是由 UC San Diego, John Hopkins University, CMU， MBZUAI 等学术机构学者组成的开源组织，致力于发展大语言模型 (LLM)、世界模型 (World Model)、智能体模型 (Agent Model) 的技术以构建 AI 驱动的现实。

来自主题: AI技术研报

7534 点击 2024-10-22 14:38