AI资讯新闻榜单内容搜索-训练

与OpenAI o1技术理念相似，TDPO-R算法有效缓解奖励过优化问题

OpenAI 最近发布的 o1 模型在数学、代码生成和长程规划等复杂任务上取得了突破性进展，据业内人士分析披露，其关键技术在于基于强化学习的搜索与学习机制。通过迭代式的自举过程，o1 基于现有大语言模型的强大推理能力，生成合理的推理过程，并将这些推理融入到其强化学习训练过程中。

来自主题: AI技术研报

11011 点击 2024-10-26 17:01

深挖大模型幻觉！哈佛大学最新报告：LLM等价于众包，只是在输出「网络共识」

哈佛大学研究了大型语言模型在回答晦涩难懂和有争议问题时产生「幻觉」的原因，发现模型输出的准确性高度依赖于训练数据的质量和数量。研究结果指出，大模型在处理有广泛共识的问题时表现较好，但在面对争议性或信息不足的主题时则容易产生误导性的回答。

来自主题: AI资讯

5815 点击 2024-10-25 14:51

RNN回归！Bengio新作大道至简与Transformer一较高下

近日，深度学习三巨头之一的Yoshua Bengio，带领团队推出了全新的RNN架构，以大道至简的思想与Transformer一较高下。

来自主题: AI技术研报

4614 点击 2024-10-25 14:42

红杉资本对话Harmonic联创：数学即推理，合成数据是模型的新燃料，计算资源和自博弈是进步的关键

数学界对AI在数学中应用的看法存在分歧，但年轻一代更支持AI和验证工具。Vlad指出，通过递归自我改进，AI有潜力在数学和其他复杂问题上取得重大突破。随着AI在模式识别和自我改进方面的进步，它可能参与解决大型数学难题，如黎曼猜想。同时，数学家仍将在引导AI方向、规划研究领域和解释结果方面起关键作用。

来自主题: AI资讯

6029 点击 2024-10-25 14:11

自动驾驶不怵恶劣天气，西电&上海AI Lab多模态融合检测端到端算法来了 | NeurlPS Oral

西安电子科大、上海AI Lab等提出多模态融合检测算法E2E-MFD，将图像融合和目标检测整合到一个单阶段、端到端框架中，简化训练的同时，提升目标解析性能。相关论文已入选顶会NeurlPS 2024 Oral，代码、模型均已开源。

来自主题: AI技术研报

6048 点击 2024-10-25 10:56

找出9.9<9.11的真正原因：《圣经》！神经元干预可免重训练修复

大模型分不清“9.9和9.11哪个更大”的谜团，终于被可解释性研究揭秘了！

来自主题: AI资讯

5128 点击 2024-10-25 10:25

大模型走到AI战略分岔口，字节们面临偏航危机

最近，字节在AI方面又搞了个大新闻。一个字节的实习生，因为对团队资源分配不满，用恶意代码把模型训练过程给投了“毒”，字节这边损失不小

来自主题: AI资讯

4514 点击 2024-10-25 09:27

哪个模型擅长调用工具？这个7B模型跻身工具调用综合榜单第一

工具调用是 AI 智能体的关键功能之一，AI 智能体根据场景变化动态地选择和调用合适的工具，从而实现对复杂任务的自动化处理。例如，在智能办公场景中，模型可同时调用文档编辑工具、数据处理工具和通信工具，完成文档撰写、数据统计和信息沟通等多项任务。

来自主题: AI技术研报

3842 点击 2024-10-24 15:40

MIT韩松团队长上下文LLM推理高效框架DuoAttention：单GPU实现330万Token上下文推理

TL;DR：DuoAttention 通过将大语言模型的注意力头分为检索头（Retrieval Heads，需要完整 KV 缓存）和流式头（Streaming Heads，只需固定量 KV 缓存），大幅提升了长上下文推理的效率，显著减少内存消耗、同时提高解码（Decoding）和预填充（Pre-filling）速度，同时在长短上下文任务中保持了准确率。

来自主题: AI技术研报

5437 点击 2024-10-24 11:33

基于人类视频数据学习，「零次方科技」四个月已完成两款人形机器人研发｜早期项目

目前，机器人的训练数据大体上可分为三类：第一类是真实的遥操数据，第二类是高质量的仿真合成数据，第三类是人类的行为数据、其主要源于互联网视频。

来自主题: AI资讯

5117 点击 2024-10-24 11:26