AI TNT— 让一部分先用AI实现商业化

全球十亿级轨迹点驱动，首个轨迹基础大模型来了

在智慧城市和大数据时代背景下，人类轨迹数据的分析对于交通优化、城市管理、物流配送等关键领域具有重要意义。然而，现有的轨迹相关模型往往受限于特定任务、区域依赖、轨迹数据规模和多样性困乏等问题，限制了模型的泛化能力和实际应用范围。

来自主题: AI技术研报

7717 点击 2024-11-22 17:21

大模型不会推理，为什么也能有思路？有人把原理搞明白了

大模型不会照搬训练数据中的数学推理，回答事实问题和推理问题的「思路」也不一样。

来自主题: AI技术研报

6739 点击 2024-11-22 16:53

上交大o1复现新突破：蒸馏超越原版，警示AI研发"捷径陷阱"

自从 OpenAI 发布展现出前所未有复杂推理能力的 o1 系列模型以来，全球掀起了一场 AI 能力 “复现” 竞赛。近日，上海交通大学 GAIR 研究团队在 o1 模型复现过程中取得新的突破，通过简单的知识蒸馏方法，团队成功使基础模型在数学推理能力上超越 o1-preview。

来自主题: AI技术研报

4515 点击 2024-11-22 16:46

汽车上的《Her》：模型竟然想做个人了，甩掉机械感，让灵魂有趣，来自吉利的全新尝试

今天，如果你身边有这样一个对话大模型，它就像你身边的一个朋友，快言快语，风趣幽默，既会比喻，又会自嘲，偶尔跟你唱反调，你跟它的聊天欲望会不会更强一些呢？

来自主题: AI资讯

6518 点击 2024-11-22 15:36

Robinhood创始人再创业研发超级数学AI，已接近国际数学奥赛选手，红杉领投近亿美金

人工智能虽然其提供了广泛的信息，却缺乏解决复杂问题所需的深入、结构化的推理能力，同时还存幻觉的局限。形式逻辑和相关数学工具为 AGI 的逻辑推理能力提供了必要的理论基础和技术支撑。

来自主题: AI资讯

4798 点击 2024-11-22 14:01

续命Scaling Law？世界模型GPT-4o让智能体超级规划，OSU华人一作

Scaling Law撞墙，扩展语言智能体的推理时计算实在太难了！破局之道，竟是使用LLM作为世界模型？OSU华人团队发现，使用GPT-4o作为世界模型来支持复杂环境中的规划，潜力巨大。

来自主题: AI技术研报

5312 点击 2024-11-22 13:38

神级项目训练GPT-2仅需5分钟，Andrej Karpathy都点赞

今年 4 月，AI 领域大牛 Karpathy 一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的项目「llm.c」曾经引发机器学习社区的热烈讨论。

来自主题: AI资讯

4810 点击 2024-11-22 10:18

Dario Amodei：Scaling Law 还没遇到上限

Powerful AI 预计会在 2026 年实现，足够强大的 AI 也能够将把一个世纪的科研进展压缩到 5-10 年实现（“Compressed 21st Century”），在他和 Lex Fridman 的最新对谈中，Dario 具体解释了自己对于 Powerful AI 可能带来的机会的理解，以及 scaling law、RL、Compute Use 等模型训练和产品的细节进行了分享

来自主题: AI资讯

7905 点击 2024-11-22 10:06

写给小白的大模型入门科普

网上关于大模型的文章也很多，但是都不太容易看懂。小枣君今天试着写一篇，争取做到通俗易懂。

来自主题: AI资讯

5047 点击 2024-11-22 10:00

红杉资本对话Fireworks复旦华人创始人：开源和闭源模型的差距将显著缩小；小型、专门化模型正变得越来越强大

简单性可以扩展：PyTorch的成功源于其对研究人员简单性的关注，这种关注随后流向了生产环境。在Fireworks，他们在幕后拥抱了巨大的复杂性，以提供一个简单的API给开发者。这种方法让客户能够专注于创新和产品设计，而不是纠结于技术复杂性。

来自主题: AI资讯

5641 点击 2024-11-22 09:51