AI资讯新闻榜单内容搜索-token

日均tokens使用量超5000亿，AI生图玩法猛猛上新：豆包大模型为什么越来越「香」了？

2024 年的 AI 图像生成技术，又提升到了一个新高度。

来自主题: AI资讯

10326 点击 2024-07-29 20:26

上海交通大学温颖教授：打造“通才”Agent｜Agent Insights

解决问题：语言智能体的动作通常由 Token（令牌，语言模型中表示单词/短语/汉字的最小符号单元）序列组成，直接将强化学习用于语言智能体进行策略优化的过程中，一般需要预定义可行动作集合，同时忽略了动作内 Token 细粒度信用分配问题，团队将 Agent 优化从动作层分解到 Token 层，为每个动作内 Token 提供更精细的监督，可在语言动作空间不受约束的环境中实现可控优化复杂度

来自主题: AI资讯

3528 点击 2024-07-29 17:50

ECCV 2024｜是真看到了，还是以为自己看到了？多模态大模型对文本预训练知识的过度依赖该解决了

随着大型语言模型（LLMs）的进步，多模态大型语言模型（MLLMs）迅速发展。它们使用预训练的视觉编码器处理图像，并将图像与文本信息一同作为 Token 嵌入输入至 LLMs，从而扩展了模型处理图像输入的对话能力。这种能力的提升为自动驾驶和医疗助手等多种潜在应用领域带来了可能性。

来自主题: AI技术研报

8961 点击 2024-07-27 19:33

万亿token！史上最大多模态数据集诞生

开源多模态大模型或将开始腾飞。

来自主题: AI技术研报

7371 点击 2024-07-27 19:29

为什么AI数不清Strawberry里有几个 r？Karpathy：我用表情包给你解释一下

让模型知道自己擅长什么、不擅长什么是一个很重要的问题。

来自主题: AI资讯

8147 点击 2024-07-27 19:02

GPT-4o mini实力霸榜，限时2个月微调不花钱！每天200万训练token免费薅

Llama 3.1 405B巨兽开源的同时，OpenAI又抢了一波风头。从现在起，每天200万训练token免费微调模型，截止到9月23日。

来自主题: AI资讯

4780 点击 2024-07-26 17:20

最强开源大模型一夜封神，Llama 3.1震撼发布，真正的全民GPT-4时代来了

榨干16000块H100、基于15亿个Tokens训练。

来自主题: AI资讯

5336 点击 2024-07-25 10:32

无限生成视频，还能规划决策，扩散强制整合下一token预测与全序列扩散

近日，MIT CSAIL 的一个研究团队（一作为 MIT 在读博士陈博远）成功地将全序列扩散模型与下一 token 模型的强大能力统合到了一起，提出了一种训练和采样范式：Diffusion Forcing（DF）。

来自主题: AI技术研报

4911 点击 2024-07-23 16:40

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开源模型不如瞎蒙

当今的LLM已经号称能够支持百万级别的上下文长度，这对于模型的能力来说，意义重大。但近日的两项独立研究表明，它们可能只是在吹牛，LLM实际上并不能理解这么长的内容。

来自主题: AI资讯

5308 点击 2024-07-23 16:10

Kimi、豆包发力AI搜索入口，打响轻量化之争

价格战的烽烟终究是吹到了OpenAI，取代GPT-3.5的GPT-4o mini正式上线，每100万Token的输入/输出分别是15美分/60美分。而在此之前，国内的大模型厂商已经把大模型的体验成本降低到了几乎免费。继“百模大战”后，越来越多企业意识到大模型只是“技术和能力”，只有利用这个新工具帮行业解决实际问题，才能让大模型在业务层面带来效率提升，本质上这也是大模型“商业化”的必经之路。

来自主题: AI资讯

9561 点击 2024-07-20 12:00