AI资讯新闻榜单内容搜索-token

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: token
上海交通大学温颖教授:打造“通才”Agent|Agent Insights

上海交通大学温颖教授:打造“通才”Agent|Agent Insights

上海交通大学温颖教授:打造“通才”Agent|Agent Insights

解决问题:语言智能体的动作通常由 Token(令牌,语言模型中表示单词/短语/汉字的最小符号单元)序列组成,直接将强化学习用于语言智能体进行策略优化的过程中,一般需要预定义可行动作集合,同时忽略了动作内 Token 细粒度信用分配问题,团队将 Agent 优化从动作层分解到 Token 层,为每个动作内 Token 提供更精细的监督,可在语言动作空间不受约束的环境中实现可控优化复杂度

来自主题: AI资讯
3528 点击    2024-07-29 17:50
ECCV 2024|是真看到了,还是以为自己看到了?多模态大模型对文本预训练知识的过度依赖该解决了

ECCV 2024|是真看到了,还是以为自己看到了?多模态大模型对文本预训练知识的过度依赖该解决了

ECCV 2024|是真看到了,还是以为自己看到了?多模态大模型对文本预训练知识的过度依赖该解决了

随着大型语言模型(LLMs)的进步,多模态大型语言模型(MLLMs)迅速发展。它们使用预训练的视觉编码器处理图像,并将图像与文本信息一同作为 Token 嵌入输入至 LLMs,从而扩展了模型处理图像输入的对话能力。这种能力的提升为自动驾驶和医疗助手等多种潜在应用领域带来了可能性。

来自主题: AI技术研报
8961 点击    2024-07-27 19:33
万亿token!史上最大多模态数据集诞生

万亿token!史上最大多模态数据集诞生

万亿token!史上最大多模态数据集诞生

开源多模态大模型或将开始腾飞。

来自主题: AI技术研报
7371 点击    2024-07-27 19:29
无限生成视频,还能规划决策,扩散强制整合下一token预测与全序列扩散

无限生成视频,还能规划决策,扩散强制整合下一token预测与全序列扩散

无限生成视频,还能规划决策,扩散强制整合下一token预测与全序列扩散

近日,MIT CSAIL 的一个研究团队(一作为 MIT 在读博士陈博远)成功地将全序列扩散模型与下一 token 模型的强大能力统合到了一起,提出了一种训练和采样范式:Diffusion Forcing(DF)。

来自主题: AI技术研报
4911 点击    2024-07-23 16:40
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙

长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙

长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙

当今的LLM已经号称能够支持百万级别的上下文长度,这对于模型的能力来说,意义重大。但近日的两项独立研究表明,它们可能只是在吹牛,LLM实际上并不能理解这么长的内容。

来自主题: AI资讯
5308 点击    2024-07-23 16:10
Kimi、豆包发力AI搜索入口,打响轻量化之争

Kimi、豆包发力AI搜索入口,打响轻量化之争

Kimi、豆包发力AI搜索入口,打响轻量化之争

价格战的烽烟终究是吹到了OpenAI,取代GPT-3.5的GPT-4o mini正式上线,每100万Token的输入/输出分别是15美分/60美分。而在此之前,国内的大模型厂商已经把大模型的体验成本降低到了几乎免费。 继“百模大战”后,越来越多企业意识到大模型只是“技术和能力”,只有利用这个新工具帮行业解决实际问题,才能让大模型在业务层面带来效率提升,本质上这也是大模型“商业化”的必经之路。

来自主题: AI资讯
9561 点击    2024-07-20 12:00