AI资讯新闻榜单内容搜索-Token

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: Token
大模型预测,下一个token何必是文字?

大模型预测,下一个token何必是文字?

大模型预测,下一个token何必是文字?

太快了太快了…

来自主题: AI资讯
7001 点击    2024-03-30 12:19
Mamba超强进化体一举颠覆Transformer!单张A100跑140K上下文

Mamba超强进化体一举颠覆Transformer!单张A100跑140K上下文

Mamba超强进化体一举颠覆Transformer!单张A100跑140K上下文

【新智元导读】52B的生产级Mamba大模型来了!这个超强变体Jamba刚刚打破世界纪录,它能正面硬刚Transformer,256K超长上下文窗口,吞吐量提升3倍,权重免费下载。

来自主题: AI技术研报
5864 点击    2024-03-29 16:43
详解Latte:去年底上线的全球首个开源文生视频DiT

详解Latte:去年底上线的全球首个开源文生视频DiT

详解Latte:去年底上线的全球首个开源文生视频DiT

随着 Sora 的成功发布,视频 DiT 模型得到了大量的关注和讨论。设计稳定的超大规模神经网络一直是视觉生成领域的研究重点。DiT [1] 的成功为图像生成的规模化提供了可能性。

来自主题: AI资讯
3088 点击    2024-03-27 17:56
讨论下一个token预测时,我们可能正在走进陷阱

讨论下一个token预测时,我们可能正在走进陷阱

讨论下一个token预测时,我们可能正在走进陷阱

自香农在《通信的数学原理》一书中提出「下一个 token 预测任务」之后,这一概念逐渐成为现代语言模型的核心部分。最近,围绕下一个 token 预测的讨论日趋激烈。

来自主题: AI资讯
6394 点击    2024-03-25 17:05
百万token上下文窗口也杀不死向量数据库?CPU笑了

百万token上下文窗口也杀不死向量数据库?CPU笑了

百万token上下文窗口也杀不死向量数据库?CPU笑了

“Claude 3、Gemini 1.5,是要把RAG(检索增强生成)给搞死了吗?”

来自主题: AI技术研报
2264 点击    2024-03-19 17:44
不依赖token,字节级模型来了!直接处理二进制数据

不依赖token,字节级模型来了!直接处理二进制数据

不依赖token,字节级模型来了!直接处理二进制数据

微软亚研院等发布bGPT,仍旧基于Transformer,但是模型预测的是下一个字节(byte)。

来自主题: AI技术研报
7435 点击    2024-03-11 18:04
清华NLP组发布InfLLM:无需额外训练,「1024K超长上下文」100%召回!

清华NLP组发布InfLLM:无需额外训练,「1024K超长上下文」100%召回!

清华NLP组发布InfLLM:无需额外训练,「1024K超长上下文」100%召回!

挖掘大模型固有的长文本理解能力,InfLLM在没有引入额外训练的情况下,利用一个外部记忆模块存储超长上下文信息,实现了上下文长度的扩展。

来自主题: AI技术研报
3973 点击    2024-03-11 17:31
200万上下文窗口创飞Gemini 1.5!微软来砸谷歌场子了(doge)

200万上下文窗口创飞Gemini 1.5!微软来砸谷歌场子了(doge)

200万上下文窗口创飞Gemini 1.5!微软来砸谷歌场子了(doge)

谷歌刚刷新大模型上下文窗口长度记录,发布支持100万token的Gemini 1.5,微软就来砸场子了。

来自主题: AI技术研报
6064 点击    2024-02-24 11:58
ChatGPT突然疯了,意外输出震惊网友!OpenAI官方回应:token预测是根源​

ChatGPT突然疯了,意外输出震惊网友!OpenAI官方回应:token预测是根源​

ChatGPT突然疯了,意外输出震惊网友!OpenAI官方回应:token预测是根源​

ChatGPT突然失去理智,被网友们吵翻了天。许多用户在请求ChatGPT问题时,发现它开始胡言乱语,大篇重复。不一会儿,OpenAI给出官方解释:下一token概率预测相关,目前bug已修复。

来自主题: AI资讯
5838 点击    2024-02-23 14:31