AI资讯新闻榜单内容搜索-tokenizer

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: tokenizer
无Tokenizer时代真要来了?Mamba作者再发颠覆性论文,挑战Transformer

无Tokenizer时代真要来了?Mamba作者再发颠覆性论文,挑战Transformer

无Tokenizer时代真要来了?Mamba作者再发颠覆性论文,挑战Transformer

最近,Mamba 作者之一 Albert Gu 又发新研究,他参与的一篇论文《 Dynamic Chunking for End-to-End Hierarchical Sequence Modeling 》提出了一个分层网络 H-Net,其用模型内部的动态分块过程取代 tokenization,从而自动发现和操作有意义的数据单元。

来自主题: AI技术研报
6065 点击    2025-07-13 11:37
李飞飞、吴佳俊团队新作:不需要卷积和GAN,更好的图像tokenizer来了

李飞飞、吴佳俊团队新作:不需要卷积和GAN,更好的图像tokenizer来了

李飞飞、吴佳俊团队新作:不需要卷积和GAN,更好的图像tokenizer来了

当我们看到一张猫咪照片时,大脑自然就能识别「这是一只猫」。但对计算机来说,它看到的是一个巨大的数字矩阵 —— 假设是一张 1000×1000 像素的彩色图片,实际上是一个包含 300 万个数字的数据集(1000×1000×3 个颜色通道)。每个数字代表一个像素点的颜色深浅,从 0 到 255。

来自主题: AI技术研报
7443 点击    2025-03-20 16:51
UC伯克利等提出具身智能「动作Tokenizer」,效率飙升5倍!

UC伯克利等提出具身智能「动作Tokenizer」,效率飙升5倍!

UC伯克利等提出具身智能「动作Tokenizer」,效率飙升5倍!

研究者提出了FAST,一种高效的动作Tokenizer。通过结合离散余弦变换(DCT)和字节对编码(BPE),FAST显著缩短了训练时间,并且能高效地学习和执行复杂任务,标志着机器人自回归Transformer训练的一个重要突破。

来自主题: AI技术研报
7192 点击    2025-01-23 13:19
从2019年到现在,是时候重新审视Tokenization了

从2019年到现在,是时候重新审视Tokenization了

从2019年到现在,是时候重新审视Tokenization了

2019 年问世的 GPT-2,其 tokenizer 使用了 BPE 算法,这种算法至今仍很常见,但这种方式是最优的吗?来自 HuggingFace 的一篇文章给出了解释。

来自主题: AI技术研报
8179 点击    2025-01-04 14:20
微软开源视频Tokenizer新SOTA!显著优于Cosmos Tokenizer和Open-Sora

微软开源视频Tokenizer新SOTA!显著优于Cosmos Tokenizer和Open-Sora

微软开源视频Tokenizer新SOTA!显著优于Cosmos Tokenizer和Open-Sora

Sora、Genie等模型会都用到的Tokenizer,微软下手了—— 开源了一套全能的Video Tokenizer,名为VidTok。

来自主题: AI技术研报
6737 点击    2024-12-26 15:43
字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍

字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍

字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍

在生成式模型的迅速发展中,Image Tokenization 扮演着一个很重要的角色,例如Diffusion依赖的VAE或者是Transformer依赖的VQGAN。这些Tokenizers会将图像编码至一个更为紧凑的隐空间(latent space),使得生成高分辨率图像更有效率。

来自主题: AI技术研报
9672 点击    2024-06-22 23:00