AI资讯新闻榜单内容搜索-token

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: token
单靠推理Scaling Law无法成就o1!无限推理token,GPT-4o依然完败

单靠推理Scaling Law无法成就o1!无限推理token,GPT-4o依然完败

单靠推理Scaling Law无法成就o1!无限推理token,GPT-4o依然完败

CoT铸就了o1推理王者。 它开创了一种推理scaling新范式——随着算力增加、更长响应时间,o1性能也随之增长。

来自主题: AI资讯
2420 点击    2024-09-29 16:56
ECCV 2024 | 探索离散Token视觉生成中的自适应推理策略

ECCV 2024 | 探索离散Token视觉生成中的自适应推理策略

ECCV 2024 | 探索离散Token视觉生成中的自适应推理策略

本论文第一作者倪赞林是清华大学自动化系 2022 级直博生,师从黄高副教授,主要研究方向为高效深度学习与图像生成。他曾在 ICCV、CVPR、ECCV、ICLR 等国际会议上发表多篇学术论文。

来自主题: AI技术研报
6136 点击    2024-09-19 11:14
为什么大模型API的output token比input token贵?

为什么大模型API的output token比input token贵?

为什么大模型API的output token比input token贵?

从大模型爆发到现在,我就一直好奇为什么output token比input token要贵,而且有的会贵好几倍!今天就这个话题和大家聊一聊。

来自主题: AI资讯
2605 点击    2024-09-11 10:21
全球3.5亿下载量破纪录! Llama家族暴涨10倍,开源帝国掀AI革命

全球3.5亿下载量破纪录! Llama家族暴涨10倍,开源帝国掀AI革命

全球3.5亿下载量破纪录! Llama家族暴涨10倍,开源帝国掀AI革命

诞生一年半,Llama家族早已稳坐开源界头把交椅。最新报告称,Llama全球下载量近3.5亿,是去年同期的10倍。而模型开源让每个人最深体会是,token价格一降再降。

来自主题: AI资讯
6412 点击    2024-08-30 20:44
GPU推理时代终结?世界最大芯片加持推理狂飙20倍,英伟达H100也被干趴!

GPU推理时代终结?世界最大芯片加持推理狂飙20倍,英伟达H100也被干趴!

GPU推理时代终结?世界最大芯片加持推理狂飙20倍,英伟达H100也被干趴!

LLM若以每秒1000+token高速推理,当前最先进的GPU根本无法实现!Cerebras Inference一出世,推理速度赶超英伟达GPU,背靠自研的世界最大芯片加持。而且,还将推理价格打了下来。

来自主题: AI资讯
5005 点击    2024-08-28 18:16
全球最大芯片,进军推理:1800 token/秒,全球最快

全球最大芯片,进军推理:1800 token/秒,全球最快

全球最大芯片,进军推理:1800 token/秒,全球最快

自推出了使用一整个晶圆制造的芯片以来,Cerebras在过去几年里的宣传,都是以攻进英伟达所把持的AI芯片市场为目标。

来自主题: AI资讯
6092 点击    2024-08-28 16:06
ACM MM24 | 复旦提出首个基于扩散模型的视频非限制性对抗攻击框架,主流CNN和ViT架构都防不住它

ACM MM24 | 复旦提出首个基于扩散模型的视频非限制性对抗攻击框架,主流CNN和ViT架构都防不住它

ACM MM24 | 复旦提出首个基于扩散模型的视频非限制性对抗攻击框架,主流CNN和ViT架构都防不住它

来自复旦大学视觉与学习实验室的研究者们提出了一种新型的面向视频模型的对抗攻击方法 - 基于扩散模型的视频非限制迁移攻击(ReToMe-VA)。该方法采用逐时间步对抗隐变量优化策略,以实现生成对抗样本的空间不可感知性;同时,在生成对抗帧的去噪过程中引入了递归 token 合并策略,通过匹配及合并视频帧之间的自注意力 token,显著提升了对抗视频的迁移性和时序一致性。

来自主题: AI技术研报
8857 点击    2024-08-27 20:08