AI资讯新闻榜单内容搜索-tokens

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: tokens

国产GPU跑满血DeepSeek，已经可以100 tokens/s了！

国产GPU跑满血DeepSeek，已经可以100 tokens/s了！

国产GPU跑满血DeepSeek，已经可以100 tokens/s了！

放眼当下，到底哪个芯片跑满血DeepSeek是最快的？答案很意外——不是你以为的英伟达，而是一家国产GPU。因为现在它的速度，已经直接来到了100 tokens/s！

来自主题: AI资讯

8072 点击 2025-07-27 14:04

「Tokens是胡扯」，Mamba作者抛出颠覆性观点，揭露Transformer深层缺陷

「Tokens是胡扯」，Mamba作者抛出颠覆性观点，揭露Transformer深层缺陷

「Tokens是胡扯」，Mamba作者抛出颠覆性观点，揭露Transformer深层缺陷

「Tokenization（分词）是 Transformer 模型为弥补自身缺陷不得不戴上的枷锁。」

来自主题: AI技术研报

7633 点击 2025-07-10 13:16

重塑AI记忆边界：MemOS开源！时序推理较OpenAI提升159%

重塑AI记忆边界：MemOS开源！时序推理较OpenAI提升159%

重塑AI记忆边界：MemOS开源！时序推理较OpenAI提升159%

大模型记忆管理和优化框架是当前各大厂商争相优化的热点方向，MemOS 相比现有 OpenAI 的全局记忆在大模型记忆评测集上呈现出显著的提升，平均准确性提升超过 38.97%，Tokens 的开销进一步降低 60.95%，一举登顶记忆管理的 SOTA 框架，特别是在考验框架时序建模与检索能力的时序推理任务上，提升比例更是达到了 159%，相当震撼！

来自主题: AI技术研报

10401 点击 2025-07-07 14:44

DeepSeek用户慎入！体验完这款百万Tokens新"源神"，我怕你回不去了【附5个神仙用法】

DeepSeek用户慎入！体验完这款百万Tokens新"源神"，我怕你回不去了【附5个神仙用法】

DeepSeek用户慎入！体验完这款百万Tokens新"源神"，我怕你回不去了【附5个神仙用法】

最近，我的AI交流群和别的一些AI群都炸锅了，话题的焦点是MiniMax-M1

来自主题: AI产品测评

12401 点击 2025-06-18 11:27

想知道你的LLM API被过度收费了吗？隐藏的Tokens终于可以被审计了

想知道你的LLM API被过度收费了吗？隐藏的Tokens终于可以被审计了

想知道你的LLM API被过度收费了吗？隐藏的Tokens终于可以被审计了

近年来，大型语言模型（LLM）在处理复杂任务方面取得了显著进展，尤其体现在多步推理、工具调用以及多智能体协作等高级应用中。这些能力的提升，往往依赖于模型内部一系列复杂的「思考」过程或 Agentic System 中的 Agent 间频繁信息交互。

来自主题: AI技术研报

9361 点击 2025-06-18 11:05

港科大Apple新研究：Tokens使用量减少，模型推理还更强了

港科大Apple新研究：Tokens使用量减少，模型推理还更强了

港科大Apple新研究：Tokens使用量减少，模型推理还更强了

1+1等于几？

来自主题: AI技术研报

8941 点击 2025-05-28 15:03

秘塔AI推出“极速”模型，400 tokens/s，你搜索，我秒回

秘塔AI推出“极速”模型，400 tokens/s，你搜索，我秒回

秘塔AI推出“极速”模型，400 tokens/s，你搜索，我秒回

是的，秘塔AI搜索推出了全新“极速”模型。通过在GPU上进行kernel fusion，以及在CPU上进行动态编译优化，我们在单张H800 GPU上实现了最高400 tokens/秒的响应速度，大部分问题2秒内就能答完。

来自主题: AI资讯

12453 点击 2025-05-27 09:45

12秒生成1万token！谷歌推出文本「扩散模型」Gemini Diffusion，研究员：演示都得降速看

12秒生成1万token！谷歌推出文本「扩散模型」Gemini Diffusion，研究员：演示都得降速看

12秒生成1万token！谷歌推出文本「扩散模型」Gemini Diffusion，研究员：演示都得降速看

谷歌又放新大招了，将图像生成常用的“扩散技术”引入语言模型，12秒能生成1万tokens。

来自主题: AI资讯

9056 点击 2025-05-22 10:23

ICML 2025｜如何凭「自动补全」实现100K生成3×加速？

ICML 2025｜如何凭「自动补全」实现100K生成3×加速？

ICML 2025｜如何凭「自动补全」实现100K生成3×加速？

在当前大模型推理愈发复杂的时代，如何快速、高效地产生超长文本，成为了模型部署与优化中的一大核心挑战。

来自主题: AI技术研报

9933 点击 2025-05-18 14:38

OpenAI没说的秘密，Meta全揭了？华人一作GPT-4o同款技术，爆打扩散王者

OpenAI没说的秘密，Meta全揭了？华人一作GPT-4o同款技术，爆打扩散王者

OpenAI没说的秘密，Meta全揭了？华人一作GPT-4o同款技术，爆打扩散王者

自回归模型，首次生成2048×2048分辨率图像！来自Meta、西北大学、新加坡国立大学等机构的研究人员，专门为多模态大语言模型（MLLMs）设计的TokenShuffle，显著减少了计算中的视觉Token数量，提升效率并支持高分辨率图像合成。

来自主题: AI技术研报

10324 点击 2025-04-28 09:16

上一页当前第6页,共10页下一页