AI资讯新闻榜单内容搜索-token

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: token
Kimi K2新模型来了!多项测试超Claude、审美超前代,免费可用

Kimi K2新模型来了!多项测试超Claude、审美超前代,免费可用

Kimi K2新模型来了!多项测试超Claude、审美超前代,免费可用

智东西9月5日消息,刚刚,大模型独角兽月之暗面发布新模型Kimi K2-0905,目前,Kimi应用和网页版中的K2模型已全量升级到Kimi K2-0905。该模型的核心升级点为Agentic Coding能力增强、支持256K上下文、API支持高达60-100Token/s的输出速度、支持Claude Code。

来自主题: AI资讯
8113 点击    2025-09-05 16:54
大模型“记性差一点”反而更聪明!金鱼损失随机剔除token,让AI不再死记硬背

大模型“记性差一点”反而更聪明!金鱼损失随机剔除token,让AI不再死记硬背

大模型“记性差一点”反而更聪明!金鱼损失随机剔除token,让AI不再死记硬背

训练大模型时,有时让它“记性差一点”,反而更聪明! 大语言模型如果不加约束,很容易把训练数据原封不动地复刻出来。为解决这个问题,来自马里兰大学、图宾根大学和马普所的研究团队提出了一个新方法——金鱼损失(Goldfish Loss)。

来自主题: AI资讯
5589 点击    2025-09-04 11:33
第一性原理视角下的MoE推理的经济学分析

第一性原理视角下的MoE推理的经济学分析

第一性原理视角下的MoE推理的经济学分析

随着DeepSeek R1、Kimi K2和DeepSeek V3.1混合专家(MoE)模型的相继发布,它们已成为智能前沿领域大语言模型(LLM)的领先架构。由于其庞大的规模(1万亿参数及以上)和稀疏计算模式(每个token仅激活部分参数而非整个模型),MoE式LLM对推理工作负载提出了重大挑战,显著改变了底层的推理经济学。

来自主题: AI技术研报
5705 点击    2025-09-03 11:22
被低估的GPT-5!OpenAI给7亿人解锁最强AI,大众智能一夜撕裂旧秩序

被低估的GPT-5!OpenAI给7亿人解锁最强AI,大众智能一夜撕裂旧秩序

被低估的GPT-5!OpenAI给7亿人解锁最强AI,大众智能一夜撕裂旧秩序

GPT-5背后的真正野心并非单纯追求性能,而是通过「自动路由」与「思考配额」开启「单位token经济学」。这一机制让高价值请求直连交易闭环,免费流量首次具备现金流。与此同时,顶级AI的普及让十亿人几乎零成本接触博士级智能,「大众智能」正在成新的历史拐点。

来自主题: AI资讯
5477 点击    2025-08-31 13:40
DeepSeek、GPT-5带头转向混合推理,一个token也不能浪费

DeepSeek、GPT-5带头转向混合推理,一个token也不能浪费

DeepSeek、GPT-5带头转向混合推理,一个token也不能浪费

在最近的一档脱口秀节目中,演员张俊调侃 DeepSeek 是一款非常「内耗」的 AI,连个「1 加 1 等于几」都要斟酌半天。

来自主题: AI资讯
5732 点击    2025-08-31 13:17
杜克大学、Zoom推出LiveMCP‑101:GPT‑5表现最佳但未破60%,闭源模型Token效率对数规律引关注

杜克大学、Zoom推出LiveMCP‑101:GPT‑5表现最佳但未破60%,闭源模型Token效率对数规律引关注

杜克大学、Zoom推出LiveMCP‑101:GPT‑5表现最佳但未破60%,闭源模型Token效率对数规律引关注

杜克大学与 Zoom 的研究者们推出了 LiveMCP-101,这是首个专门针对真实动态环境设计的 MCP-enabled Agent 评测基准。该基准包含 101 个精心设计的任务,涵盖旅行规划,体育娱乐,软件工程等多种不同场景,要求 Agent 在多步骤、多工具协同的场景下完成任务。

来自主题: AI技术研报
5351 点击    2025-08-29 11:13
ChatGPT到底学了多少「污言秽语」?清华团队首提大语言模型中文语料污染治理技术

ChatGPT到底学了多少「污言秽语」?清华团队首提大语言模型中文语料污染治理技术

ChatGPT到底学了多少「污言秽语」?清华团队首提大语言模型中文语料污染治理技术

如果我们的教科书里包含大量的污言秽语,那么我们能学好语言吗?这种荒唐的问题却出现在最先进 ChatGPT 系列模型的学习过程中。

来自主题: AI技术研报
6457 点击    2025-08-26 12:11
GPT-5系统提示词突遭泄露,17803 token曝光OpenAI小心思!

GPT-5系统提示词突遭泄露,17803 token曝光OpenAI小心思!

GPT-5系统提示词突遭泄露,17803 token曝光OpenAI小心思!

一份全新GPT-5系统提示词,在GitHub中悄然泄露,足足有17803 token。内容设计超精细,用户对齐、拟人风格、输出质量等全面覆盖。

来自主题: AI资讯
5630 点击    2025-08-25 12:39
大模型价格战逆转?深扒17家厂商最新定价,竟有超7成在涨价

大模型价格战逆转?深扒17家厂商最新定价,竟有超7成在涨价

大模型价格战逆转?深扒17家厂商最新定价,竟有超7成在涨价

DeepSeek涨价了。 智东西8月23日报道,8月21日,DeepSeek在其公众号官宣了DeepSeek-V3.1的正式发布,还宣布自9月6日起,DeepSeek将执行新价格表,取消了今年2月底推出的夜间优惠,推理与非推理API统一定价,输出价格调整至12元/百万tokens。这一决定,让使用DeepSeek API的最低价格较过去上升了50%。

来自主题: AI资讯
7211 点击    2025-08-25 12:29