AI资讯新闻榜单内容搜索-TEN

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: TEN

原来Scaling Law还能被优化？Meta这招省token又提效

原来Scaling Law还能被优化？Meta这招省token又提效

原来Scaling Law还能被优化？Meta这招省token又提效

2017 年，一篇《Attention Is All You Need》论文成为 AI 发展的一个重要分水岭，其中提出的 Transformer 依然是现今主流语言模型的基础范式。尤其是在基于 Transformer 的语言模型的 Scaling Law 得到实验验证后，AI 领域的发展更是进入了快车道。

来自主题: AI技术研报

5945 点击 2025-07-06 14:56

离开百川去创业！8 个人用 2 个多月肝出一款热门 Agent 产品，创始人：Agent 技术有些玄学

离开百川去创业！8 个人用 2 个多月肝出一款热门 Agent 产品，创始人：Agent 技术有些玄学

离开百川去创业！8 个人用 2 个多月肝出一款热门 Agent 产品，创始人：Agent 技术有些玄学

“在百川智能的那段时间，我和同事们始终处在一种很亢奋的状态。尽管我们常常工作到深夜，甚至一两点钟才下班，但内心非常地充实和开心。”如今回忆起那段经历时，前百川工具链负责人徐文健的眼中依然有光。

来自主题: AI资讯

5308 点击 2025-07-05 20:24

5人团队，1700万融资，现金流为正，继Reducto获Benchmark 2450万投资后，文档处理赛道又迎来重量级玩家

5人团队，1700万融资，现金流为正，继Reducto获Benchmark 2450万投资后，文档处理赛道又迎来重量级玩家

5人团队，1700万融资，现金流为正，继Reducto获Benchmark 2450万投资后，文档处理赛道又迎来重量级玩家

你有没有想过，为什么在这个云计算和AI横行的时代，PDF文档处理依然是企业最大的痛点之一？想象一下这样的场景：一份包含数百页的贷款申请文档躺在银行系统里，等待人工审核，而申请人只能苦苦等待几天甚至几周才能知道结果。与此同时，医院里的医疗记录还在用打印机输出，然后手工传递给下一个医生。

来自主题: AI资讯

5546 点击 2025-07-01 11:03

用好视觉Attention局部性，清华、字节提出Token Reorder，无损实现5倍稀疏、4比特量化

用好视觉Attention局部性，清华、字节提出Token Reorder，无损实现5倍稀疏、4比特量化

用好视觉Attention局部性，清华、字节提出Token Reorder，无损实现5倍稀疏、4比特量化

近年来，随着视觉生成模型的发展，视觉生成任务的输入序列长度逐渐增长（高分辨率生成，视频多帧生成，可达到 10K-100K）。

来自主题: AI技术研报

5870 点击 2025-06-30 15:35

深度思考｜Claude Code背后隐藏着Anthropic怎样的“野心”？

深度思考｜Claude Code背后隐藏着Anthropic怎样的“野心”？

深度思考｜Claude Code背后隐藏着Anthropic怎样的“野心”？

在经过深度思考后，我有了一个大胆的猜想：我们一直在用错误的框架理解它，大家都把它当作"更好的编程工具"，但我越用越觉得，这根本不是一个编程工具，而是一个披着终端外衣的通用 AI agent。正好周末看了Anthropic 产品负责人 Michael Gerstenhaber 的最新一期访谈，

来自主题: AI资讯

8102 点击 2025-06-30 09:47

深度分析：为什么a16z敢1500万美金押注一个"作弊工具"？Attention is All You Need的AI时代！

深度分析：为什么a16z敢1500万美金押注一个"作弊工具"？Attention is All You Need的AI时代！

深度分析：为什么a16z敢1500万美金押注一个"作弊工具"？Attention is All You Need的AI时代！

你有没有想过，一个因为开发作弊工具被哥伦比亚大学开除的 21 岁学生，竟然能在短短几个月内获得 a16z 领投的 1500 万美元融资？

来自主题: AI资讯

7122 点击 2025-06-29 11:31

无需训练，即插即用，2倍GPU端到端推理加速——视频扩散模型加速方法DraftAttention

无需训练，即插即用，2倍GPU端到端推理加速——视频扩散模型加速方法DraftAttention

无需训练，即插即用，2倍GPU端到端推理加速——视频扩散模型加速方法DraftAttention

在高质量视频生成任务中，扩散模型（Diffusion Models）已经成为主流。然而，随着视频长度和分辨率的提升，Diffusion Transformer（DiT）模型中的注意力机制计算量急剧增加，成为推理效率的最大瓶颈。

来自主题: AI技术研报

5970 点击 2025-06-28 16:09

医疗AI新星Tennr获1.01亿美元融资，破解转诊“失联”困局

医疗AI新星Tennr获1.01亿美元融资，破解转诊“失联”困局

医疗AI新星Tennr获1.01亿美元融资，破解转诊“失联”困局

每年数百万患者在医疗转诊中“消失”，这家纽约创业公司用AI重建连接，估值半年飙升至6.05亿美元。

来自主题: AI资讯

5461 点击 2025-06-27 12:00

NVIDIA Tensor Core 的演变：从 Volta 到 Blackwell

NVIDIA Tensor Core 的演变：从 Volta 到 Blackwell

NVIDIA Tensor Core 的演变：从 Volta 到 Blackwell

在我们去年 AI Scaling Laws article from late last year中，我们探讨了多层 AI 扩展定律如何持续推动 AI 行业向前发展，使得模型能力的增长速度超过了摩尔定律，并且单位 token 成本也相应地迅速降低。

来自主题: AI技术研报

6115 点击 2025-06-24 11:09

舍弃CUDA编程！CMU等用几十行代码将LLM编译成巨型内核，推理延迟可降6.7倍

舍弃CUDA编程！CMU等用几十行代码将LLM编译成巨型内核，推理延迟可降6.7倍

舍弃CUDA编程！CMU等用几十行代码将LLM编译成巨型内核，推理延迟可降6.7倍

在 AI 领域，英伟达开发的 CUDA 是驱动大语言模型（LLM）训练和推理的核心计算引擎。

来自主题: AI资讯

6315 点击 2025-06-22 12:07

上一页当前第2页,共12页下一页