AI资讯新闻榜单内容搜索-TEN

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: TEN
原来Scaling Law还能被优化?Meta这招省token又提效

原来Scaling Law还能被优化?Meta这招省token又提效

原来Scaling Law还能被优化?Meta这招省token又提效

2017 年,一篇《Attention Is All You Need》论文成为 AI 发展的一个重要分水岭,其中提出的 Transformer 依然是现今主流语言模型的基础范式。尤其是在基于 Transformer 的语言模型的 Scaling Law 得到实验验证后,AI 领域的发展更是进入了快车道。

来自主题: AI技术研报
5945 点击    2025-07-06 14:56
离开百川去创业!8 个人用 2 个多月肝出一款热门 Agent 产品,创始人:Agent 技术有些玄学

离开百川去创业!8 个人用 2 个多月肝出一款热门 Agent 产品,创始人:Agent 技术有些玄学

离开百川去创业!8 个人用 2 个多月肝出一款热门 Agent 产品,创始人:Agent 技术有些玄学

“在百川智能的那段时间,我和同事们始终处在一种很亢奋的状态。尽管我们常常工作到深夜,甚至一两点钟才下班,但内心非常地充实和开心。”如今回忆起那段经历时,前百川工具链负责人徐文健的眼中依然有光。

来自主题: AI资讯
5308 点击    2025-07-05 20:24
5人团队,1700万融资,现金流为正,继Reducto获Benchmark 2450万投资后,文档处理赛道又迎来重量级玩家

5人团队,1700万融资,现金流为正,继Reducto获Benchmark 2450万投资后,文档处理赛道又迎来重量级玩家

5人团队,1700万融资,现金流为正,继Reducto获Benchmark 2450万投资后,文档处理赛道又迎来重量级玩家

你有没有想过,为什么在这个云计算和AI横行的时代,PDF文档处理依然是企业最大的痛点之一?想象一下这样的场景:一份包含数百页的贷款申请文档躺在银行系统里,等待人工审核,而申请人只能苦苦等待几天甚至几周才能知道结果。与此同时,医院里的医疗记录还在用打印机输出,然后手工传递给下一个医生。

来自主题: AI资讯
5546 点击    2025-07-01 11:03
用好视觉Attention局部性,清华、字节提出Token Reorder,无损实现5倍稀疏、4比特量化

用好视觉Attention局部性,清华、字节提出Token Reorder,无损实现5倍稀疏、4比特量化

用好视觉Attention局部性,清华、字节提出Token Reorder,无损实现5倍稀疏、4比特量化

近年来,随着视觉生成模型的发展,视觉生成任务的输入序列长度逐渐增长(高分辨率生成,视频多帧生成,可达到 10K-100K)。

来自主题: AI技术研报
5870 点击    2025-06-30 15:35
深度思考|Claude Code背后隐藏着Anthropic怎样的“野心”?

深度思考|Claude Code背后隐藏着Anthropic怎样的“野心”?

深度思考|Claude Code背后隐藏着Anthropic怎样的“野心”?

在经过深度思考后,我有了一个大胆的猜想:我们一直在用错误的框架理解它,大家都把它当作"更好的编程工具",但我越用越觉得,这根本不是一个编程工具,而是一个披着终端外衣的通用 AI agent。正好周末看了Anthropic 产品负责人 Michael Gerstenhaber 的最新一期访谈,

来自主题: AI资讯
8102 点击    2025-06-30 09:47
深度分析:为什么a16z敢1500万美金押注一个"作弊工具"?Attention is All You Need的AI时代!

深度分析:为什么a16z敢1500万美金押注一个"作弊工具"?Attention is All You Need的AI时代!

深度分析:为什么a16z敢1500万美金押注一个"作弊工具"?Attention is All You Need的AI时代!

你有没有想过,一个因为开发作弊工具被哥伦比亚大学开除的 21 岁学生,竟然能在短短几个月内获得 a16z 领投的 1500 万美元融资?

来自主题: AI资讯
7122 点击    2025-06-29 11:31
无需训练,即插即用,2倍GPU端到端推理加速——视频扩散模型加速方法DraftAttention

无需训练,即插即用,2倍GPU端到端推理加速——视频扩散模型加速方法DraftAttention

无需训练,即插即用,2倍GPU端到端推理加速——视频扩散模型加速方法DraftAttention

在高质量视频生成任务中,扩散模型(Diffusion Models)已经成为主流。然而,随着视频长度和分辨率的提升,Diffusion Transformer(DiT)模型中的注意力机制计算量急剧增加,成为推理效率的最大瓶颈。

来自主题: AI技术研报
5970 点击    2025-06-28 16:09
医疗AI新星Tennr获1.01亿美元融资,破解转诊“失联”困局

医疗AI新星Tennr获1.01亿美元融资,破解转诊“失联”困局

医疗AI新星Tennr获1.01亿美元融资,破解转诊“失联”困局

每年数百万患者在医疗转诊中“消失”,这家纽约创业公司用AI重建连接,估值半年飙升至6.05亿美元。

来自主题: AI资讯
5461 点击    2025-06-27 12:00
NVIDIA Tensor Core 的演变:从 Volta 到 Blackwell

NVIDIA Tensor Core 的演变:从 Volta 到 Blackwell

NVIDIA Tensor Core 的演变:从 Volta 到 Blackwell

在我们去年 AI Scaling Laws article from late last year中,我们探讨了多层 AI 扩展定律如何持续推动 AI 行业向前发展,使得模型能力的增长速度超过了摩尔定律,并且单位 token 成本也相应地迅速降低。

来自主题: AI技术研报
6115 点击    2025-06-24 11:09