AI资讯新闻榜单内容搜索-io

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: io
ICML 2025 | 打破残差连接瓶颈,彩云科技&北邮提出MUDDFormer架构让Transformer再进化!

ICML 2025 | 打破残差连接瓶颈,彩云科技&北邮提出MUDDFormer架构让Transformer再进化!

ICML 2025 | 打破残差连接瓶颈,彩云科技&北邮提出MUDDFormer架构让Transformer再进化!

但在当今的深度 Transformer LLMs 中仍有其局限性,限制了信息在跨层间的高效传递。 彩云科技与北京邮电大学近期联合提出了一个简单有效的残差连接替代:多路动态稠密连接(MUltiway Dynamic Dense (MUDD) connection),大幅度提高了 Transformer 跨层信息传递的效率。

来自主题: AI技术研报
6140 点击    2025-06-28 11:33
阿里国际站张阔:如何打响这场“AI轴心战”

阿里国际站张阔:如何打响这场“AI轴心战”

阿里国际站张阔:如何打响这场“AI轴心战”

阿里国际站总裁张阔强调AI转型需全员设定目标,Accio AI搜索工具半年用户超百万,询盘量月环比增10倍。张阔考察中美贸易摩擦后发现中国供应链不可或缺,外贸订单强劲增长。AI从卖家侧提升效率后转向买家搜索,推动业务全面AI化,618外贸订单增42%。

来自主题: AI资讯
8517 点击    2025-06-28 10:49
DeepSeek-R2为什么还没发?

DeepSeek-R2为什么还没发?

DeepSeek-R2为什么还没发?

全网翘首以盼的DeepSeek-R2,再次被曝推迟!据The Information报道,由于DeepSeek CEO梁文锋始终对R2的表现不满意,因此R2迟迟未能发布。此外,他们还援引两位国内知情人士的消息称,R2研发进程缓慢可能是由于缺少英伟达H20芯片。

来自主题: AI资讯
8710 点击    2025-06-27 16:46
人民大学&字节Seed:利用μP实现Diffusion Transformers高效扩展

人民大学&字节Seed:利用μP实现Diffusion Transformers高效扩展

人民大学&字节Seed:利用μP实现Diffusion Transformers高效扩展

近年来,diffusion Transformers已经成为了现代视觉生成模型的主干网络。随着数据量和任务复杂度的进一步增加,diffusion Transformers的规模也在快速增长。然而在模型进一步扩大的过程中,如何调得较好的超参(如学习率)已经成为了一个巨大的问题,阻碍了大规模diffusion Transformers释放其全部的潜能。

来自主题: AI技术研报
7388 点击    2025-06-26 15:52
上科大沈定刚团队联合上海交大口腔医学院开发人工智能系统PerioAI助力牙周病精准诊断 | Cell Press对话科学家

上科大沈定刚团队联合上海交大口腔医学院开发人工智能系统PerioAI助力牙周病精准诊断 | Cell Press对话科学家

上科大沈定刚团队联合上海交大口腔医学院开发人工智能系统PerioAI助力牙周病精准诊断 | Cell Press对话科学家

该研究提出了一种全新的三维牙周病自动诊断系统——PerioAI,实现了对龈骨距离(gingiva-bone distance, GBD)的非侵入式、高精度测量,为牙周病的数字化诊疗提供了全新解决方案。

来自主题: AI资讯
8143 点击    2025-06-26 11:05
7B小模型超越DeepSeek-R1:模仿人类教师,弱模型也能教出强推理LLM | Transformer作者团队

7B小模型超越DeepSeek-R1:模仿人类教师,弱模型也能教出强推理LLM | Transformer作者团队

7B小模型超越DeepSeek-R1:模仿人类教师,弱模型也能教出强推理LLM | Transformer作者团队

Thinking模式当道,教师模型也该学会“启发式”教学了—— 由Transformer作者之一Llion Jones创立的明星AI公司Sakana AI,带着他们的新方法来了!

来自主题: AI技术研报
8852 点击    2025-06-25 10:55