AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
LoRA中到底有多少参数冗余?新研究:砍掉95%都能保持高性能            机器之心     2025年05月02日 12:39 北京

LoRA中到底有多少参数冗余?新研究:砍掉95%都能保持高性能 机器之心 2025年05月02日 12:39 北京

LoRA中到底有多少参数冗余?新研究:砍掉95%都能保持高性能 机器之心 2025年05月02日 12:39 北京

LoRA 中到底存在多少参数冗余?这篇创新研究介绍了 LoRI 技术,它证明即使大幅减少 LoRA 的可训练参数,模型性能依然保持强劲。

来自主题: AI技术研报
8165 点击    2025-05-02 15:23
56.6亿营收背后的AIGC狂飙,中国AI行业有了“爆款生产”新样本

56.6亿营收背后的AIGC狂飙,中国AI行业有了“爆款生产”新样本

56.6亿营收背后的AIGC狂飙,中国AI行业有了“爆款生产”新样本

昆仑自研的AI模型(SOTA)就像是“最好的锄头”,正在助力公司开采AIGC领域那片“最肥沃的金矿”。

来自主题: AI商业项目
11592 点击    2025-05-02 14:47
全网都在等梁文锋

全网都在等梁文锋

全网都在等梁文锋

这组充满悬念的组合引发科技圈热议,业内普遍推测DeepSeek R2模型已进入发布倒计时。凤凰网科技从知情人士处获悉,目前网传信息的真实性含量很低。

来自主题: AI资讯
8238 点击    2025-05-02 14:27
CVPR 2025 | CV 微调卷出天际,Mona:我小、我强、我省资源

CVPR 2025 | CV 微调卷出天际,Mona:我小、我强、我省资源

CVPR 2025 | CV 微调卷出天际,Mona:我小、我强、我省资源

Mona(Multi-cognitive Visual Adapter)是一种新型视觉适配器微调方法,旨在打破传统全参数微调(full fine-tuning)在视觉识别任务中的性能瓶颈。

来自主题: AI技术研报
8033 点击    2025-05-02 14:17
DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能

DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能

DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能

DeepSeek放大招!新模型专注数学定理证明,大幅刷新多项高难基准测试。在普特南测试上,新模型DeepSeek-Prover-V2直接把记录刷新到49道。目前的第一名在657道题中只做出10道题,为Kimi与AIME2024冠军团队Numina合作成果Kimina-Prover。

来自主题: AI技术研报
9161 点击    2025-05-01 22:52
上海打造AI医疗高地!总书记考察的“模速空间”,这些企业已入驻!

上海打造AI医疗高地!总书记考察的“模速空间”,这些企业已入驻!

上海打造AI医疗高地!总书记考察的“模速空间”,这些企业已入驻!

4月29日,习近平总书记在上海考察时,在中共中央政治局委员、上海市委书记陈吉宁和市长龚正陪同下,来到位于徐汇区的上海“模速空间”大模型创新生态社区调研。

来自主题: AI资讯
7879 点击    2025-05-01 14:22
“Qwen3之后,我才真正敢投AI应用”

“Qwen3之后,我才真正敢投AI应用”

“Qwen3之后,我才真正敢投AI应用”

2025年4月29日凌晨,距离通义千问Qwen3正式发布还有5小时,X和GitHub上的开发者们已经搬好小板凳蹲守发布。开源社区的技术爱好者们熬夜刷新,等待第一时间测试和体验这款备受期待的中国大模型新作。

来自主题: AI资讯
8843 点击    2025-05-01 13:57
400万token新SOTA!英伟达UIUC联手:兼顾长短上下文顶尖性能

400万token新SOTA!英伟达UIUC联手:兼顾长短上下文顶尖性能

400万token新SOTA!英伟达UIUC联手:兼顾长短上下文顶尖性能

来自英伟达和UIUC的华人团队提出一种高效训练方法,将LLM上下文长度从128K扩展至惊人的400万token SOTA纪录!基于Llama3.1-Instruct打造的UltraLong-8B模型,不仅在长上下文基准测试中表现卓越,还在标准任务中保持顶尖竞争力。

来自主题: AI技术研报
8157 点击    2025-05-01 13:54