AI资讯新闻榜单内容搜索-开源大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 开源大模型
这家西方开源大模型公司,开源出了DeepSeek-V3背后的架构!头部模型表现都差不多了,Mistral CEO自曝如何赚钱

这家西方开源大模型公司,开源出了DeepSeek-V3背后的架构!头部模型表现都差不多了,Mistral CEO自曝如何赚钱

这家西方开源大模型公司,开源出了DeepSeek-V3背后的架构!头部模型表现都差不多了,Mistral CEO自曝如何赚钱

面对《the Big Technology Podcast》抛出的问题,Mistral AI的 CEO Arthur Mensch 表示:大模型肯定会走向商品化,当模型表现越来越接近,那么竞争就不在于模型本身,而在于如何让客户用起来。

来自主题: AI资讯
7777 点击    2026-01-19 18:20
陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能

陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能

陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能

新年刚至,陈天桥携手代季峰率先打响开源大模型的第一枪。

来自主题: AI技术研报
8623 点击    2026-01-06 16:50
深度|吴恩达:中国在开源权重模型的发布方面已经远远领先于美国;很多人用Agentic AI的方式是错的

深度|吴恩达:中国在开源权重模型的发布方面已经远远领先于美国;很多人用Agentic AI的方式是错的

深度|吴恩达:中国在开源权重模型的发布方面已经远远领先于美国;很多人用Agentic AI的方式是错的

如果一项任务主要涉及文本处理,并且你拥有完善的数据渠道,能够获取完成该任务所需的全部文本信息,那么人工智能完成这项任务的难度就会较低。

来自主题: AI资讯
10218 点击    2025-12-29 15:04
超越谷歌,全球第一!上交AI科学家王者归来,登顶OpenAI MLE-bench

超越谷歌,全球第一!上交AI科学家王者归来,登顶OpenAI MLE-bench

超越谷歌,全球第一!上交AI科学家王者归来,登顶OpenAI MLE-bench

刚刚,由SciMaster团队推出的AI机器学习专家ML-Master 2.0,基于国产开源大模型DeepSeek,在OpenAI权威基准测试MLE-bench中一举击败Google、Meta、微软等国际顶流,刷新全球SOTA,再次登顶!目前该功能已在SciMaster线上平台开放waiting list,欢迎申请体验。

来自主题: AI技术研报
6524 点击    2025-12-25 14:22
啊?微博7800美元训的大模型,数学能力超了DeepSeek-R1

啊?微博7800美元训的大模型,数学能力超了DeepSeek-R1

啊?微博7800美元训的大模型,数学能力超了DeepSeek-R1

近日,微博正式发布首个自研开源大模型VibeThinker,这个仅拥有15亿参数的“轻量级选手”,在国际顶级数学竞赛基准测试上击败了参数量是其数百倍的、高达6710亿的DeepSeek R1模型。

来自主题: AI资讯
7916 点击    2025-11-18 16:34
我MiniMax,用实习生处理数据,照样屠榜开源大模型

我MiniMax,用实习生处理数据,照样屠榜开源大模型

我MiniMax,用实习生处理数据,照样屠榜开源大模型

屠榜开源大模型的MiniMax M2是怎样炼成的?为啥M1用了Linear Attention,到了M2又换成更传统的Full Attention了? 面对现实任务,M2表现得非常扛打,在香港大学的AI-Trader模拟A股大赛中拿下了第一名,20天用10万本金赚了将近三千元。

来自主题: AI资讯
8094 点击    2025-11-04 20:23
NeurIPS 2025 Spotlight | 让检索、推理真正「合体」的小而强模型,AceSearcher来了

NeurIPS 2025 Spotlight | 让检索、推理真正「合体」的小而强模型,AceSearcher来了

NeurIPS 2025 Spotlight | 让检索、推理真正「合体」的小而强模型,AceSearcher来了

如何让一个并不巨大的开源大模型,在面对需要多步检索与复杂逻辑整合的问题时,依然像 “冷静的研究员” 那样先拆解、再查证、后归纳,最后给出可核实的结论?

来自主题: AI技术研报
7054 点击    2025-10-27 10:52
开源模型TOP5,被中国厂商包圆了

开源模型TOP5,被中国厂商包圆了

开源模型TOP5,被中国厂商包圆了

开源大模型,进入中国时间。 10月,公开数据显示,来自中国的开源大模型已经牢牢占据榜单前五。 阿里的Qwen系列和DeepSeek,更是从2024年下半年起,就在开源社区构建起越来越深远的影响力。

来自主题: AI资讯
7860 点击    2025-10-16 14:55