AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
原来,这些顶级大模型都是蒸馏的

原来,这些顶级大模型都是蒸馏的

原来,这些顶级大模型都是蒸馏的

「除了 Claude、豆包和 Gemini 之外,知名的闭源和开源 LLM 通常表现出很高的蒸馏度。」这是中国科学院深圳先进技术研究院、北大、零一万物等机构的研究者在一篇新论文中得出的结论。

来自主题: AI技术研报
9531 点击    2025-01-29 13:26
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

昨晚,杭州大模型又双叒不睡,给大伙儿拜年啦~就在春晚直播进行时,阿里通义Qwen发布新春节礼第三弹:Qwen2.5-Max来袭,多个基准测试中超越当红炸子鸡DeepSeek V3。

来自主题: AI资讯
7606 点击    2025-01-29 12:40
突发公告:受到大规模恶意攻击!DeepSeek爆火,英伟达股价暴跌

突发公告:受到大规模恶意攻击!DeepSeek爆火,英伟达股价暴跌

突发公告:受到大规模恶意攻击!DeepSeek爆火,英伟达股价暴跌

今天(1月28日)凌晨,国内火爆的AI大模型公司深度求索(DeepSeek)称遭受大规模恶意攻击。据悉,DeepSeek旗下AI(人工智能)服务在24小时内经历多次宕机。

来自主题: AI资讯
8567 点击    2025-01-28 12:28
新范式,自回归大一统!北大提出VARGPT:单一框架实现视觉「理解」与「生成」

新范式,自回归大一统!北大提出VARGPT:单一框架实现视觉「理解」与「生成」

新范式,自回归大一统!北大提出VARGPT:单一框架实现视觉「理解」与「生成」

VARGPT是一种新型多模态大模型,能够在单一框架内实现视觉理解和生成任务。通过预测下一个token完成视觉理解,预测下一个scale完成视觉生成,展现出强大的混合模态输入输出能力。

来自主题: AI技术研报
7988 点击    2025-01-28 12:07
Qwen开源首个长文本新模型,百万Tokens处理性能超GPT-4o-mini

Qwen开源首个长文本新模型,百万Tokens处理性能超GPT-4o-mini

Qwen开源首个长文本新模型,百万Tokens处理性能超GPT-4o-mini

谈到大模型的“国货之光”,除了DeepSeek之外,阿里云Qwen这边也有新动作——首次将开源Qwen模型的上下文扩展到1M长度。

来自主题: AI资讯
9382 点击    2025-01-27 14:18
闲来无事,我测了测国产大模型的RAG能力

闲来无事,我测了测国产大模型的RAG能力

闲来无事,我测了测国产大模型的RAG能力

最近,AI界被推理模型刷屏了。国内各家的推理模型,在新年到来之际不断刷新我们的认知。不过,当我们在实际应用中考量大模型,衡量好不好用的标准,就绝不仅仅局限于其性能和规模了。

来自主题: AI资讯
7201 点击    2025-01-27 13:49
六大维度,LLM「问题生成」首次正面PK人类!伯克利等发布最新研究

六大维度,LLM「问题生成」首次正面PK人类!伯克利等发布最新研究

六大维度,LLM「问题生成」首次正面PK人类!伯克利等发布最新研究

研究人员首次探讨了大型语言模型(LLMs)在问题生成任务中的表现,与人类生成的问题进行了多维度对比,结果发现LLMs倾向于生成需要较长描述性答案的问题,且在问题生成中对上下文的关注更均衡。

来自主题: AI技术研报
7882 点击    2025-01-27 13:26
字节版Operator抢跑OpenAI? 直接免费开源, 网友:怒省200美元!

字节版Operator抢跑OpenAI? 直接免费开源, 网友:怒省200美元!

字节版Operator抢跑OpenAI? 直接免费开源, 网友:怒省200美元!

实际上 Operator 只是最近一段时间,全球大模型公司智能体集中发布浪潮的一部分。早于 Operator 发布前两天,字节跳动豆包大模型团队就已经公布了同类型智能体:UI-TARS。

来自主题: AI资讯
7929 点击    2025-01-27 13:20
请回答2025:35位大模型创业者一致看好智能体爆发

请回答2025:35位大模型创业者一致看好智能体爆发

请回答2025:35位大模型创业者一致看好智能体爆发

2023年的大模型市场是昂扬的、争先恐后的。2024年的大模型市场是放缓的、冷静取舍的。而在春节前的这一周多时间里,大模型公司们似乎回到了两年前的兴奋状态,一天不止一个重大发布。

来自主题: AI资讯
9590 点击    2025-01-27 13:09
杨立昆谈中国AI进展:中国科学家非常优秀 令人印象深刻

杨立昆谈中国AI进展:中国科学家非常优秀 令人印象深刻

杨立昆谈中国AI进展:中国科学家非常优秀 令人印象深刻

1月23日,在第55届世界经济论坛(冬季达沃斯)上,“深度学习”三巨头之一、图灵奖得主、Meta AI首席科学家杨立昆(Yann LeCun),如此对腾讯新闻《一线》透露Meta2025年在AI领域的投资规模。

来自主题: AI资讯
7377 点击    2025-01-27 12:58