AI资讯新闻榜单内容搜索-8

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 8
司南首期多模态模型闭源榜单发布!48个模型同台竞技,谁将脱颖而出?

司南首期多模态模型闭源榜单发布!48个模型同台竞技,谁将脱颖而出?

司南首期多模态模型闭源榜单发布!48个模型同台竞技,谁将脱颖而出?

基于闭源评测基准,近期司南针对国内外主流多模态大模型进行了全面评测,现公布司南首期多模态模型闭源评测榜单。首期榜单共包含 48 个多模态模型,其中包含:3 个国内 API 模型:GLM-4v-Plus-20250111 (智谱),Step-1o (阶跃),BailingMM-Pro-0120 (蚂蚁)

来自主题: AI技术研报
11096 点击    2025-03-06 19:45
360智脑开源Light-R1!1000美元数学上首次从零超越DeepSeek-R1-Distill

360智脑开源Light-R1!1000美元数学上首次从零超越DeepSeek-R1-Distill

360智脑开源Light-R1!1000美元数学上首次从零超越DeepSeek-R1-Distill

2025 年 3 月 4 日,360 智脑开源了 Light-R1-32B 模型,以及全部训练数据、代码。仅需 12 台 H800 上 6 小时即可训练完成,从没有长思维链的 Qwen2.5-32B-Instruct 出发,仅使用 7 万条数学数据训练,得到 Light-R1-32B

来自主题: AI技术研报
6826 点击    2025-03-06 11:13
百度文库、网盘接入 DeepSeek,这才是学生党真正想要的 AI

百度文库、网盘接入 DeepSeek,这才是学生党真正想要的 AI

百度文库、网盘接入 DeepSeek,这才是学生党真正想要的 AI

又一个「DeepSeek 王炸组合」,来了。2 月 28 日,两个国民级应用,百度文库和百度网盘,全量接入了 DeepSeek-R1 满血版。

来自主题: AI资讯
4937 点击    2025-03-06 10:34
用AgenticLU长上下文理解,LLM澄清链CoC实现自学,答案召回率高达97.8% | 最新

用AgenticLU长上下文理解,LLM澄清链CoC实现自学,答案召回率高达97.8% | 最新

用AgenticLU长上下文理解,LLM澄清链CoC实现自学,答案召回率高达97.8% | 最新

LLM一个突出的挑战是如何有效处理和理解长文本。就像下图所示,准确率会随着上下文长度显著下降,那么究竟应该怎样提升LLM对长文本理解的准确率呢?

来自主题: AI技术研报
8701 点击    2025-03-06 09:54
OpenAI开价385万年薪扩增机器人团队!招募基础模型人才,北大校友是创始成员

OpenAI开价385万年薪扩增机器人团队!招募基础模型人才,北大校友是创始成员

OpenAI开价385万年薪扩增机器人团队!招募基础模型人才,北大校友是创始成员

年薪最高53万美元,OpenAI机器人团队,叒叒叒招人了!最新消息,OpenAI正在招募机器人底层技术模型开发人员,年薪29.5-53万美元(约合人民币214-385万)。

来自主题: AI资讯
9546 点击    2025-03-05 10:25
小心,AI开始胡说八道

小心,AI开始胡说八道

小心,AI开始胡说八道

2025年2月,如果不是长期从事人口研究的中国人民大学教授李婷的公开辟谣,很多人都真诚地相信了一组数据——“中国80后累计死亡率为5.20%”。

来自主题: AI资讯
5623 点击    2025-03-05 09:13
老显卡福音!美团开源首发INT8无损满血版DeepSeek R1

老显卡福音!美团开源首发INT8无损满血版DeepSeek R1

老显卡福音!美团开源首发INT8无损满血版DeepSeek R1

满血版DeepSeek R1部署A100,基于INT8量化,相比BF16实现50%吞吐提升! 美团搜推机器学习团队最新开源,实现对DeepSeek R1模型基本无损的INT8精度量化。

来自主题: AI技术研报
7677 点击    2025-03-04 20:36
台积电千亿美元投资美国!英伟达、博通秘密测试英特尔:谁输谁赢?

台积电千亿美元投资美国!英伟达、博通秘密测试英特尔:谁输谁赢?

台积电千亿美元投资美国!英伟达、博通秘密测试英特尔:谁输谁赢?

台积电豪掷千亿美元在美建厂,特朗普高调站台。与此同时,昔日霸主英特尔奋起直追,18A制程被寄予厚望,英伟达、博通等巨头秘密测试。代工大战硝烟再起!然而,18A制程的延期又为英特尔的复兴之路蒙上阴影。

来自主题: AI资讯
7785 点击    2025-03-04 19:51
DeepSeek-R1、o1都在及格线挣扎!字节开源全新知识推理测评集,覆盖285个学科

DeepSeek-R1、o1都在及格线挣扎!字节开源全新知识推理测评集,覆盖285个学科

DeepSeek-R1、o1都在及格线挣扎!字节开源全新知识推理测评集,覆盖285个学科

要知道,过去几年,各种通用评测逐渐同质化,越来越难以评估模型真实能力。GPQA、MMLU-pro、MMLU等流行基准,各家模型出街时人手一份,但局限性也开始暴露,比如覆盖范围狭窄(通常不足 50 个学科),不含长尾知识;缺乏足够挑战性和区分度,比如 GPT-4o 在 MMLU-Pro 上准确率飙到 92.3%。

来自主题: AI技术研报
7811 点击    2025-03-04 14:28