AI资讯新闻榜单内容搜索-R1

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: R1
开源22万条DeepSeek R1的高质量数据!你也能复现DeepSeek了

开源22万条DeepSeek R1的高质量数据!你也能复现DeepSeek了

开源22万条DeepSeek R1的高质量数据!你也能复现DeepSeek了

DeepSeek 在海内外搅起的惊涛巨浪,余波仍在汹涌。当中国大模型撕开硅谷的防线之后,在预设中总是落后半拍的中国 AI 军团,这次竟完成了一次反向技术输出,引发了全球范围内复现 DeepSeek 的热潮。

来自主题: AI技术研报
6232 点击    2025-02-11 14:52
网传DeepSeek R1更容易被越狱?这有个入选顶会的防御框架SelfDefend

网传DeepSeek R1更容易被越狱?这有个入选顶会的防御框架SelfDefend

网传DeepSeek R1更容易被越狱?这有个入选顶会的防御框架SelfDefend

近日,来自香港科技大学、南洋理工大学等机构的研究团队最新成果让这一设想成为现实。他们提出的 SelfDefend 框架,让大语言模型首次拥有了真正意义上的 ' 自卫能力 ',能够有效识别和抵御各类越狱攻击,同时保持极低的响应延迟。

来自主题: AI技术研报
4929 点击    2025-02-11 14:48
Lex Fridman 五小时聊 DeepSeek:一文看懂 DeepSeek 的创新与2025 AI 趋势

Lex Fridman 五小时聊 DeepSeek:一文看懂 DeepSeek 的创新与2025 AI 趋势

Lex Fridman 五小时聊 DeepSeek:一文看懂 DeepSeek 的创新与2025 AI 趋势

DeepSeek火了之后,知名科技主播Lex Fridman,找了两位嘉宾,从 DeepSeek 及其开源模型 V3 和 R1 谈到了 AI 发展的地缘政治竞争,特别是中美在 AI 芯⽚与技术出⼝管制上的博弈。5 个小时的对谈,基于「赛博禅心」的翻译版本,我们精选出了5 万字,基本把 DeepSeek 的创新、目前 AI 的算力问题、AI 训练和蒸馏、以及产品落地等都聊透了。建议收藏后仔细阅读。

来自主题: AI资讯
8572 点击    2025-02-10 23:12
一个超实用脚本,让你的DeepSeek自动重试解放双手。

一个超实用脚本,让你的DeepSeek自动重试解放双手。

一个超实用脚本,让你的DeepSeek自动重试解放双手。

前两天我也连更两篇,写了怎么用硅基流动的API、秘塔联网搜索调用R1。虽然这俩体验起来都很不错,可很多人还是觉得DeepSeek官方版的最好,就想用官方的,确实这也没毛病。但是DeepSeek官方那边,这两天当然还是很卡。

来自主题: AI资讯
7910 点击    2025-02-10 20:16
DeepSeek上线国家超算平台!671B满血版,三大运营商接入,玄铁芯片适配

DeepSeek上线国家超算平台!671B满血版,三大运营商接入,玄铁芯片适配

DeepSeek上线国家超算平台!671B满血版,三大运营商接入,玄铁芯片适配

DeepSeek的含金量还在上升,一个半个周末过去发生这些大事:国家超算互联网平台上线DeepSeek-R1,最高支持671B的满血版。达摩院玄铁芯片成功适配DeepSeek-R1系列蒸馏模型,在RISC-V架构CPU和端侧平台打开新的应用空间。

来自主题: AI资讯
7458 点击    2025-02-10 17:30
人大刘勇团队「慢思考」机理分析:从雪球误差到正确推理概率

人大刘勇团队「慢思考」机理分析:从雪球误差到正确推理概率

人大刘勇团队「慢思考」机理分析:从雪球误差到正确推理概率

「慢思考」(Slow-Thinking),也被称为测试时扩展(Test-Time Scaling),成为提升 LLM 推理能力的新方向。近年来,OpenAI 的 o1 [4]、DeepSeek 的 R1 [5] 以及 Qwen 的 QwQ [6] 等顶尖推理大模型的发布,进一步印证了推理过程的扩展是优化 LLM 逻辑能力的有效路径。

来自主题: AI技术研报
4672 点击    2025-02-10 17:04
万物皆可接入DeepSeek,44家接入R1的国产平台超详细大盘点。

万物皆可接入DeepSeek,44家接入R1的国产平台超详细大盘点。

万物皆可接入DeepSeek,44家接入R1的国产平台超详细大盘点。

我前几天也一直在写DeepSeek的使用教程,想选出尽量最简单最好上手的方式让大家都能舒服的体验这波热潮。但是我发现,自第一天干崩硅基流动、第二天干崩秘塔AI搜索后,涌现出来的三方平台越来越多了,写不完,根本写不完。

来自主题: AI资讯
8677 点击    2025-02-10 16:45
o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜

o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜

o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜

就在刚刚,AIME 2025 I数学竞赛的大模型参赛结果出炉,o3-mini取得78%的最好成绩,DeepSeek R1拿到了65%,取得第四名。然而一位教授却发现,某些1.5B小模型竟也能拿到50%,莫非真的存在数据集污染?

来自主题: AI资讯
8766 点击    2025-02-10 11:21
国运级的创新?从 DeepSeek-V3 到 R1 的架构创新与误传的万字长文分析

国运级的创新?从 DeepSeek-V3 到 R1 的架构创新与误传的万字长文分析

国运级的创新?从 DeepSeek-V3 到 R1 的架构创新与误传的万字长文分析

DeepSeek 的最新模型 DeepSeek-V3 和 DeepSeek-R1 都属于 MoE(混合专家)架构,并在开源世界产生了较大的影响力。特别是 2025 年 1 月开源的 DeepSeek-R1,模型性能可挑战 OpenAI 闭源的 o1 模型。

来自主题: AI资讯
10193 点击    2025-02-09 22:14