AI资讯新闻榜单内容搜索-deepseek

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: deepseek
独家丨盛大挖角代季峰,筹建新 AGI 公司对标 DeepSeek

独家丨盛大挖角代季峰,筹建新 AGI 公司对标 DeepSeek

独家丨盛大挖角代季峰,筹建新 AGI 公司对标 DeepSeek

AI 科技评论独家获悉,近日盛大网络挖角清华大学电子工程系副教授代季锋,正在筹备一家新的 AGI 公司,号称“对标 DeepSeek”,已有多位技术人才被猎头接触、介绍该团队的工作机会。

来自主题: AI资讯
6195 点击    2025-08-04 20:57
GLM-4.5 验证:智谱已完成一轮“洗牌”

GLM-4.5 验证:智谱已完成一轮“洗牌”

GLM-4.5 验证:智谱已完成一轮“洗牌”

2025 年已过半,今年的大模型热度明显下降,关于基础模型的关注大多收敛到了 DeepSeek 与阿里通义上。相比之下,曾一度被标榜为大模型“国产替代”、信创之光的智谱 AI 所受到的关注度明显下降,过往高调的战略打法也渐显低迷。

来自主题: AI资讯
5449 点击    2025-08-04 20:18
万亿参数狂欢!一文刷爆2025年七大顶流大模型架构

万亿参数狂欢!一文刷爆2025年七大顶流大模型架构

万亿参数狂欢!一文刷爆2025年七大顶流大模型架构

从GPT-2到DeepSeek-V3和Kimi K2,架构看似未变,却藏着哪些微妙升级?本文深入剖析2025年顶级开源模型的创新技术,揭示滑动窗口注意力、MoE和NoPE如何重塑效率与性能。

来自主题: AI技术研报
6178 点击    2025-08-04 12:05
一个模型超了DeepSeek R1、V3,参数671B,成本不到350万美元

一个模型超了DeepSeek R1、V3,参数671B,成本不到350万美元

一个模型超了DeepSeek R1、V3,参数671B,成本不到350万美元

Deep Cogito,一家鲜为人知的 AI 初创公司,总部位于旧金山,由前谷歌员工创立,如今开源的四款混合推理模型,受到大家广泛关注。

来自主题: AI资讯
6578 点击    2025-08-02 13:38
思维链监督和强化的图表推理,7B模型媲美闭源大尺寸模型

思维链监督和强化的图表推理,7B模型媲美闭源大尺寸模型

思维链监督和强化的图表推理,7B模型媲美闭源大尺寸模型

近期,随着OpenAI-o1/o3和Deepseek-R1的成功,基于强化学习的微调方法(R1-Style)在AI领域引起广泛关注。这些方法在数学推理和代码智能方面展现出色表现,但在通用多模态数据上的应用研究仍有待深入。

来自主题: AI技术研报
6472 点击    2025-08-01 16:08
ACL'25最佳论文独家解读:大模型有「抗改造」基因,现有后训练范式失灵预警

ACL'25最佳论文独家解读:大模型有「抗改造」基因,现有后训练范式失灵预警

ACL'25最佳论文独家解读:大模型有「抗改造」基因,现有后训练范式失灵预警

尽管全球科技界正热烈庆祝 GPT-4、DeepSeek 等大模型展现出的惊艳能力,但一个根本性问题仍未被真正解决: 这些 AI 模型是否真正理解人类的指令与意图?

来自主题: AI技术研报
5849 点击    2025-08-01 12:27
当提示词优化器学会进化,竟能胜过强化学习

当提示词优化器学会进化,竟能胜过强化学习

当提示词优化器学会进化,竟能胜过强化学习

仅靠提示词优化就能超越 DeepSeek 开发的 GRPO 强化学习算法? 是的,你没有看错。近日上线 arXiv 的一篇论文正是凭此吸引了无数眼球。

来自主题: AI技术研报
5868 点击    2025-08-01 11:42
DeepSeek下一代技术提前曝光,梁文锋署名论文获ACL2025最佳论文奖

DeepSeek下一代技术提前曝光,梁文锋署名论文获ACL2025最佳论文奖

DeepSeek下一代技术提前曝光,梁文锋署名论文获ACL2025最佳论文奖

在ACL 2025的颁奖典礼上,由DeepSeek梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。 这次ACL 2025规模空前,总投稿量达到8360篇,相较于去年的4407篇几乎翻倍,竞争异常激烈 。

来自主题: AI技术研报
5952 点击    2025-07-31 11:48
SPIRAL:零和游戏自对弈成为语言模型推理训练的「免费午餐」

SPIRAL:零和游戏自对弈成为语言模型推理训练的「免费午餐」

SPIRAL:零和游戏自对弈成为语言模型推理训练的「免费午餐」

近年来,OpenAI o1 和 DeepSeek-R1 等模型的成功证明了强化学习能够显著提升语言模型的推理能力。通过基于结果的奖励机制,强化学习使模型能够发展出可泛化的推理策略,在复杂问题上取得了监督微调难以企及的进展。

来自主题: AI技术研报
4295 点击    2025-07-31 10:10
DeepSeek半年之后 I 哪些职业受AI影响最大?

DeepSeek半年之后 I 哪些职业受AI影响最大?

DeepSeek半年之后 I 哪些职业受AI影响最大?

ShowMeAI 参与了腾讯新闻热问年中《DeepSeek半年之后》专题策划,回顾上半年 AI 发展以及对多个行业的影响。

来自主题: AI资讯
7436 点击    2025-07-31 10:02