AI资讯新闻榜单内容搜索-DeepSeek-V

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: DeepSeek-V
“DeepSeek甚至绕过了CUDA”,论文细节再引热议,工程师灵魂提问:英伟达护城河还在吗?

“DeepSeek甚至绕过了CUDA”,论文细节再引热议,工程师灵魂提问:英伟达护城河还在吗?

“DeepSeek甚至绕过了CUDA”,论文细节再引热议,工程师灵魂提问:英伟达护城河还在吗?

硬件媒体Tom‘s Hardware带来开年最新热议:DeepSeek甚至绕过了CUDA,使用更底层的编程语言做优化。这一次是DeepSeek-V3论文中的更多细节,被人挖掘出来。

来自主题: AI资讯
8525 点击    2025-01-29 12:45
超全推理语言模型蓝图来了!揭开o1、o3、DeepSeek-V3神秘面纱

超全推理语言模型蓝图来了!揭开o1、o3、DeepSeek-V3神秘面纱

超全推理语言模型蓝图来了!揭开o1、o3、DeepSeek-V3神秘面纱

ETH Zurich等机构提出了推理语言模型(RLM)蓝图,超越LLM局限,更接近AGI,有望人人可用o3这类强推理模型。

来自主题: AI技术研报
7158 点击    2025-01-28 12:20
DeepSeek,改变了AI的游戏规则

DeepSeek,改变了AI的游戏规则

DeepSeek,改变了AI的游戏规则

在美国发布AI禁令后,特朗普随即宣布了一项预算高达5000亿美元的AGI计划——星际之门,以保证其在AI领域的领先地位。而在大洋彼岸的中国,一家名为Deepseek的中国创业公司,只用了2048块显卡,就训练出了一个能与顶级模型相媲美的Deepseek-V3模型。

来自主题: AI资讯
4772 点击    2025-01-27 15:02
DeepSeek新模型大揭秘,为何它能震动全球AI圈

DeepSeek新模型大揭秘,为何它能震动全球AI圈

DeepSeek新模型大揭秘,为何它能震动全球AI圈

时隔不到一个月,DeepSeek又一次震动全球AI圈。去年 12 月,DeepSeek推出的DeepSeek-V3在全球AI领域掀起了巨大的波澜,它以极低的训练成本,实现了与GPT-4o和Claude Sonnet 3.5等顶尖模型相媲美的性能,震惊了业界。

来自主题: AI技术研报
5951 点击    2025-01-24 13:05
MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

开源模型上下文窗口卷到超长,达400万token! 刚刚,“大模型六小强”之一MiniMax开源最新模型—— MiniMax-01系列,包含两个模型:基础语言模型MiniMax-Text-01、视觉多模态模型MiniMax-VL-01。

来自主题: AI技术研报
7506 点击    2025-01-15 15:10
全网都在扒的DeepSeek团队,是清北应届生撑起一片天

全网都在扒的DeepSeek团队,是清北应届生撑起一片天

全网都在扒的DeepSeek团队,是清北应届生撑起一片天

DeepSeek-v3大模型横空出世,以1/11算力训练出超过Llama 3的开源模型,震撼了整个AI圈。

来自主题: AI资讯
8573 点击    2025-01-04 15:15
DeepSeek-V3:美国芯片封锁的“意外”产物?

DeepSeek-V3:美国芯片封锁的“意外”产物?

DeepSeek-V3:美国芯片封锁的“意外”产物?

继电动车、消费品之后,中国团队又在AI领域上演了一出“成本屠夫”的好戏。

来自主题: AI资讯
7582 点击    2025-01-03 13:40
再见Cursor! Cline+DeepSeek-V3 双雄组合引爆AI编程| 最强配置方案+代码实例

再见Cursor! Cline+DeepSeek-V3 双雄组合引爆AI编程| 最强配置方案+代码实例

再见Cursor! Cline+DeepSeek-V3 双雄组合引爆AI编程| 最强配置方案+代码实例

还在为每个月20美元的Cursor订阅费发愁吗?还在担心代码被上传到国外服务器?今天给大家介绍一个既省钱又安全的神器组合 - Cline+DeepSeek V3。

来自主题: AI资讯
13792 点击    2025-01-02 17:11
省钱也是技术活:解密DeepSeek的极致压榨术

省钱也是技术活:解密DeepSeek的极致压榨术

省钱也是技术活:解密DeepSeek的极致压榨术

没有GPU Poor,只有卷得不够多。 DeepSeek-V3的横空出世,用一组惊人的数据完美诠释了这句话。

来自主题: AI资讯
7749 点击    2025-01-02 10:19
“训练数据抄袭”:DeepSeek 动了谁的奶酪?

“训练数据抄袭”:DeepSeek 动了谁的奶酪?

“训练数据抄袭”:DeepSeek 动了谁的奶酪?

在上一篇的评论区里,大家发生了争吵: 《DeepSeek-V3 是怎么训练的|深度拆解》 有的读者指出:DeepSeek V3 有“训练数据抄袭”的问题。

来自主题: AI资讯
6390 点击    2024-12-31 12:49