AI资讯新闻榜单内容搜索-DeepSee

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: DeepSee
最懂管钱的AI?这个刚刚发布的金融推理大模型,专业测试超DeepSeek|WAIC2025

最懂管钱的AI?这个刚刚发布的金融推理大模型,专业测试超DeepSeek|WAIC2025

最懂管钱的AI?这个刚刚发布的金融推理大模型,专业测试超DeepSeek|WAIC2025

在社交平台上,「AI 帮我选基金,结果赚了 8%」、「AI 自动炒股,秒杀巴菲特?」之类的帖子不时刷屏,炒股机器人、对话式理财助手有关的 Agent 也不断涌现。

来自主题: AI资讯
8220 点击    2025-07-28 17:48
首次结合RL与SFT各自优势,动态引导模型实现推理⾼效训练

首次结合RL与SFT各自优势,动态引导模型实现推理⾼效训练

首次结合RL与SFT各自优势,动态引导模型实现推理⾼效训练

新一代大型推理模型,如 OpenAI-o3、DeepSeek-R1 和 Kimi-1.5,在复杂推理方面取得了显著进展。该方向核心是一种名为 ZERO-RL 的训练方法,即采用可验证奖励强化学习(RLVR)逐步提升大模型在强推理场景 (math, coding) 的 pass@1 能力。

来自主题: AI技术研报
5189 点击    2025-07-28 10:36
国产GPU跑满血DeepSeek,已经可以100 tokens/s了!

国产GPU跑满血DeepSeek,已经可以100 tokens/s了!

国产GPU跑满血DeepSeek,已经可以100 tokens/s了!

放眼当下,到底哪个芯片跑满血DeepSeek是最快的? 答案很意外——不是你以为的英伟达,而是一家国产GPU。 因为现在它的速度,已经直接来到了100 tokens/s!

来自主题: AI资讯
5547 点击    2025-07-27 14:04
DeepSeek一体机最新观察:满血版卖不动了,市场抢食零散的中低端机型生意

DeepSeek一体机最新观察:满血版卖不动了,市场抢食零散的中低端机型生意

DeepSeek一体机最新观察:满血版卖不动了,市场抢食零散的中低端机型生意

前两周,广东某国企发了篇万字标文,以预算四十万招标一台DeepSeek一体机。 近乎30页的文档里,采购明细表短短6行,所需的芯片类型等关键指标,只字未提。“看这个标就知道,大家完全没把一体机用起来”,业内人士直言。

来自主题: AI资讯
6668 点击    2025-07-25 17:51
WAIC抢先爆料:金融“黑马”大模型超DeepSeek刷新SOTA,论文已上线

WAIC抢先爆料:金融“黑马”大模型超DeepSeek刷新SOTA,论文已上线

WAIC抢先爆料:金融“黑马”大模型超DeepSeek刷新SOTA,论文已上线

又到了一年一度“中国AI春晚”WAIC,各家大厂动作频发的时候。 今年会有哪些看点?你别说,我们还真在扒论文的过程中,发现了一些热乎线索。 比如蚂蚁数科的金融推理大模型,发布会还没开,技术论文已悄咪咪上线。 金融领域的推理大模型,你可以理解为金融领域的DeepSeek,带着SOTA的刷榜成绩来了。

来自主题: AI资讯
6106 点击    2025-07-25 17:40
开源Qwen凌晨暴击闭源Claude!刷新AI编程SOTA,支持1M上下文

开源Qwen凌晨暴击闭源Claude!刷新AI编程SOTA,支持1M上下文

开源Qwen凌晨暴击闭源Claude!刷新AI编程SOTA,支持1M上下文

编程Agent王座,国产开源模型拿下了!就在刚刚,阿里通义大模型团队开源Qwen3-Coder,直接刷新AI编程SOTA——不仅在开源界超过DeepSeek V3和Kimi K2,连业界标杆、闭源的Claude Sonnet 4都比下去了。

来自主题: AI资讯
8114 点击    2025-07-23 09:09
AI“压力面”,DeepSeek性能暴跌近30% | 清华&上海AI Lab

AI“压力面”,DeepSeek性能暴跌近30% | 清华&上海AI Lab

AI“压力面”,DeepSeek性能暴跌近30% | 清华&上海AI Lab

给AI一场压力测试,结果性能暴跌近30%。 来自上海人工智能实验室、清华大学和中国人民大学的研究团队设计了一个全新的“压力测试”框架——REST (Reasoning Evaluation through Simultaneous Testing)。

来自主题: AI技术研报
8194 点击    2025-07-21 10:44
「DeepSeek二代」来袭!数学暴击o3,英伟达开源LLM登顶

「DeepSeek二代」来袭!数学暴击o3,英伟达开源LLM登顶

「DeepSeek二代」来袭!数学暴击o3,英伟达开源LLM登顶

基于Qwen2.5架构,采用DeepSeek-R1-0528生成数据,英伟达推出的OpenReasoning-Nemotron模型,以超强推理能力突破数学、科学、代码任务,在多个基准测试中创下新纪录!数学上,更是超越了o3!

来自主题: AI资讯
7714 点击    2025-07-20 23:43