AI资讯新闻榜单内容搜索-o1

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: o1
DeepSeek、OpenAI、Kimi视觉推理到底哪家强?港中文MMLab推出推理基准MME-COT

DeepSeek、OpenAI、Kimi视觉推理到底哪家强?港中文MMLab推出推理基准MME-COT

DeepSeek、OpenAI、Kimi视觉推理到底哪家强?港中文MMLab推出推理基准MME-COT

OpenAI o1和DeepSeek-R1靠链式思维(Chain-of-Thought, CoT)展示了超强的推理能力,但这一能力能多大程度地帮助视觉推理,又应该如何细粒度地评估视觉推理呢?

来自主题: AI技术研报
7947 点击    2025-02-22 21:27
如何完美解锁DeepSeek-R1的结构化输出能力(基于LangChain)?

如何完美解锁DeepSeek-R1的结构化输出能力(基于LangChain)?

如何完美解锁DeepSeek-R1的结构化输出能力(基于LangChain)?

DeepSeek-R1这样的推理模型有着强大的深度思考能力,但也有着一些不同于通用模型的特点与用法,比如不支持函数调用,不支持结构化输出,o1甚至不支持系统提示(System Prompt)等。尽管这和它们的使用场景有关,但有时也会带来不便。今天我们就来说说结构化输出这个常见的问题。

来自主题: AI技术研报
8435 点击    2025-02-21 15:03
地表最强Grok3突袭免费体验,网友实测对比DeepSeek,发现中文彩蛋

地表最强Grok3突袭免费体验,网友实测对比DeepSeek,发现中文彩蛋

地表最强Grok3突袭免费体验,网友实测对比DeepSeek,发现中文彩蛋

又是一个文理兼修的优等生,能薅一点是一点。堆了 20 万张 GPU、号称「地表最强」大模型 Grok-3 已经可用啦。「 Grok 3 + Thinking 感觉与 OpenAI 最强商用模型(o1-pro,200 美元/月)的顶尖水平相差无几,

来自主题: AI资讯
6219 点击    2025-02-20 16:16
OpenAI掀「百万美金」编程大战!Claude 3.5 Sonnet狂赚40万拿下第一

OpenAI掀「百万美金」编程大战!Claude 3.5 Sonnet狂赚40万拿下第一

OpenAI掀「百万美金」编程大战!Claude 3.5 Sonnet狂赚40万拿下第一

OpenAI刚刚发布SWE-Lancer编码基准测试,直接让AI模型挑战真实外包任务!这些任务总价值高达100万美元。有趣的是,测试结果显示,Anthropic的Claude 3.5 Sonnet在「赚钱」能力上竟然超越了OpenAI自家的GPT-4o和o1模型。

来自主题: AI技术研报
8191 点击    2025-02-19 15:19
DeepSeek引发鲶鱼效应,中国算力市场呈现“四变”

DeepSeek引发鲶鱼效应,中国算力市场呈现“四变”

DeepSeek引发鲶鱼效应,中国算力市场呈现“四变”

这个AI领域千亿级市场,将辐射千家万户。 DeepSeek-R1横空出世,打响了大模型比拼性价比的第一枪。 Meta、OpenAI等国外头部大模型厂商纷纷复刻或变相降价。比DeepSeek-R1晚两周发布的OpenAI o3-mini模型,定价比前代模型o1-mini降低了超6成,比前代完整版的o1模型便宜超9成。

来自主题: AI资讯
8300 点击    2025-02-19 09:38
DeepSeek们的成本,是怎么计算的?

DeepSeek们的成本,是怎么计算的?

DeepSeek们的成本,是怎么计算的?

大模型混战,一边卷能力,一边卷“低价”。 DeepSeek彻底让全球都坐不住了。 昨天,马斯克携“地球上最聪明的AI”——Gork 3在直播中亮相,自称其“推理能力超越目前所有已知模型”,在推理-测试时间得分上,也好于DeepSeek R1、OpenAI o1。不久前,国民级应用微信宣布接入DeepSeek R1,正在灰度测试中,这一王炸组合被外界认为AI搜索领域要变天。

来自主题: AI资讯
6097 点击    2025-02-19 09:19
超过o1-mini、逼近o3-mini,DeepSeek-R1在新的贪吃蛇基准上拿下1801分

超过o1-mini、逼近o3-mini,DeepSeek-R1在新的贪吃蛇基准上拿下1801分

超过o1-mini、逼近o3-mini,DeepSeek-R1在新的贪吃蛇基准上拿下1801分

那么,DeepSeek-R1 的 ARC-AGI 成绩如何呢?根据 ARC Prize 发布的报告,R1 在 ARC-AGI-1 上的表现还赶不上 OpenAI 的 o1 系列模型,更别说 o3 系列了。但 DeepSeek-R1 也有自己的特有优势:成本低。

来自主题: AI技术研报
6036 点击    2025-02-17 17:47
DeepSeek缝合Claude,比单用R1/o1效果都好!GitHub揽星3k

DeepSeek缝合Claude,比单用R1/o1效果都好!GitHub揽星3k

DeepSeek缝合Claude,比单用R1/o1效果都好!GitHub揽星3k

让DeepSeek代替Claude思考,缝合怪玩法火了。原因无它:比单独使用DeepSeek R1、Claude Sonnet 3.5、OpenAI o1模型的效果更好。DeepClaude应用本身100%免费且开源,在GitHub上已揽获3k星星(当然API要用自己的)。

来自主题: AI资讯
9386 点击    2025-02-14 14:44
清华一作1B暴打405B巨无霸,7B逆袭DeepSeek R1!测试时Scaling封神

清华一作1B暴打405B巨无霸,7B逆袭DeepSeek R1!测试时Scaling封神

清华一作1B暴打405B巨无霸,7B逆袭DeepSeek R1!测试时Scaling封神

【新智元导读】仅凭测试时Scaling,1B模型竟完胜405B!多机构联手巧妙应用计算最优TTS策略,不仅0.5B模型在数学任务上碾压GPT-4o,7B模型更是力压o1、DeepSeek R1这样的顶尖选手。

来自主题: AI技术研报
6861 点击    2025-02-13 14:18