AI资讯新闻榜单内容搜索-大模型

关于我用Claude 3.7 Sonnet模型直接生成小程序

最近AI一直是很火的话题，Deepseek也是一夜爆火，但是实际使用下来发现Deepseek好像和其他大模型一样，并没有什么厉害之处，而且官网经常服务器繁忙。

来自主题: AI资讯

10192 点击 2025-03-10 10:39

一直以来，AI 领域的研究者都喜欢让模型去挑战那些人类热衷的经典游戏，以此来检验 AI 的「智能程度」。

来自主题: AI资讯

7902 点击 2025-03-09 15:07

随着大模型在长文本处理任务中的应用日益广泛，如何客观且精准地评估其长文本能力已成为一个亟待解决的问题。

来自主题: AI技术研报

9375 点击 2025-03-09 14:53

半个月前，Anthropic 发布了其迄今为止最聪明的 AI 模型 —— Claude 3.7 Sonnet。

来自主题: AI技术研报

7832 点击 2025-03-09 13:46

在面对复杂的推理任务时，SFT往往让大模型显得力不从心。最近，CMU等机构的华人团队提出了「批判性微调」（CFT）方法，仅在 50K 样本上训练，就在大多数基准测试中优于使用超过200万个样本的强化学习方法。

来自主题: AI技术研报

8225 点击 2025-03-09 13:32

DeepSeek-R1 等模型通过展示思维链（CoT）让用户一窥大模型的「思考过程」，然而，模型展示的思考过程真的代表了模型的内在推理机制吗？在医疗诊断、自动驾驶、法律判决等高风险领域，我们能否真正信任 AI 的决策？

来自主题: AI资讯

10521 点击 2025-03-09 13:17

思维链引发的战争。

来自主题: AI资讯

8318 点击 2025-03-09 12:09

从今天这个视角来看，DeepSeek 等国内外大模型能力是越来越强大了，大家都说 2025 年 AI 应用还会持续爆发。但对于企业来说，有了大模型，那场景都有啥，应用又长啥样？

来自主题: AI技术研报

10039 点击 2025-03-09 11:36

中国互联网公司正集体迎来资产重估，科技是最根本的推力。最近一家强调科技的巨头是美团。

来自主题: AI资讯

11588 点击 2025-03-09 11:09

起猛了，DeepSeek开口说话了。而且是超低延迟实时秒回，还可以随时打断的那种，先来看一段VCR：DeepSeek以及其他任意大模型接入这样的高质量对话引擎，全程只需要两行代码。

来自主题: AI资讯

9245 点击 2025-03-09 11:07