AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
关于我用Claude 3.7 Sonnet模型直接生成小程序

关于我用Claude 3.7 Sonnet模型直接生成小程序

关于我用Claude 3.7 Sonnet模型直接生成小程序

最近AI一直是很火的话题,Deepseek也是一夜爆火,但是实际使用下来发现Deepseek好像和其他大模型一样,并没有什么厉害之处,而且官网经常服务器繁忙。

来自主题: AI资讯
10192 点击    2025-03-10 10:39
长文本有了专属困惑度!北大、MIT、阿里推出LongPPL新指标

长文本有了专属困惑度!北大、MIT、阿里推出LongPPL新指标

长文本有了专属困惑度!北大、MIT、阿里推出LongPPL新指标

随着大模型在长文本处理任务中的应用日益广泛,如何客观且精准地评估其长文本能力已成为一个亟待解决的问题。

来自主题: AI技术研报
9375 点击    2025-03-09 14:53
让SFT重新伟大!CMU等华人学者提出全新「批判式微调」,媲美复刻版DeepSeek

让SFT重新伟大!CMU等华人学者提出全新「批判式微调」,媲美复刻版DeepSeek

让SFT重新伟大!CMU等华人学者提出全新「批判式微调」,媲美复刻版DeepSeek

在面对复杂的推理任务时,SFT往往让大模型显得力不从心。最近,CMU等机构的华人团队提出了「批判性微调」(CFT)方法,仅在 50K 样本上训练,就在大多数基准测试中优于使用超过200万个样本的强化学习方法。

来自主题: AI技术研报
8225 点击    2025-03-09 13:32
上海交大张拳石:思维链只是表象,DeepSeek凭什么更强 | 智者访谈

上海交大张拳石:思维链只是表象,DeepSeek凭什么更强 | 智者访谈

上海交大张拳石:思维链只是表象,DeepSeek凭什么更强 | 智者访谈

DeepSeek-R1 等模型通过展示思维链(CoT)让用户一窥大模型的「思考过程」,然而,模型展示的思考过程真的代表了模型的内在推理机制吗?在医疗诊断、自动驾驶、法律判决等高风险领域,我们能否真正信任 AI 的决策?

来自主题: AI资讯
10521 点击    2025-03-09 13:17
火山引擎直接把大模型应用给开源了,附部署教程和实测体验!

火山引擎直接把大模型应用给开源了,附部署教程和实测体验!

火山引擎直接把大模型应用给开源了,附部署教程和实测体验!

从今天这个视角来看,DeepSeek 等国内外大模型能力是越来越强大了,大家都说 2025 年 AI 应用还会持续爆发。但对于企业来说,有了大模型,那场景都有啥,应用又长啥样?

来自主题: AI技术研报
10039 点击    2025-03-09 11:36
2行代码与DeepSeek语音对话,1分钟不到一毛钱,所有大模型都能开口说话

2行代码与DeepSeek语音对话,1分钟不到一毛钱,所有大模型都能开口说话

2行代码与DeepSeek语音对话,1分钟不到一毛钱,所有大模型都能开口说话

起猛了,DeepSeek开口说话了。而且是超低延迟实时秒回,还可以随时打断的那种,先来看一段VCR:DeepSeek以及其他任意大模型接入这样的高质量对话引擎,全程只需要两行代码。

来自主题: AI资讯
9245 点击    2025-03-09 11:07