AI资讯新闻榜单内容搜索-deepseek

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: deepseek
别再信“LRM无需优化提示词”了,你至少输掉23%的性能,以R1为例

别再信“LRM无需优化提示词”了,你至少输掉23%的性能,以R1为例

别再信“LRM无需优化提示词”了,你至少输掉23%的性能,以R1为例

还记得DeepSeek-R1发布时AI圈的那波狂欢吗?"提示工程已死"、"再也不用费心写复杂提示了"、"推理模型已经聪明到不再需要学习提示词了"......这些观点在社交媒体上刷屏,连不少技术大佬都在转发。再到最近,“提示词写死了”......现实总是来得这么快——乔治梅森大学的研究者们用一个严谨得让人无法反驳的实验,狠狠打了所有人的脸!

来自主题: AI技术研报
7072 点击    2025-06-12 11:59
新“SOTA”推理模型避战Qwen和R1?欧版OpenAI被喷麻了

新“SOTA”推理模型避战Qwen和R1?欧版OpenAI被喷麻了

新“SOTA”推理模型避战Qwen和R1?欧版OpenAI被喷麻了

“欧洲的OpenAI”Mistral AI终于发布了首款推理模型——Magistral。 然而再一次遭到网友质疑:怎么又不跟最新版Qwen和DeepSeek R1 0528对比?

来自主题: AI资讯
7233 点击    2025-06-11 14:23
20人团队提前实现DeepSeek构想,AI算力变天?直击大模型算力成本痛点

20人团队提前实现DeepSeek构想,AI算力变天?直击大模型算力成本痛点

20人团队提前实现DeepSeek构想,AI算力变天?直击大模型算力成本痛点

20人国内团队,竟然提前2年预判到了DeepSeek的构想?玉盘AI的全新计算架构方案浮出水面后,直接震动业内:当前AI算力的核心瓶颈,他们试图从硬件源头解决!

来自主题: AI资讯
7174 点击    2025-06-11 11:55
14种主流Prompt技术,顶级团队2000次实验,只有这几种真能打

14种主流Prompt技术,顶级团队2000次实验,只有这几种真能打

14种主流Prompt技术,顶级团队2000次实验,只有这几种真能打

现在市面上有46种Prompt工程技术,但真正能在软件工程任务中发挥作用的,可能只有那么几种。来自巴西联邦大学、加州大学尔湾分校等顶级院校的研究者们,花了大量时间和计算资源,调研了58种,整理了46种,最终筛选测试了14种主流提示技术在10个软件工程任务上的表现,用了4个不同的大模型(包括咱们的Deepseek-V3),总共跑了2000多次实验。

来自主题: AI技术研报
9034 点击    2025-06-11 11:51
视频生成1.3B碾压14B、图像生成直逼GPT-4o!港科&快手开源测试时扩展新范式

视频生成1.3B碾压14B、图像生成直逼GPT-4o!港科&快手开源测试时扩展新范式

视频生成1.3B碾压14B、图像生成直逼GPT-4o!港科&快手开源测试时扩展新范式

测试时扩展(Test-Time Scaling)极大提升了大语言模型的性能,涌现出了如 OpenAI o 系列模型和 DeepSeek R1 等众多爆款。那么,什么是视觉领域的 test-time scaling?又该如何定义?

来自主题: AI技术研报
6367 点击    2025-06-10 16:18
DeepSeek核心高管离职创业,瞄准Agent赛道|独家

DeepSeek核心高管离职创业,瞄准Agent赛道|独家

DeepSeek核心高管离职创业,瞄准Agent赛道|独家

虎嗅从多个独立信源获悉,半年前,某DeepSeek核心高管已悄然离职创业,并将于2025年圣诞节前后发布Agent产品。有信源告诉虎嗅,该高管系原DeepSeek CTO。

来自主题: AI资讯
8158 点击    2025-06-10 15:11
AI医疗的黄金赛道,大厂卷疯了

AI医疗的黄金赛道,大厂卷疯了

AI医疗的黄金赛道,大厂卷疯了

AI大模型正在医疗服务行业中扎根。 “我们医院在科研平台上已经接入使用了DeepSeek。”北京某三甲医院相关负责人对光锥智能说道,“形式类似于AI助理,能提供科研政策问答、查询、常用文件下载等功能。”

来自主题: AI资讯
7375 点击    2025-06-10 14:54
5月AI月报:全球AI双端下载2.8亿,腾讯元宝下载、买量全面腰斩

5月AI月报:全球AI双端下载2.8亿,腾讯元宝下载、买量全面腰斩

5月AI月报:全球AI双端下载2.8亿,腾讯元宝下载、买量全面腰斩

5月份,AI应用市场格局再度出现变化,夸克登顶买量素材榜首,腾讯元宝买量、下载量双双大跌,DeepSeek下载量进一步下滑。

来自主题: AI资讯
5928 点击    2025-06-09 16:25
3B超越DeepSeek,大模型终于理解时间了!Time-R1一统过去/未来/生成

3B超越DeepSeek,大模型终于理解时间了!Time-R1一统过去/未来/生成

3B超越DeepSeek,大模型终于理解时间了!Time-R1一统过去/未来/生成

Time-R1通过三阶段强化学习提升模型的时间推理能力,其核心是动态奖励机制,根据任务难度和训练进程调整奖励,引导模型逐步提升性能,最终使3B小模型实现全面时间推理能力,超越671B模型。

来自主题: AI技术研报
6042 点击    2025-06-09 15:54