AI资讯新闻榜单内容搜索-Deepseek

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Deepseek
AI记忆伪装被戳穿!GPT、DeepSeek等17款主流大模型根本记不住数字

AI记忆伪装被戳穿!GPT、DeepSeek等17款主流大模型根本记不住数字

AI记忆伪装被戳穿!GPT、DeepSeek等17款主流大模型根本记不住数字

最近,来自约翰・霍普金斯大学与中国人民大学的团队设计了三套实验,专门把关键线索藏在上下文之外,逼模型「凭记忆」作答,从而检验它们是否真的在脑海里保留了信息。

来自主题: AI技术研报
6739 点击    2025-06-15 15:16
对谈 DeepSeek-Prover 核心作者辛华剑:Multi Agent 天然适合形式化数学 |Best Minds

对谈 DeepSeek-Prover 核心作者辛华剑:Multi Agent 天然适合形式化数学 |Best Minds

对谈 DeepSeek-Prover 核心作者辛华剑:Multi Agent 天然适合形式化数学 |Best Minds

Era of Experience 这篇文章中提到:如果要实现 AGI, 构建能完成复杂任务的通用 agent,必须借助“经验”这一媒介,这里的“经验”就是指强化学习过程中模型和 agent 积累的、人类数据集中不存在的高质量数据。

来自主题: AI资讯
6431 点击    2025-06-14 12:58
DeepSeek研究员1200行代码复刻vLLM,H800硬件实测性能反超原版

DeepSeek研究员1200行代码复刻vLLM,H800硬件实测性能反超原版

DeepSeek研究员1200行代码复刻vLLM,H800硬件实测性能反超原版

仅用不到1200行代码,实现最小化且完全可读的vLLM!DeepSeek研究员俞星凯搞了个开源项目引得大伙拍手叫绝。项目名为Nano-vLLM(纳米级-vLLM),有三大特点:快速离线推理:推理速度可与vLLM相媲美

来自主题: AI技术研报
7046 点击    2025-06-13 15:41
黄铁军对大模型的四个预判:洗牌、安全核爆、GPT-5与再造DeepSeek

黄铁军对大模型的四个预判:洗牌、安全核爆、GPT-5与再造DeepSeek

黄铁军对大模型的四个预判:洗牌、安全核爆、GPT-5与再造DeepSeek

4月份,李飞飞教授领先编制的《2025年人工智能指数报告》提供的数据显示,2024年全年具有特殊影响力的模型(Notable AI models)当中,排名前5的几乎都来自美国、中国的科技巨头。

来自主题: AI技术研报
6830 点击    2025-06-13 14:14
Hugging Face发布开放权重模型贡献榜:中国团队Qwen与DeepSeek跻身TOP15

Hugging Face发布开放权重模型贡献榜:中国团队Qwen与DeepSeek跻身TOP15

Hugging Face发布开放权重模型贡献榜:中国团队Qwen与DeepSeek跻身TOP15

全球知名开源AI平台Hugging Face近日发布开放权重模型贡献榜,中国团队Qwen和DeepSeek成功入围前15名,彰显了中国在全球开源AI领域的技术实力与影响力。该榜单表彰为开源社区提供高质量模型权重的团队,其模型广泛应用于学术与产业创新。

来自主题: AI资讯
7335 点击    2025-06-12 18:56
DeepMind首个猜想库开源,获陶哲轩力挺!

DeepMind首个猜想库开源,获陶哲轩力挺!

DeepMind首个猜想库开源,获陶哲轩力挺!

谷歌DeepMind重磅出击,开源首个形式化数学猜想库,获陶哲轩力挺!从解析数论的兰道猜想开始,这个开源项目将为AI破解数学难题的未来铺路。

来自主题: AI技术研报
5534 点击    2025-06-12 18:03
别再信“LRM无需优化提示词”了,你至少输掉23%的性能,以R1为例

别再信“LRM无需优化提示词”了,你至少输掉23%的性能,以R1为例

别再信“LRM无需优化提示词”了,你至少输掉23%的性能,以R1为例

还记得DeepSeek-R1发布时AI圈的那波狂欢吗?"提示工程已死"、"再也不用费心写复杂提示了"、"推理模型已经聪明到不再需要学习提示词了"......这些观点在社交媒体上刷屏,连不少技术大佬都在转发。再到最近,“提示词写死了”......现实总是来得这么快——乔治梅森大学的研究者们用一个严谨得让人无法反驳的实验,狠狠打了所有人的脸!

来自主题: AI技术研报
7002 点击    2025-06-12 11:59
新“SOTA”推理模型避战Qwen和R1?欧版OpenAI被喷麻了

新“SOTA”推理模型避战Qwen和R1?欧版OpenAI被喷麻了

新“SOTA”推理模型避战Qwen和R1?欧版OpenAI被喷麻了

“欧洲的OpenAI”Mistral AI终于发布了首款推理模型——Magistral。 然而再一次遭到网友质疑:怎么又不跟最新版Qwen和DeepSeek R1 0528对比?

来自主题: AI资讯
7161 点击    2025-06-11 14:23
20人团队提前实现DeepSeek构想,AI算力变天?直击大模型算力成本痛点

20人团队提前实现DeepSeek构想,AI算力变天?直击大模型算力成本痛点

20人团队提前实现DeepSeek构想,AI算力变天?直击大模型算力成本痛点

20人国内团队,竟然提前2年预判到了DeepSeek的构想?玉盘AI的全新计算架构方案浮出水面后,直接震动业内:当前AI算力的核心瓶颈,他们试图从硬件源头解决!

来自主题: AI资讯
7120 点击    2025-06-11 11:55
14种主流Prompt技术,顶级团队2000次实验,只有这几种真能打

14种主流Prompt技术,顶级团队2000次实验,只有这几种真能打

14种主流Prompt技术,顶级团队2000次实验,只有这几种真能打

现在市面上有46种Prompt工程技术,但真正能在软件工程任务中发挥作用的,可能只有那么几种。来自巴西联邦大学、加州大学尔湾分校等顶级院校的研究者们,花了大量时间和计算资源,调研了58种,整理了46种,最终筛选测试了14种主流提示技术在10个软件工程任务上的表现,用了4个不同的大模型(包括咱们的Deepseek-V3),总共跑了2000多次实验。

来自主题: AI技术研报
8945 点击    2025-06-11 11:51