AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
OpenAI新模型,被曝秘密训练中!万字硬核长文直指o4核心秘密

OpenAI新模型,被曝秘密训练中!万字硬核长文直指o4核心秘密

OpenAI新模型,被曝秘密训练中!万字硬核长文直指o4核心秘密

SemiAnalysis全新硬核爆料,意外揭秘了OpenAI全新模型的秘密?据悉,新模型介于GPT-4.1和GPT-4.5之间,而下一代推理模型o4将基于GPT-4.1训练,而背后最大功臣,就是强化学习。

来自主题: AI技术研报
6748 点击    2025-06-11 12:20
20人团队提前实现DeepSeek构想,AI算力变天?直击大模型算力成本痛点

20人团队提前实现DeepSeek构想,AI算力变天?直击大模型算力成本痛点

20人团队提前实现DeepSeek构想,AI算力变天?直击大模型算力成本痛点

20人国内团队,竟然提前2年预判到了DeepSeek的构想?玉盘AI的全新计算架构方案浮出水面后,直接震动业内:当前AI算力的核心瓶颈,他们试图从硬件源头解决!

来自主题: AI资讯
7684 点击    2025-06-11 11:55
14种主流Prompt技术,顶级团队2000次实验,只有这几种真能打

14种主流Prompt技术,顶级团队2000次实验,只有这几种真能打

14种主流Prompt技术,顶级团队2000次实验,只有这几种真能打

现在市面上有46种Prompt工程技术,但真正能在软件工程任务中发挥作用的,可能只有那么几种。来自巴西联邦大学、加州大学尔湾分校等顶级院校的研究者们,花了大量时间和计算资源,调研了58种,整理了46种,最终筛选测试了14种主流提示技术在10个软件工程任务上的表现,用了4个不同的大模型(包括咱们的Deepseek-V3),总共跑了2000多次实验。

来自主题: AI技术研报
9574 点击    2025-06-11 11:51
时空压缩!剑桥大学提出注意力机制MTLA:推理加速5倍,显存减至1/8

时空压缩!剑桥大学提出注意力机制MTLA:推理加速5倍,显存减至1/8

时空压缩!剑桥大学提出注意力机制MTLA:推理加速5倍,显存减至1/8

在大语言模型蓬勃发展的背景下,Transformer 架构依然是不可替代的核心组件。尽管其自注意力机制存在计算复杂度为二次方的问题,成为众多研究试图突破的重点

来自主题: AI技术研报
7436 点击    2025-06-11 11:43
o3-pro正式推出!说声“嗨”就花了80美元,思考1+1用时16分钟

o3-pro正式推出!说声“嗨”就花了80美元,思考1+1用时16分钟

o3-pro正式推出!说声“嗨”就花了80美元,思考1+1用时16分钟

OpenAI深夜放大招,正式推出“最新最强版”推理模型o3-pro! 而且同一时间,o3模型降价80%不降智。官方测评结果显示,在专家评估中,所有人一致更偏爱o3-pro而非o3的回答。

来自主题: AI资讯
9252 点击    2025-06-11 10:50
苹果 AI「百亿补贴」来了:免费开放端侧模型,不跟 OpenAI 卷

苹果 AI「百亿补贴」来了:免费开放端侧模型,不跟 OpenAI 卷

苹果 AI「百亿补贴」来了:免费开放端侧模型,不跟 OpenAI 卷

今年苹果在 AI 上宣布的诸多所谓新功能,例如实时翻译、快捷指令等,并无太多革命性;至于视觉智能 (visual intelligence),不仅功能落后 Google Lens 六七年,交互体验上也远未达到一众 Android 友商的内置 AI/Agent 产品在 2025 上半年水平。

来自主题: AI资讯
7691 点击    2025-06-10 19:17
华为创造AI算力新纪录:万卡集群训练98%可用度,秒级恢复、分钟诊断

华为创造AI算力新纪录:万卡集群训练98%可用度,秒级恢复、分钟诊断

华为创造AI算力新纪录:万卡集群训练98%可用度,秒级恢复、分钟诊断

大模型的落地能力,核心在于性能的稳定输出,而性能稳定的底层支撑,是强大的算力集群。其中,构建万卡级算力集群,已成为全球公认的顶尖技术挑战。

来自主题: AI技术研报
8107 点击    2025-06-10 17:05