AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
DeepSeek R1之后,AI创业、AI投资会发生什么变化?

DeepSeek R1之后,AI创业、AI投资会发生什么变化?

DeepSeek R1之后,AI创业、AI投资会发生什么变化?

自一月以来, DeepSeek 在 AI 领域引发了极大的热度,也出现了大量分析文章。其中来自 Leonis Capital 于 2.6 发表于 Substack 上的文章:「DeepSeek: A Technical and Strategic Analysis for VCs and Startups」

来自主题: AI技术研报
6853 点击    2025-02-15 16:00
ICLR 2025 Spotlight:音频生成新突破!港科北邮团队首次通过文本控制声源方向生成音频

ICLR 2025 Spotlight:音频生成新突破!港科北邮团队首次通过文本控制声源方向生成音频

ICLR 2025 Spotlight:音频生成新突破!港科北邮团队首次通过文本控制声源方向生成音频

兔子通过两只耳朵可以准确感知捕食者的一举一动,造就了不同品种广泛分布在世界各地的生命奇迹;同样人也需要通过双耳沉浸式享受电影视听盛宴、判断驾驶环境和感知周围活动状态。

来自主题: AI技术研报
7196 点击    2025-02-15 15:23
当Langflow遇见DeepSeek:可视化开发工作流的新解法

当Langflow遇见DeepSeek:可视化开发工作流的新解法

当Langflow遇见DeepSeek:可视化开发工作流的新解法

最近读者后台留言,问有没有好用的工作流平台。确实,对于大多数流程相对固定的任务,采用工作流完成确实是最优解,这种需求一直存在。

来自主题: AI技术研报
8090 点击    2025-02-15 12:52
DeepSeek R1遇难题142次"I give up",研究还称需增加推理时机控制机制

DeepSeek R1遇难题142次"I give up",研究还称需增加推理时机控制机制

DeepSeek R1遇难题142次"I give up",研究还称需增加推理时机控制机制

最新大语言模型推理测试引众议,DeepSeek R1常常在提供错误答案前就“我放弃”了?? Cursor刚刚参与了一项研究,他们基于NPR周日谜题挑战(The Sunday Puzzle),构建了一个包含近600个问题新基准测试。

来自主题: AI技术研报
5682 点击    2025-02-14 17:41
好活!字节,南加大,斯坦福等新开源的小人跳舞X-Dyna,人脸、背景都生动起来了

好活!字节,南加大,斯坦福等新开源的小人跳舞X-Dyna,人脸、背景都生动起来了

好活!字节,南加大,斯坦福等新开源的小人跳舞X-Dyna,人脸、背景都生动起来了

在当下的技术领域中,人像视频生成(Human-Video-Animation)作为一个备受瞩目的研究方向,正不断取得新的进展。人像视频生成 (Human-Video-Animation) 是指从某人物的视频中获取肢体动作和面部表情序列,来驱动其他人物个体的参考图像来生成视频。

来自主题: AI技术研报
5978 点击    2025-02-14 17:32
李飞飞看中的万亿赛道,中国首个自研空间智能AI登场!单张图即生3D世界

李飞飞看中的万亿赛道,中国首个自研空间智能AI登场!单张图即生3D世界

李飞飞看中的万亿赛道,中国首个自研空间智能AI登场!单张图即生3D世界

中国首个全自研空间智能AI诞生了,单图即可生成360度无限3D场景,实时互动自由探索。这不仅是技术的革新,更预示着,游戏电影等领域即将迎来颠覆性的变革。

来自主题: AI技术研报
6844 点击    2025-02-14 16:11
超越CoT!微软剑桥中科院提出MVoT,直接可视化多模态推理过程

超越CoT!微软剑桥中科院提出MVoT,直接可视化多模态推理过程

超越CoT!微软剑桥中科院提出MVoT,直接可视化多模态推理过程

近日,微软和剑桥大学公布推理新方法:多模态思维可视化MVoT。新方法可以边推理,边「想象」,同时利用文本和图像信息学习,在实验中比CoT拥有更好的可解释性和稳健性,复杂情况下甚至比CoT强20%。还可以与CoT组合,进一步提升模型性能。

来自主题: AI技术研报
5799 点击    2025-02-14 14:15
AI意识更进一步!谷歌DeepMind等:LLM不仅能感受痛苦,还能趋利避害

AI意识更进一步!谷歌DeepMind等:LLM不仅能感受痛苦,还能趋利避害

AI意识更进一步!谷歌DeepMind等:LLM不仅能感受痛苦,还能趋利避害

以大语言模型为代表的AI在智力方面已经逐渐逼近甚至超过人类,但能否像人类一样有痛苦、快乐这样的感知呢?近日,谷歌团队和LSE发表了一项研究,他们发现,LLM能够做出避免痛苦的权衡选择,这也许是实现「有意识AI」的第一步。

来自主题: AI技术研报
5685 点击    2025-02-14 13:48
Meta全新脑机接口模型,挑战Neuralink!无需植入芯片实现「心灵感应」

Meta全新脑机接口模型,挑战Neuralink!无需植入芯片实现「心灵感应」

Meta全新脑机接口模型,挑战Neuralink!无需植入芯片实现「心灵感应」

脑机接口技术炙手可热,马斯克的Neuralink更是吸引了全球目光。然而其侵入式方案的风险不容忽视。Meta AI则另辟蹊径,近日推出了非侵入式的Brain2Qwerty深度学习模型,它能通过分析脑电图或脑磁图「读」出人们在键盘上输入的文字。

来自主题: AI技术研报
8338 点击    2025-02-14 11:39
直逼DeepSeek-R1-32B,碾压李飞飞s1!UC伯克利等开源全新SOTA推理模型

直逼DeepSeek-R1-32B,碾压李飞飞s1!UC伯克利等开源全新SOTA推理模型

直逼DeepSeek-R1-32B,碾压李飞飞s1!UC伯克利等开源全新SOTA推理模型

近日,斯坦福、UC伯克利等多机构联手发布了开源推理新SOTA——OpenThinker-32B,性能直逼DeepSeek-R1-32B。其成功秘诀在于数据规模化、严格验证和模型扩展。

来自主题: AI技术研报
6117 点击    2025-02-14 11:09
Karpathy新实验火了!一个「表情」占53个token,DeepSeek-R1苦思10分解谜失败

Karpathy新实验火了!一个「表情」占53个token,DeepSeek-R1苦思10分解谜失败

Karpathy新实验火了!一个「表情」占53个token,DeepSeek-R1苦思10分解谜失败

一个简单的笑脸😀可能远不止这么简单?最近,AI大神Karpathy发现,一个😀竟然占用了多达53个token!这背后隐藏着Unicode编码的哪些秘密?如何利用这些「隐形字符」在文本中嵌入、传递甚至「隐藏」任意数据。更有趣的是,这种「数据隐藏术」甚至能对AI模型进行「提示注入」!

来自主题: AI技术研报
6062 点击    2025-02-14 10:21
单卡3090帮你一口气看完《黑悟空》,港大百度打造超长视频理解引擎VideoRAG

单卡3090帮你一口气看完《黑悟空》,港大百度打造超长视频理解引擎VideoRAG

单卡3090帮你一口气看完《黑悟空》,港大百度打造超长视频理解引擎VideoRAG

今天向大家介绍一项来自香港大学黄超教授实验室的最新科研成果 VideoRAG。这项创新性的研究突破了超长视频理解任务中的时长限制,仅凭单张 RTX 3090 GPU (24GB) 就能高效理解数百小时的超长视频内容。

来自主题: AI技术研报
4989 点击    2025-02-14 10:04
奥特曼自曝:GPT-5要来了,所有人免费!DeepSeek逼急OpenAI,最强路线图曝光

奥特曼自曝:GPT-5要来了,所有人免费!DeepSeek逼急OpenAI,最强路线图曝光

奥特曼自曝:GPT-5要来了,所有人免费!DeepSeek逼急OpenAI,最强路线图曝光

奥特曼回应一切,OpenAI路线图全曝光。GPT-4.5数周发布,成为GPT系最后一个非推理模型。GPT-5将整合o系和GPT系,打造成一个全能系统。最令人兴奋的是,所有人皆可免费用上GPT-5。

来自主题: AI技术研报
7508 点击    2025-02-13 16:19
AI太强,验证码全失效?新南威尔士全新设计:GPT傻傻认不出,人类一致好评

AI太强,验证码全失效?新南威尔士全新设计:GPT傻傻认不出,人类一致好评

AI太强,验证码全失效?新南威尔士全新设计:GPT傻傻认不出,人类一致好评

新型验证码IllusionCAPTCHA,利用视觉错觉和诱导性提示,使AI难以识别,而人类用户能轻松通过。实验表明,该验证码能有效防御大模型攻击,同时提升用户体验,为验证码技术提供了新思路。

来自主题: AI技术研报
6305 点击    2025-02-13 15:45
DeepSeek R1不编程就能生成GPU内核,比熟练工程师好,惊到了英伟达

DeepSeek R1不编程就能生成GPU内核,比熟练工程师好,惊到了英伟达

DeepSeek R1不编程就能生成GPU内核,比熟练工程师好,惊到了英伟达

这项尝试只用到了 R1 模型和基本验证器,没有针对 R1 的工具,没有对专有的英伟达代码进行微调。其实根据 DeepSeek 介绍,R1 的编码能力不算顶尖。

来自主题: AI技术研报
7016 点击    2025-02-13 15:18
清华一作1B暴打405B巨无霸,7B逆袭DeepSeek R1!测试时Scaling封神

清华一作1B暴打405B巨无霸,7B逆袭DeepSeek R1!测试时Scaling封神

清华一作1B暴打405B巨无霸,7B逆袭DeepSeek R1!测试时Scaling封神

【新智元导读】仅凭测试时Scaling,1B模型竟完胜405B!多机构联手巧妙应用计算最优TTS策略,不仅0.5B模型在数学任务上碾压GPT-4o,7B模型更是力压o1、DeepSeek R1这样的顶尖选手。

来自主题: AI技术研报
6917 点击    2025-02-13 14:18
务实测试:DeepSeek 各家 API 真实速度(附:测试脚本)

务实测试:DeepSeek 各家 API 真实速度(附:测试脚本)

务实测试:DeepSeek 各家 API 真实速度(附:测试脚本)

我是先看到了一张极其意料之外的图。首先我要说除了DeepSeek 官方,其他家都很稳定(这里没有吐槽官方的意思,毕竟情况特殊) 至少我没检测到超时或者断开。

来自主题: AI技术研报
9632 点击    2025-02-13 13:54
生成式AI管理者指南

生成式AI管理者指南

生成式AI管理者指南

在数字化浪潮中,生成式人工智能强势闯入管理领域。多数管理者期待它成为得力思维伙伴,却面临应用技能短板。如何跨越这道鸿沟,让AI为管理赋能?“协同思考”或许是解锁强大潜能的关键,带你一探究竟。

来自主题: AI技术研报
7184 点击    2025-02-13 13:43
小白就可以用deepseek-r1+dify结合联网搜索搭建AI产品

小白就可以用deepseek-r1+dify结合联网搜索搭建AI产品

小白就可以用deepseek-r1+dify结合联网搜索搭建AI产品

凌晨的时候,使用deepseek深度思考+联网搜索做了一个AI产品卡片,展示效果很惊艳,如下是做了几个关于AI教育智能硬件产品的特性图,放几个看看效果。我们需要深度思考+联网搜索的能力,需要根据关键词去检索到详细的信息源,因此联网搜索必不可少,然后根据如上搜索整合的信息让deepseek自适应地根据内容进行排版,选择不同地风格,呈现不同地样式。

来自主题: AI技术研报
9928 点击    2025-02-12 16:58
推理模型新路线开源!与DeepSeek截然不同,抛弃思维链不用人类语言思考

推理模型新路线开源!与DeepSeek截然不同,抛弃思维链不用人类语言思考

推理模型新路线开源!与DeepSeek截然不同,抛弃思维链不用人类语言思考

开源推理大模型新架构来了,采用与Deepseek-R1/OpenAI o1截然不同的路线: 抛弃长思维链和人类的语言,直接在连续的高维潜空间用隐藏状态推理,可自适应地花费更多计算来思考更长时间。

来自主题: AI技术研报
6415 点击    2025-02-12 16:42
抛砖引玉 | 为什么DeepSeek-R1是推理模型?(万字长文)

抛砖引玉 | 为什么DeepSeek-R1是推理模型?(万字长文)

抛砖引玉 | 为什么DeepSeek-R1是推理模型?(万字长文)

这一篇文章来源于我自己的困惑而进行的探索和思考,再进行多次讨论后总觉隔靴搔痒,理解不透彻。 而在我自己整理后,发现已经有小伙伴点明了他们的区别。但是因为了解深度的不够,即使告诉了答案,我也无法理解,总有隔靴搔痒之感。

来自主题: AI技术研报
8722 点击    2025-02-12 16:26
AI已学会自我复制!复旦新研究:开源LLM克隆成功率最高90%

AI已学会自我复制!复旦新研究:开源LLM克隆成功率最高90%

AI已学会自我复制!复旦新研究:开源LLM克隆成功率最高90%

复旦新研究揭示了AI系统自我复制的突破性进展,表明当前的LLM已具备在没有人类干预的情况下自我克隆的能力。这不仅是AI超越人类的一大步,也为「流氓AI」埋下了隐患,带来前所未有的安全风险。

来自主题: AI技术研报
5678 点击    2025-02-12 12:05
全球首个「视频教学」基准!南洋理工、CMU发布Video-MMMU

全球首个「视频教学」基准!南洋理工、CMU发布Video-MMMU

全球首个「视频教学」基准!南洋理工、CMU发布Video-MMMU

人类通过课堂学习知识,并在实践中不断应用与创新。那么,多模态大模型(LMMs)能通过观看视频实现「课堂学习」吗?新加坡南洋理工大学S-Lab团队推出了Video-MMMU——全球首个评测视频知识获取能力的数据集,为AI迈向更高效的知识获取与应用开辟了新路径。

来自主题: AI技术研报
5829 点击    2025-02-12 12:01
推理成本比MoE直降83%!字节最新大模型架构入围ICLR 2025

推理成本比MoE直降83%!字节最新大模型架构入围ICLR 2025

推理成本比MoE直降83%!字节最新大模型架构入围ICLR 2025

字节出了个全新架构,把推理成本给狠狠地打了下去!推理速度相比MoE架构提升2-6倍,推理成本最高可降低83%。

来自主题: AI技术研报
5919 点击    2025-02-12 11:37
8卡32B模型超越o1预览版、DeepSeek V3,普林斯顿、北大提出层次化RL推理新范式

8卡32B模型超越o1预览版、DeepSeek V3,普林斯顿、北大提出层次化RL推理新范式

8卡32B模型超越o1预览版、DeepSeek V3,普林斯顿、北大提出层次化RL推理新范式

推理大语言模型(LLM),如 OpenAI 的 o1 系列、Google 的 Gemini、DeepSeek 和 Qwen-QwQ 等,通过模拟人类推理过程,在多个专业领域已超越人类专家,并通过延长推理时间提高准确性。推理模型的核心技术包括强化学习(Reinforcement Learning)和推理规模(Inference scaling)。

来自主题: AI技术研报
5618 点击    2025-02-12 11:33