AITNT-让一部分人先用AI实现商业化

推理时也能做偏好优化，无需额外重训练，来自上海AI Lab港中文等

传统的偏好对⻬⽅法，如基于⼈类反馈的强化学习（RLHF）和直接偏好优化（DPO），依赖于训练过程中的模型参数更新，但在⾯对不断变化的数据和需求时，缺乏⾜够的灵活性来适应这些变化。

来自主题: AI技术研报

6726 点击 2025-02-10 17:19

人大刘勇团队「慢思考」机理分析：从雪球误差到正确推理概率

「慢思考」（Slow-Thinking），也被称为测试时扩展（Test-Time Scaling），成为提升 LLM 推理能力的新方向。近年来，OpenAI 的 o1 [4]、DeepSeek 的 R1 [5] 以及 Qwen 的 QwQ [6] 等顶尖推理大模型的发布，进一步印证了推理过程的扩展是优化 LLM 逻辑能力的有效路径。

来自主题: AI技术研报

3885 点击 2025-02-10 17:04

北航推出TinyLLaVA-Video，有限计算资源优于部分7B模型，代码、模型、训练数据全开源

近日，北京航空航天大学的研究团队基于 TinyLLaVA_Factory 的原项目，推出小尺寸简易视频理解框架 TinyLLaVA-Video，其模型，代码以及训练数据全部开源。在计算资源需求显著降低的前提下，训练出的整体参数量不超过 4B 的模型在多个视频理解 benchmark 上优于现有的 7B + 模型。

来自主题: AI技术研报

6734 点击 2025-02-10 16:54

诺奖得主DeepMind CEO放话：DeepSeek是中国最好AI模型，但没任何科学进步

xAI、谷歌DeepMind和Anthropic的CEO们纷纷对DeepSeek的技术创新性提出质疑，认为其并未带来实质性的科学突破。AI大佬纷纷泼冷水，到底是技术讨论还是各怀目的？

来自主题: AI资讯

7708 点击 2025-02-10 16:50

万物皆可接入DeepSeek，44家接入R1的国产平台超详细大盘点。

我前几天也一直在写DeepSeek的使用教程，想选出尽量最简单最好上手的方式让大家都能舒服的体验这波热潮。但是我发现，自第一天干崩硅基流动、第二天干崩秘塔AI搜索后，涌现出来的三方平台越来越多了，写不完，根本写不完。

来自主题: AI资讯

7809 点击 2025-02-10 16:45

独家｜3D AIGC领域的DeepSeek？算力需求直接暴降80%，生成结果达到人工水平

DreamTech，由牛津大学、南京大学等顶尖高校研究者组成的AI创业团队，在春节期间公布了他们在3D生成方向上的新工作成果——Neural4D 2.0（初版名为Direct3D），提出了创新性的3D Assembly Generation算法思路及更高效的模型架构

来自主题: AI资讯

7901 点击 2025-02-10 16:36

从零到专业！深圳一平台让小白也可轻松成为AI算法工程师

2月8日，共达地创新技术（深圳）有限公司（以下简称“共达地”）市场负责人李苏南在办公室向记者演示了他们自主研发的“神器”：只需规划好AI应用场景，上传视频、图片等原始数据并定义标注类别，机器便如同经验丰富的AI工程师，自动分析数据特点

来自主题: AI资讯

5552 点击 2025-02-10 16:32

o3-mini数学推理暴打DeepSeek-R1？AIME 2025初赛曝数据集污染大瓜

就在刚刚，AIME 2025 I数学竞赛的大模型参赛结果出炉，o3-mini取得78%的最好成绩，DeepSeek R1拿到了65%，取得第四名。然而一位教授却发现，某些1.5B小模型竟也能拿到50%，莫非真的存在数据集污染？

来自主题: AI资讯

8020 点击 2025-02-10 11:21

天才解法震惊人类！谷歌AI破天荒摘得奥数金牌，横扫IMO 42道几何难题

谷歌DeepMind的AI，终于拿下IMO金牌了！六个月前遗憾摘银，如今一举得金，SKEST新算法立大功。这不，它首破解了2009 IMO最难几何题，辅助作图的神来之笔解法让谷歌研究员当场震惊。

来自主题: AI资讯

7873 点击 2025-02-10 11:17

图像生成推理大模型，港中文北大等联手破解画质提升难题

图像生成模型，也用上思维链（CoT）了！此外，作者还提出了两种专门针对该任务的新型奖励模型——潜力评估奖励模型。（Potential Assessment Reward Model，PARM）及其增强版本PARM++。

来自主题: AI技术研报

4843 点击 2025-02-10 11:09

车企抢抱DeepSeek大腿，中国车企要靠AI“换道超车”？

当ChatGPT用对话颠覆人机交互时，车企们早已嗅到了AI大模型的潜力——从语音助手到自动驾驶，从情感陪伴到场景决策，智能座舱的体验边界正被重新定义。

来自主题: AI资讯

7856 点击 2025-02-10 11:04

DeepSeek爆火，但被AI抛弃的人，无人关心

这两天，韩束母公司上美股份创始人吕义雄的一段工作群中的聊天截图在社交媒体上疯传。在聊天截图中，吕义雄表达了激进的用人策略，即用AI替代大部分人，只留少量能够使用AI的人。

来自主题: AI资讯

7701 点击 2025-02-10 11:00

被 DeepSeek 抢的风头，OpenAI 决定在「审美」上找回来

新年伊始，在估值攀上 3400 亿美元的新巅峰后，OpenAI 也辞旧迎新，更换了新字体、新标志、新配色方案，进行了一次全面的品牌重塑。Open AI 这次重塑的目的，一是为了摆脱设计总监 Shannon Jager 所说的「OpenAI 一直在用相当随意的方式，向世界展示自己。字体、Logo 和颜色的杂乱无章，只会彰显出公司缺乏明确的统一战略。」

来自主题: AI资讯

6619 点击 2025-02-10 10:57

AI技术更新太快，该从何学起？

今年春节deepseek的爆发，一方面是看到了国内AI的崛起，另一方面也是没能让我们过一个好年。几个朋友就和我说，感觉自己虽然每天都在努力的摄入AI知识，但是发现自己的学习速度还比不上AI的更新速度。

来自主题: AI资讯

3719 点击 2025-02-10 10:51

OpenAI内部模型曝光！编程能力跻身全球Top50程序员，年底不再有人类对手

除了o1/o3，OpenAI另一个尚未公开的内部推理模型曝光了。爆料者正是CEO奥特曼本人。据他透露，与全球顶尖程序员相比，当前这一内部模型的编程能力已达Top50，甚至今年年底将排名第一。

来自主题: AI资讯

7737 点击 2025-02-09 23:09

历史性一刻！顶级域名ai.com重定向到DeepSeek官网，此前是ChatGPT

刚刚，“顶级”域名 ai.com 被人发现，被重定向到 DeepSeek 官网！我输入 ai.com，就会直接出现 DeepSeek 官网 ⬇️，绝对保真！

来自主题: AI资讯

7965 点击 2025-02-09 22:45

国运级的创新？从 DeepSeek-V3 到 R1 的架构创新与误传的万字长文分析

DeepSeek 的最新模型 DeepSeek-V3 和 DeepSeek-R1 都属于 MoE（混合专家）架构，并在开源世界产生了较大的影响力。特别是 2025 年 1 月开源的 DeepSeek-R1，模型性能可挑战 OpenAI 闭源的 o1 模型。

来自主题: AI资讯

9452 点击 2025-02-09 22:14

哥大辍学天才获OpenAI力挺，爆款AI一夜摧毁6000亿广告界！

一位哥大辍学生，正在颠覆6000亿美元广告行业！只用几分钟，一句提示，爆款AI就能生成、复刻大牌广告，还获得了OpenAI、Pika等硅谷大佬的鼎力支持。

来自主题: AI资讯

7787 点击 2025-02-09 21:49

DeepSeek流量超Gemini登顶全球第二！马斯克挟xAI更强模型宣战

DeepSeek火的一塌糊涂，其访问量暴涨614%，已成全球第二大爆火应用。马斯克剧透，xAI将发布比R1更好的模型。

来自主题: AI资讯

6702 点击 2025-02-09 21:38

DeepSeek-R1推理本地跑，7GB GPU体验啊哈时刻？GRPO内存暴降，GitHub超2万星

黑科技来了！开源LLM微调神器Unsloth近期更新，将GRPO训练的内存使用减少了80%！只需7GB VRAM，本地就能体验AI「啊哈时刻」。

来自主题: AI资讯

8046 点击 2025-02-09 21:29

DeepSeek爆火，国内同行度过了一个痛苦的春节

DeepSeek让国内一众大模型同行度过了一个“痛苦”的春节。年前，DeepSeek掀起AI海啸，有某大厂大模型业者就捶胸顿足：“产品超出了我的想象，比咱家的各方面都好，真想跳槽到DeepSeek。”还有很多人反思，为啥咱自家就没做出DeepSeek。也有业者不服气，认为“它的火只是一种情绪的泡沫。”

来自主题: AI资讯

6671 点击 2025-02-09 09:48

靠DeepSeek赚钱的「卖铲人」，浮夸至极 | BUG

目前在淘宝、小红书、抖音等短视频平台及知识星球等知识付费平台上，已经涌现出大量顶着DeepSeek名义进行赚钱的项目，赚钱模式大致可分为三大类：卖课程、卖AI服务、博眼球打造个人IP。三项中，以卖课程最为盛行。

来自主题: AI资讯

7808 点击 2025-02-09 09:25

终于！小米首款AI眼镜来了，“百镜大战”高潮将至？

2月6日有网友发文表示，小米眼镜官微上线，预示着小米AI眼镜即将到来。随后小米公关部总经理王化辟谣，小米眼镜官微多年前就已注册，并非最近上线。

来自主题: AI资讯

6665 点击 2025-02-09 09:20

奥特曼再谈DeepSeek：肯定开源模型巨大贡献，坚信人类终将实现AGI

在柏林工业大学的一场圆桌对话当中，奥特曼再一次谈到了DeepSeek，并大赞开源模型对世界的贡献。对话中，奥特曼还发表了对AGI的最新看法，透露了十足的信心，他认为，虽然会遇到阻碍和挑战，但他相信人类终将实现AGI。

来自主题: AI资讯

8696 点击 2025-02-09 09:16

Perplexity CEO 最新采访：DeepSeek 美国本土化与合并 TikTok US

Perplexity CEO Arvin Srinivas 在今天 CNBC 采访中谈到了 Perplexity 与 DeepSeek 的整合，以及作为美国初创公司如何确保用户数据安全、避免审查问题，并提出了其与 TikTok 合并的战略构想。

来自主题: AI资讯

7843 点击 2025-02-09 09:10

“我劝过梁文锋很多次，DeepSeek要融资”

爆火的DeepSeek，足以载入史册。很多年后人们回想起这一刻，结论或许是从2022年底OpenAI发布ChaGPT，中国AI发展的主流叙事始终是“追赶”，而DeepSeek横空出世，将“追赶“变成了“创新”和“普及”，甚至是“重塑”和“超越”。

来自主题: AI资讯

6718 点击 2025-02-08 22:09

腾讯云X DeepSeek：API调用+联网搜索，分钟打造企业级 AI 应用

刚刚，腾讯云再放大招——不仅上线了 DeepSeek-R1 和 V3 原版模型的 API 接口，还将它们接入了大模型知识引擎，并支持联网搜索，成为国内率先实现这一能力的云厂商。

来自主题: AI资讯

6993 点击 2025-02-08 17:25

昆仑万维旗下天工AI正式上线DeepSeek R1+联网搜索

2月8日，昆仑万维旗下「天工AI」正式推出PC版重大更新——上线“DeepSeek R1 + 联网搜索”功能。这一全新升级，不仅解决了用户长期以来关注的DeepSeek联网功能无法使用的问题，还优化了R1版本偶尔崩溃的困扰，为用户带来更加稳定、高效、智能的AI体验。

来自主题: AI资讯

6887 点击 2025-02-08 17:20

a16z：2025年AI语音智能体（AI Voice Agents）该怎么投？

语音是人工智能应用公司最重大的突破之一。作为人类最常用、信息密度最高的交流方式，语音如今在人工智能的推动下首次实现了“可编程化”。

来自主题: AI资讯

4169 点击 2025-02-08 15:50

朱啸虎态度180度大反转，大喊“我肯定会投deepseek“！

“我肯定会投啊！我肯定会投！——这个价格已经不太重要了，关键是参与在这里面。”1年前，2024年初，在我们关于《朱啸虎讲了一个中国现实主义AIGC故事》的报道中，朱啸虎的观点淋漓尽致地展现了一个现实版中国AI故事。他用“我们一看就知道，这个肯定没戏”，“我们一开始就说了，我就不看好大模型”，“ 我都不愿意去聊，你知道吗？这没有意义”，表态绝不会投资6家中国大模型创业公司中的任何一家。

来自主题: AI资讯

7779 点击 2025-02-08 14:38

AITNT-让一部分人先用AI实现商业化

AI资讯-这里有最及时全面的人工智能资讯报道

AI技术研报-这里有最前沿的人工智能技术解读

AI监管政策-这里有最深刻的人工智能政策解读

AI产品测评-这里有最详细的人工智能工具测评解析

AI商业项目-这里有洞察力最强的AI项目的商业逻辑解析

AI排行榜-这里有最新的AI产品,大模型等人工智能行业的排行榜单

推理时也能做偏好优化，无需额外重训练，来自上海AI Lab港中文等

人大刘勇团队「慢思考」机理分析：从雪球误差到正确推理概率

北航推出TinyLLaVA-Video，有限计算资源优于部分7B模型，代码、模型、训练数据全开源

诺奖得主DeepMind CEO放话：DeepSeek是中国最好AI模型，但没任何科学进步

万物皆可接入DeepSeek，44家接入R1的国产平台超详细大盘点。

独家｜3D AIGC领域的DeepSeek？算力需求直接暴降80%，生成结果达到人工水平

从零到专业！深圳一平台让小白也可轻松成为AI算法工程师

o3-mini数学推理暴打DeepSeek-R1？AIME 2025初赛曝数据集污染大瓜

天才解法震惊人类！谷歌AI破天荒摘得奥数金牌，横扫IMO 42道几何难题

图像生成推理大模型，港中文北大等联手破解画质提升难题

车企抢抱DeepSeek大腿，中国车企要靠AI“换道超车”？

DeepSeek爆火，但被AI抛弃的人，无人关心

被 DeepSeek 抢的风头，OpenAI 决定在「审美」上找回来

AI技术更新太快，该从何学起？

OpenAI内部模型曝光！编程能力跻身全球Top50程序员，年底不再有人类对手

历史性一刻！顶级域名ai.com重定向到DeepSeek官网，此前是ChatGPT

国运级的创新？从 DeepSeek-V3 到 R1 的架构创新与误传的万字长文分析

哥大辍学天才获OpenAI力挺，爆款AI一夜摧毁6000亿广告界！

DeepSeek流量超Gemini登顶全球第二！马斯克挟xAI更强模型宣战

DeepSeek-R1推理本地跑，7GB GPU体验啊哈时刻？GRPO内存暴降，GitHub超2万星

DeepSeek爆火，国内同行度过了一个痛苦的春节

靠DeepSeek赚钱的「卖铲人」，浮夸至极 | BUG

终于！小米首款AI眼镜来了，“百镜大战”高潮将至？

奥特曼再谈DeepSeek：肯定开源模型巨大贡献，坚信人类终将实现AGI

Perplexity CEO 最新采访：DeepSeek 美国本土化与合并 TikTok US

“我劝过梁文锋很多次，DeepSeek要融资”

腾讯云X DeepSeek：API调用+联网搜索，分钟打造企业级 AI 应用

昆仑万维旗下天工AI正式上线DeepSeek R1+联网搜索

a16z：2025年AI语音智能体（AI Voice Agents）该怎么投？

朱啸虎态度180度大反转，大喊“我肯定会投deepseek“！