AI资讯新闻榜单内容搜索-A

台积电千亿美元投资美国！英伟达、博通秘密测试英特尔：谁输谁赢？

台积电豪掷千亿美元在美建厂，特朗普高调站台。与此同时，昔日霸主英特尔奋起直追，18A制程被寄予厚望，英伟达、博通等巨头秘密测试。代工大战硝烟再起！然而，18A制程的延期又为英特尔的复兴之路蒙上阴影。

来自主题: AI资讯

7963 点击 2025-03-04 19:51

全面增强LLM推理/规划/执行力！北航提出全新「内置CoT」思考方法

基于内置思维链的思考方法为解决多轮会话中存在的问题提供了研究方向。按照思考方法收集训练数据集，通过有监督学习微调大语言模型；训练一个一致性奖励模型，并将该模型用作奖励函数，以使用强化学习来微调大语言模型。结果大语言模型的推理能力和计划能力，以及执行计划的能力得到了增强。

来自主题: AI资讯

7628 点击 2025-03-04 19:46

讯飞星火X1单挑满血版DeepSeek-R1，全国产算力单机部署！中国AI再下一城

就在昨天，全国产算力训出的讯飞星火X1全面升级！70B小身板在数学领域全面领先，性能直接对标OpenAI o1和DeepSeek-R1。单机部署成本骤降，彻底颠覆行业应用门槛。

来自主题: AI资讯

9531 点击 2025-03-04 16:26

NP难问题接近被AI破解！南航牛津爆改DeepSeek-R1推理，碾压人类27年研究

给DeepSeek-R1推理指导，它的数学推理能力就开始暴涨。更令人吃惊是，Qwen2.5-14B居然给出了此前从未见过的希尔伯特问题的反例！而人类为此耗费了27年。研究者预言：LLM离破解NP-hard问题，已经又近了一步。

来自主题: AI技术研报

10278 点击 2025-03-04 16:20

有没有复杂任务自动化的Multi-Agent框架？用Nexus，几行YAML搞定数据清洗

随着R1等先进推理模型展现出接近人类的推理能力，多代理系统（Multi-Agent Systems，MAS）的发展也出现了前所未有的机遇。然而，随着我们尝试构建越来越复杂的多代理系统，一个核心问题日益凸显：如何在保持系统灵活性的同时，降低开发和维护的复杂度？

来自主题: AI技术研报

9857 点击 2025-03-04 16:12

速递｜AI搜索独角兽Perplexity推出AI手机售价数百美金，与德国电信运营商合作

今年在巴塞罗那的 MWC 上，有一家运营商宣布与顶级 AI 公司合作打造智能手机。而现在，德国电信Deutsche Telekom（DT）宣布正在构建一款“AI Phone”。这是一款与 Perplexity 以及 Picsart 等公司紧密合作打造的低成本手机，同时推出了一款名为“Magenta AI”的新 AI 助手应用。

来自主题: AI资讯

10106 点击 2025-03-04 14:48

智谱开源AI绘图CogView4，曾经的开源之光回来了。

上周DeepSeek连续5天开源硬核技术，阿里开源万相2.1，Qwen的推理模型推出预览版，但是肯定马上也要开源。而今天，智谱这个曾经的开源之光，在昨天官宣拿了杭州10亿融资之后，在官宣文章里如此写道：

来自主题: AI资讯

11098 点击 2025-03-04 14:42

17 岁华裔大学生的 AI Wrapper 火了，发布 5 小时收入 1 万美金

今天想介绍一个 17 岁的华裔大学生，他最近做的一个 AI Wrapper 产品，发布 5 小时收入就突破了 1 万美金，随后在发布的推文火了之后又通过线上会议 Google Meet 的售后承诺在 24 小时赚到了 3 万美金。

来自主题: AI资讯

11541 点击 2025-03-04 14:38

实测字节免费AI编程，还让不让Cursor活了

国内首个原生AI IDE（集成开发环境），来自字节，实测在此：哪怕一点代码都不懂，只要能说出自己的需求，就能靠AI开发出一个功能完备的应用。例如如果你想做一个Flappy Bird游戏，那就用中文跟它说一声就行：

来自主题: AI资讯

7916 点击 2025-03-04 14:33

DeepSeek-R1、o1都在及格线挣扎！字节开源全新知识推理测评集，覆盖285个学科

要知道，过去几年，各种通用评测逐渐同质化，越来越难以评估模型真实能力。GPQA、MMLU-pro、MMLU等流行基准，各家模型出街时人手一份，但局限性也开始暴露，比如覆盖范围狭窄（通常不足 50 个学科），不含长尾知识；缺乏足够挑战性和区分度，比如 GPT-4o 在 MMLU-Pro 上准确率飙到 92.3%。

来自主题: AI技术研报

8120 点击 2025-03-04 14:28