AI资讯新闻榜单内容搜索-训练

Murati翁荔陈丹琦公司发布首个产品，让大模型微调门槛暴降，要重新发明一个OpenAI

Thinking Machines Lab发布首个产品：Thinker，让模型微调变得像改Python代码一样简单。也算是终于摘掉了“0产品0收入估值840亿”的帽子。Tinker受到了业界的密切关注。AI基础设施公司Anyscale的CEO Robert Nishihara等beta测试者表示，尽管市面上有其他微调工具，但Tinker在“抽象化和可调性之间取得了卓越的平衡”

来自主题: AI资讯

10946 点击 2025-10-03 11:53

英伟达一口气开源多项机器人技术，与迪士尼合作研发物理引擎也开源了

这次英伟达可谓是“全家桶”式发布：不仅有让机器人拥有”物理直觉”的Newton引擎，还有赋予机器人人类推理能力的Isaac GR00T N1.6基础模型，以及能够生成海量训练数据的Cosmos世界基础模型，直接瞄准了机器人研发中最头疼的几个问题。

来自主题: AI资讯

8867 点击 2025-10-03 11:47

斯坦福洗碗机器人新作！灵巧手跟人学采茶做早餐，CoRL 2025提名最佳论文

来自斯坦福大学、哥伦比亚大学、摩根大通AI研究院、卡耐基梅隆大学、英伟达提出了一种数据采集与策略学习框架DexUMI——利用人手作为自然接口将灵巧操作技能迁移至多种灵巧手。该框架通过硬件与软件的双重适配，最大限度缩小人手与各类灵巧手之间的具身差异。

来自主题: AI资讯

10696 点击 2025-10-03 11:46

小红书发布FireRedChat：首个可私有化部署的全双工大模型语音交互系统

小红书智创音频团队推出业内首个支持私有化部署的全双工大模型语音交互系统 FireRedChat，自研流式 pVAD 与 EoT 让语音交互更加自然，首发级联与半级联两套实现，端到端时延逼近工业级应用。

来自主题: AI技术研报

9658 点击 2025-10-03 11:44

简简单单来个DeepSeek-V3.2-Exp 大解剖～附case评测

家人们，就在国庆放假前的今天凌晨，那个总在节前“搞事”的 DeepSeek，又双叒叕深夜悄然上线了！讲真，DeepSeek 是真的不考虑我们媒体人的死活啊哈哈！每次都卡着放假前更新，之前大家都转发的吐槽截图，本人又翻出来了：

来自主题: AI技术研报

10401 点击 2025-10-03 00:01

OpenAI和DeepMind大佬离职联手，誓用AI科学家实现室温超导！已融3亿美元

OpenAI的后训练负责人和DeepMind的另一位AI4S大佬，双双离职并成立了一家AI4S公司Periodic Labs，专注于用AI Agent改造传统科研，助力攻克室温超导等世纪难题。目前该公司已获3亿美元融资。

来自主题: AI资讯

10560 点击 2025-10-02 09:00

全新合成框架SOTA：强化学习当引擎，任务合成当燃料，蚂蚁港大联合出品

蚂蚁通用人工智能中心自然语言组联合香港大学自然语言组（后简称“团队”）推出PromptCoT 2.0，要在大模型下半场押注任务合成。实验表明，通过“强起点、强反馈”的自博弈式训练，PromptCoT 2.0可以让30B-A3B模型在一系列数学代码推理任务上实现新的SOTA结果，达到和DeepSeek-R1-0528, OpenAI o3, Gemini 2.5 Pro等相当的表现。

来自主题: AI技术研报

8659 点击 2025-10-01 17:12

首次实现第一视角视频与人体动作同步生成！新框架攻克视角-动作对齐两大技术壁垒

AI生成第三视角视频已经驾轻就熟，但第一视角生成却仍然“不熟”。为此，新加坡国立大学、南洋理工大学、香港科技大学与上海人工智能实验室联合发布EgoTwin ，首次实现了第一视角视频与人体动作的联合生成。

来自主题: AI技术研报

10082 点击 2025-10-01 11:43

字节Seed发布PXDesign：蛋白设计效率提升十倍，进入实用新阶段

AI蛋白设计进入新阶段！最近，字节跳动Seed团队多模态生物分子结构大模型（Protenix）项目组提出了一种可扩展的蛋白设计方法，叫做PXDesign。在实际测试中，PXDesign展现出极高的效率，24小时内即可生成数百个高质量的候选蛋白，生成效率较业界主流方法提升约10倍，并在多个靶点上实现了20%–73%的湿实验成功率，达到了当前领域的领先水平。

来自主题: AI资讯

10342 点击 2025-10-01 11:42

Thinking Machines曝LoRA终极指南：10倍学习率，媲美全参微调

LoRA能否与全参微调性能相当？在Thinking Machines的最新论文中，他们研究了LoRA与FullFT达到相近表现的条件。Thinking Machines关注LoRA，旨在推动其更广泛地应用于各种按需定制的场景，同时也有助于我们更深入审视机器学习中的一些基本问题。

来自主题: AI技术研报

9957 点击 2025-10-01 11:42