
卡奥斯位居IDC中国工业大模型及智能体解决方案领导者
卡奥斯位居IDC中国工业大模型及智能体解决方案领导者近日,全球权威咨询机构IDC发布《IDC MarketScape: 中国工业大模型及智能体解决方案 2025年厂商评估》。报告选取了中国市场18家工业大模型及智能体解决方案的典型服务商进行重点研究,从现有能力和未来战略两个层面对厂商进行评估,为工业企业选择大模型、智能体服务提供了参考。
近日,全球权威咨询机构IDC发布《IDC MarketScape: 中国工业大模型及智能体解决方案 2025年厂商评估》。报告选取了中国市场18家工业大模型及智能体解决方案的典型服务商进行重点研究,从现有能力和未来战略两个层面对厂商进行评估,为工业企业选择大模型、智能体服务提供了参考。
昨天,深度求索刚刚开源 DeepSeek-V3.2-Exp。今天,另一国产大模型之光智谱 AI 也正式发布了旗下新一代旗舰模型 GLM-4.6,刚好撞车 Claude Sonnet 4.5。但有一点不同,智谱的 GLM-4.6 会继续开源,它即将上线 Hugging Face、ModelScope 等平台,遵循 MIT 协议。
AI生成第三视角视频已经驾轻就熟,但第一视角生成却仍然“不熟”。为此,新加坡国立大学、南洋理工大学、香港科技大学与上海人工智能实验室联合发布EgoTwin ,首次实现了第一视角视频与人体动作的联合生成。
如今,几乎转个身的功夫就会听到又有公司创建了新的 MCP 服务器。几乎每天都有新的 MCP 服务器发布,该如何判断哪一个最适合自己?通过大量的研究和 Gemini 的一点帮助,我们识别出了十个可以支持和简化前端开发工作的 MCP 服务器(加上一个实验性 MCP 服务器)。
AI蛋白设计进入新阶段!最近,字节跳动Seed团队多模态生物分子结构大模型(Protenix)项目组提出了一种可扩展的蛋白设计方法,叫做PXDesign。在实际测试中,PXDesign展现出极高的效率,24小时内即可生成数百个高质量的候选蛋白,生成效率较业界主流方法提升约10倍,并在多个靶点上实现了20%–73%的湿实验成功率,达到了当前领域的领先水平。
LoRA能否与全参微调性能相当?在Thinking Machines的最新论文中,他们研究了LoRA与FullFT达到相近表现的条件。Thinking Machines关注LoRA,旨在推动其更广泛地应用于各种按需定制的场景,同时也有助于我们更深入审视机器学习中的一些基本问题。
Sora 2,用OpenAI的原话描述就是:“With Sora 2, we are jumping straight to what we think may be the GPT‑3.5 moment for video。”AI视频的ChatGPT时刻,正式来了。
凌晨1点,OpenAI突然扔出Sora 2核弹,AI视频迎来「GPT-3.5时刻」!一大批惊艳Demo放出,物理智能提升一大截,首次实现音画同步,人物一致性、可控性刷新SOTA。但最绝的还是Sora App,它的问世,或将彻底重塑短视频社交媒体的交互逻辑与社区互动方式。
在我们往期观察“AI+声音”的应用中,多是 TTS、AI 生成播客和读书/配音等方向,先有文字内容、后转化为声音输出的偏“工具”类产品。当大多数产品在探索如何用 AI 声音改变内容传播的形式时,一家德国厂商却在另一个方向持续耕耘,并且维持了不错的流水表现。
在今年 3 月 DeepSeek 和豆包占领国内产品月活用户增速前两名的时候,以第三姿态紧随其后的,是红果短剧。两者之间这个巧合的「偶遇」,意外也不意外。反映的正是我们当下经历的最重要的技术与文化浪潮。
最强编程模型让位了。 但没有换人,依然是Claude。 新发布的Claude Sonnet 4.5,在SWE-bench上的成绩比Sonnet 4提升了1.8个百分点,而且提质不加价。
用户体验研究(UXR,User Experience Research)是驱动企业增长的引擎,但核心流程却高度依赖人工。从收集数据、分析客户需求、再到测试产品,需要一段很长的时间线,这个过程常常出现 “企业想做的” 与 “用户真正需要的” 之间的脱节。
我是洛小山,和你聊聊 AI 使用技巧。
数字人这赛道也越来越卷了, 大模型可以写剧本,语音模型可以配出百变语气,当我越来越不满足于只是把口型对上这件事之后, 那这个只会坐着、不能走路、表情都是提前预设好的、台词数字人,会如何进化?
数据分析初创公司Fivetran 正就收购数据管理公司 dbt Labs 进行谈判,据知情人士透露,该平台可帮助企业为分析和人工智能应用管理及预处理数据。
当全世界都在狂热追逐大模型时,强化学习之父、图灵奖得主Richard Sutton却直言:大语言模型是「死胡同」。在他看来,真正的智能必须源于经验学习,而不是模仿人类语言的「预测游戏」。这番话无异于当头一棒,让人重新思考:我们追逐的所谓智能,究竟是幻影,还是通向未来的歧路?
在工业级大语言模型(LLM)应用中,动态适配任务与保留既有能力的 “自进化” 需求日益迫切。真实场景中,不同领域语言模式差异显著,LLM 需在学习新场景合规规则的同时,不丢失旧场景的判断能力。这正是大模型自进化核心诉求,即 “自主优化跨任务知识整合,适应动态环境而无需大量外部干预”。
构建有价值的AI Agent需审慎选择场景,避免滥用。应用前需评估任务复杂性、价值是否匹配成本、模型核心能力有无硬伤及出错风险容忍度。开发时坚持极简原则,聚焦环境、工具集、系统提示三大核心要素。优化调试的关键在于理解Agent有限上下文视角,模拟其受限决策状态。
9 月 25 日,白鲸出海携手 Meta、Adjust 特别策划的鲸英会第三十三期 ——「AI+APP=∞」产品 Mix 迸发新惊喜如期在北京举行。来自 Meta 及其国内代理、Adjust 等众多出海行业和政策专家,以及 40 多位中国头部 AI 创企 CXO
宇树旗下多款机器人,被曝存在严重的无线安全漏洞!消息由IEEE Spectrum报道指出。具体情况是这样的——多款不同型号的宇树机器人BLE(蓝牙低功耗)Wi-Fi 配置界面存在严重漏洞,攻击者可借此实现最高权限控制。
正当大家都在预测牌桌上的其他巨头何时出手时,行业领头羊 OpenAI 的「王炸」似乎已经提前被剧透了,那就是 Sora 2。最近,OpenAI 不仅在 X 平台连发多条神秘视频,引爆社区对 Sora 2 的猜想。
Alex 是一家开发 AI 招聘官的初创公司,该公司表示其技术已帮助企业进行视频面试和电话初筛。约18 个月前联合创办 Alex 的王亚伦(图中下排居中)向 TechCrunch 透露,该公司的语音 AI 工具能在求职者投递简历后立即开展自主面试。"我们的 AI 招聘官每天进行数千场面试,帮助求职者进入全球顶尖企业工作,"他说道。
成立仅四个多月的具身智能机器人企业——浩海星空,斩获汽车密封条龙头浙江仙通的4000万战略投资。引人瞩目的是,上市公司创始人李起富亲自下场,与浩海星空联手操刀设立合资公司,共建机器人整机生产基地。
近日,暗壳科技(深圳)有限公司(下称:暗壳科技/暗壳AI)宣布完成新一轮近千万融资,此次由福田引导基金旗下子基金集福基金投资。据暗壳科技CEO黄燕虹透露:本轮融资将用于加大暗壳AI技术研发投入以及产品迭代和生态建设,保持产品在垂直领域的领先优势,同时加快推进暗壳AI全球化市场。
本周,我们邀请 3D 大模型公司 VAST 的创始人和 CEO 宋亚宸(Simon),和我们聊聊 VAST 最新 3D 生成大模型 Tripo 3.0 背后的故事。这位 97 年的创业者短期内连续融资三轮、每轮数千万美金,积攒了足够的子弹,在闷头苦干一年后,Simon 今年首次上播客,和我们探讨了几个关键的战略问题:
从重庆魔幻山城到全球Robotaxi布局,千里科技展现出将AI融入物理世界的雄心。董事长印奇的「千里计划」——One Brain, One OS, One Agent——勾勒出跨场景智能生态,让汽车成为高效、安全的现实世界入口和未来的人类伙伴。
一家来自印度苏拉特的创业公司 Rocket.new 却声称他们解决了这个问题。不仅如此,他们还刚刚完成了1500万美元的种子轮融资,由Salesforce Ventures和Accel联合领投,Together Fund跟投。更令人惊讶的是,这家公司从beta版上线到完成融资仅用了3个月时间,目前已经拥有40万用户,分布在180个国家,年收入达到450万美元。
为破解机器人产业「一机一调」的开发困境,智源研究院开源了通用「小脑基座」RoboBrain-X0。它创新地学习任务「做什么」而非「怎么动」,让一个预训练模型无需微调,即可驱动多种不同构造的真实机器人,真正实现了零样本跨本体泛化。
上海人工智能实验室发布新一代文档解析大模型——MinerU2.5。作为MinerU系列最新成果,该模型仅以1.2B参数规模,就在OmniDocBench、olmOCR-bench、Ocean-OCR等权威评测上,全面超越Gemini2.5-Pro、GPT-4o、Qwen2.5-VL-72B等主流通用大模型,以及dots.ocr、MonkeyOCR、PP-StructureV3等专业文档解析工具。
全新一代 video-SALMONN 2/2+、首个开源推理增强型音视频理解大模型 video-SALMONN-o1(ICML 2025)、首个高帧率视频理解大模型 F-16(ICML 2025),以及无文本泄漏基准测试 AVUT(EMNLP 2025) 正式发布。新阵容在视频理解能力与评测体系全线突破,全面巩固 SALMONN 家族在开源音视频理解大模型赛道的领先地位。