DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此
8762点击    2025-04-18 09:24

“DeepSeek,评价一下第三届中国AIGC产业峰会”:


DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此


今年的峰会现场,20余位大咖以「万物皆可AI」为主题,激辩“技术前沿与产业痛点”:


  • 2025年中国AI应用爆发的关键是提速降费。


  • 大模型来了,万物皆可Chat,但不能是单纯Excel+Chat。


  • 大模型落地正在从简单、高容错的场景向复杂、低容错的场景延伸。


  • 物理世界实现AGI,一定要通过端侧智能。


  • 大模型正在打破教育领域长期存在的“不可能三角”。


……


台上精彩纷呈,台下座站无虚席,云端持续火爆,到场参会观众超千人,线上围观人数超320万人,累计曝光量超2000万次,延续了往届峰会的火热。


与以往不同的是,这一次协助编辑部共同整理内容的大模型不再是ChatGPT和Claude,而是DeepSeek


DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此


DeepSeek也成为峰会的高频热词,前所未有的破圈效应把AI推向前所未有的普及程度。


底层的基建,顶层的应用,垂直的场景,正在迎来海量的用户,一个「万物皆可AI」的时代已经到来。如何把握机遇,用好AI,带你一文看尽。


AI如何落地千行百业?


百度阮瑜:大模型场景从简单高容错向复杂低容错延伸


百度副总裁阮瑜首先谈到了大模型应用展现的三大趋势:开发者可以轻松快速、低成本地开发出企业应用;大模型场景从简单高容错向复杂低容错延伸;应用市场在从工具市场向专业服务市场拓展,市场潜力不断地爆发。


DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此


随之而来的,可以看到大模型的应用形态也在不断演进:从单模态到多模态,从单智能体到多智能体,从辅助决策向自主执行演进。在这个趋势下,越来越多的大模型应用也将逐步解决用户场景中的更多实际问题。


按照场景划分,百度智能云将千行百业的应用分为两类:通用应用和行业应用


通用应用中,多模态是个重要演进方向。大模型时代,百度智能云发现大小模型相结合的方式,随着多模态技术不断发展,调优成本是显著降低的,而且碎片化的需求将有非常大的可能性会被标准化的产品来满足。


百度智能云一见就是在视觉领域应用深耕多年诞生出来的产品,其主要覆盖三个场景,分别是安全生产(比如能源制造领域,沉淀了800多个安全生产模型)、连锁合规(比如餐饮安全,有大量视觉场景需求)以及品质管控等。


此外,大模型在行业里的应用也发生了很多变化。以医疗为例,AI技术变革正全面渗透进各种场景中,已经能看到医疗大模型从辅助决策到自主执行方向演进。


阮瑜表示,整个AIGC应用在各个产业里面的创新,离不开产业各界的共同努力。期待未来随着大模型技术的不断发展,可以携手各方共同去加速大模型应用在产业里面的落地、繁荣以及发展。


生数科技廖谦:随着多模态生成能力实时可控可交互,会诞生全新的内容平台


生数科技产品副总裁、Vidu产品负责人廖谦带来了多模态大模型生成方向的展望。


DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此


从整体技术发展来看,文本生成工作相对早,技术范式也更明确,解锁的应用场景非常多;多模态起步稍晚一点,图像生成发展很快,已经突破了技术奇点;而视频生成这块,现在的研发进入到黄金发展期。


最近多模态还有个重要方向是具身智能,当多模态的模型可以利用更多维度的数据,也会带来更高维度的智能涌现。


而从产品来看,当前整个中国视频生成/多模态生成的产品,不管是模型效果、用户、商业化的进展,放眼全球都是相对领先的。


那么视频生成能干什么?在生数Vidu的实践中,AI短片、动漫、大众娱乐、广告营销、电商等都是可落地的场景。


接下来多模态生成领域如何发展,他分享了三个行业洞察。


趋势一,2025年将是多模态生成的爆发之年;


趋势二,多模态内容直出,而非仅仅是默剧和片段。


趋势三:专业和半专业用户会大规模涌入,产生破圈高价值的内容。


不过当前还是有很多问题需要解决,下周生数将发布Vidu Q1模型,它将在“极致高质量“上带来新的突破。


最后作为产品经理,廖谦对多模态大模型的终局进行了展望。


随着多模态技术发展到可以做到实时可控可交互时,它完全做到个性化,到那时一定会诞生出全新内容平台。这将在社交、游戏、VR、AR等多个行业领域带来非常深远的影响。


粉笔陈建华:有多少Context,就有多少个性化


大模型的出现,打破了教育不可能三角。可以同时兼顾高质量、大规模化和个性化。


大会现场,粉笔CTO陈建华分享了他


们在AI教育领域的探索和实践。


DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此


粉笔成⽴于2015年,是⼀家专注于职业考试培训的互联⽹教育公司。


在陈建华看来,大模型落地教育有四个特点:聚焦学会,⽽⾮仅答案正确; 学习主动⾯临巨⼤挑战; 遵循科学、系统的教研体系;场景严肃、准确率要求极⾼。


陈建华分享,粉笔在大模型教育应用探索主要有三个阶段。


阶段一,聚焦在内部、有限制、⼩场景中进⾏探索。2023年粉笔尝试直接解题,辅助题⽬解析,结果正确率太低,解析不符合教研体系。不过在点评场景⾥,给出点评框架让⼤模型发挥,却发现效果⾮常不错。


由此,他们意识到:⼤模型在教育场景落地中,推理能⼒仍需提升,结构化引导⾄关重要。


阶段⼆,2024年粉笔正式推出AI⽼师,标志着从单点场景⾛向系统化、多场景融合,得到不少收获。


而在第三阶段,AI时代的全新产品——AI系统班发布,基于⼤模型、数字⼈、TTS等技术,AI系统班全程由AI⽼师驱动学习流程,且提供了更加个性化的学习体验。


陈建华强调:有多少Context,就有多少个性化。


展望未来,他表示,粉笔在⼤模型赋能教育的探索将主要聚焦在两个关键⽅向:多维度的个性化升级和三位一体的AI老师形态。


面壁智能李大海:物理世界实现AGI,一定是通过端侧智能


面壁智能联合创始人、CEO李大海带来了端侧智能的分享,他从DeepSeek的成功切入主题,李大海认为其成功背后是天时地利人和的叠加,最底层是三个“密度”:


高人才密度、高组织密度、高资源密度。他总结认为DeepSeek是在云端践行高效大模型的组织,而面壁在端侧秉承同样的信念。


DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此


基于端侧智能的长期实践,李大海提出了知识密度的概念,即大模型同样参数量能够压缩越多的知识,知识密度越高,模型的智力就越强。


面壁认为,高知识密度的模型在端上最有价值,端侧智能也是物理世界实现AGI的必由之路。因为物理世界的交互对实时性与用户隐私保护有基本要求,端侧更有优势,李大海以具身智能为例展开介绍了两个场景。


首先是汽车,李大海认为,汽车是第一个真正落地的具身智能。因为汽车的网络不可能100%稳定,因此需要不受网路影响的端侧模型可随时随地感知。


目前面壁已在车端落地了首个纯端侧Agent智能助手超级小钢炮cpmGO,不仅包括去年12月即端侧部署的首个纯端侧、Always On 的 GUI Agent 屏幕助手, 还创造了覆盖感知、决策、执行全场景,与云端全面对齐的智能座舱「原生端侧体验」。突破弱网断网环境限制,实现低功耗高性能快响应的「端侧」专属优势。


然后是机器人,李大海认为只有把大模型直接部署在机器人的脑子里,机器人才能稳定地灵敏感知与及时决策,相比云端具备先天的数据优势与用户信任感。


中关村科金喻友平:“平台+应用+服务”是企业大模型落地的最佳路径


中关村科金总裁喻友平的演讲主题是“垂类大模型迈入商业化应用时代”,他介绍了中关村科金如何将大模型技术应用于企业服务领域。


喻友平强调,2025年大模型正式进入应用时代,企业面对大模型关注的核心问题其实是:大模型能否帮助增加收入、带来更多客户、节约成本或提高效率。


尽管企业应用面临算力成本高、模型与业务融合难、数据处理低效等挑战,但市场前景广阔,而垂类大模型则是企业突围的关键


DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此


喻友平介绍,中关村科金是一家大模型技术与应用公司,具有10年+企业服务经验,积累了深厚的领域和行业产品基础。AI大模型浪潮来临后,不断用大模型对自有产品进行重构。


近两年他们发现,企业对于垂类大模型、基于大模型平台的应用需求越来越大,在实际企业服务过程中,还发现一个规律:


要真正帮助这些企业实现大模型落地,本质上还是需要做好平台、应用和服务


由此,中关村科金提出了“平台+应用+服务”的三级引擎战略,是企业大模型落地的最佳路径,其核心是基于得助大模型平台训练垂类大模型,打造有价值的智能化应用。


得助大模型平台覆盖算力、数据、模型和智能体四大能力工厂,兼容各类算力和国内外开源基础模型,提供从数据标注到训练推理的全流程支持,具备全链路的大模型开发和应用能力。并且平台还沉淀了数百个大小模型组合的“样板间”,帮助客户更容易实现应用落地。


喻友平指出,大模型在企业的应用难以完全标准化,每个企业业务流程和目标、数据都有差异,在“样板间”里企业则可以根据各自的需求场景做调优,中关村科金与众多合作伙伴一起训练出面向不同场景和行业的垂类大模型,并打造出得助智能陪练、智能质检、语音机器人、文本机器人、知识助手等有实用价值的智能应用。


最后他还介绍了在垂类大模型、垂类场景中,中关村科金在工程建设领域、船舶工业领域,以及金融、汽车、家装等行业的一系列大模型落地案例。


网易有道张艺:「AI+教育」的想象力与落地


网易有道智能应用事业部负责人张艺围绕AI教育,分享了有道一系列的大模型落地成果。


DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此


张艺认为大模型在教育场景天然的具有普适性,学校、家庭和自学三个场景非常关键,AI在不同场景扮演着不同的角色。


比如在家庭场景,AI像家庭老师帮你辅导孩子,自学场景则更像是个学习搭子。


张艺介绍,业内一般将AI在教育领域的进展分为四个阶段,目前AI已从“辅助教学”进化至“个性化学习”,正朝着成为“虚拟老师”努力。


以有道最新落地进展为例,张艺还谈到,AI不仅重塑了原有业务,也带来了全新的AI应用及硬件机会


据介绍,有道自研的子曰翻译大模型2.0最近以14B参数规模,在翻译质量上保持行业领先,已在有道词典、翻译等产品中上线。


在AI原生应用方面,虚拟人口语私教产品Hi Echo,可以提供随时随地的口语练习,以及儿童模式、雅思模式等垂直内容,并履获苹果应用商店推荐,成为教育垂直落地的代表。同时有道今年正在探索AI播客等全新领域,新产品有道文档FM能实现超拟人音色生成,并已开启全网公测。


而有道也在AI原生硬件发力,新品SpaceOne全面屏答疑笔,通过内置的AI家教“小P老师”实现全科答疑的同时,基于多模态识图能力,还带来更丰富的交互学习可能性。


如何为AI产业保驾护航?


PPIO派欧云姚欣:AI时代需要“提速降费”,让免费成为可能


PPIO派欧云联合创始人、CEO姚欣的演讲从“AI大规模应用,成本非常关键”这一问题展开。


DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此


他认为2025年整个AI行业的关注点已从大模型本身转向了应用落地,特别是以Agent为核心的应用发展。


AI应用普及面临两大挑战:Agent单次任务消耗近百万Token、中国互联网用户的免费习惯很难改变


他通过移动互联网发展的历史类比,提出“AI时代需要提速降费”的观点。从2014年到2021年,移动流量资费下降了90%,这极大促进了移动互联网的普及。同样,AI应用要走向大众,也需要大幅降低使用成本。


接下来姚欣表示,目前如果要实现AI大规模应用和降本,AI Infra公司必须要成为最懂上层模型和应用的底层硬件基础设施公司


而这也是PPIO派欧云的定位。他详细介绍了PPIO派欧云的技术策略。


一是持续跟进最新模型,整合更多开源模型,实现模型的推理加速;二是建立全局分布式算力调度系统,应对海量用户请求;三是通过整合全国约4000个数据中心的闲置算力资源,覆盖1200多个城市,提供10毫秒响应的算力服务。


成效方面,姚欣透露PPIO派欧云提供的整个AI推理服务,每年都能实现10倍左右的成本下降。以去年推出的Llama-8B模型为例,上线时定价还是0.1美金,去年年底已降到4分钱,在未来两三个月内还会降到1分钱。


到今天,PPIO平台上每日Token消耗量已突破千亿次,且每月保持超过50%的增速。他相信这一增长曲线将如早期移动互联网一样呈现陡峭上升态势。


亚马逊云Troy Cui:提高数据质量和效率是AI赋能的重要前提


亚马逊云科技大中华区数据及存储产品总监Troy Cui在分享中提出,AI最核心的竞争力仍然是企业自己的数据,如何将数据更快地变成洞察,尽可能提高数据质量,是AI赋能的重要前置条件。


DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此


企业已经认识到数据对自身竞争力的重要性,但目前数据治理存在着诸多问题,比如多部门协作时的数据碎片化问题,传统技术栈与云技术不兼容,传统ETL(Extract-Transform-Load)开发维护成本高等。


针对行业痛点,亚马逊云提出了一系列解决方案。


首先是统一数据与AI平台Amazon SageMaker Unified Studio,提供一站式数据开发、模型训练和部署环境,企业可以基于自身数据,用其在几分钟内构建一个低代码的智能问答平台。


然后是数据检索工具,一个是集成在Amazon SageMake中的AI助手Amazon Q,支持自然语言快速生成复杂的SQL,可以帮助开发者判断代码是否存在知识产权的问题。


还有一个应用于视频的方案Media To Cloud,支持用自然语言搜到想要的视频片段。


接着还有Zero-ETL解决方案,自动化将数据汇聚到数据仓库或数据湖,减少ETL开发工作。


Troy Cui最后总结表示,云服务的基线已经从存储、计算、网络和数据库转变为存储、计算、数据和AI-Infra,这也反映出AI在云计算越来越重要。


无问芯穹夏立雪:端云并举改善算力供需矛盾


无问芯穹联合创始人、CEO夏立雪指出,大模型发展逐渐步入推理规模扩展时代,算力需求将激增百倍,但粗放供给与精细需求矛盾日益凸显。


DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此


他将传统裸金属算力服务比喻为“高端毛坯房”——用户需自主完成系统搭建与运维,使用门槛高且资源利用率低。应构建高质量平台化算力服务,帮助企业将分散算力升级为“商业广场”、“AI赋能综合体”式标准化服务,使中小开发者无需关注底层架构即可获得完整AI服务生态。


无问芯穹正在相应技术堆栈上持续取得突破,在端侧首创SpecEE推理框架,利用小参数模型缩减大模型搜索空间,实现AI PC等智能终端上2.43倍推理加速;云端创新推出semi-PD,结合融合式实例存储优势和分离式实例计算优势,实现延时降低最高达5.6倍;另提出通用计算通信方案FlashOverlap,首次以基于信号的方式实现计算通信重叠以降低通信开销,可在生产级和消费级显卡上实现约1.5倍加速。


夏立雪最后强调,通过全链路算力服务平台研发,无问芯穹正推动AI算力向“水电煤式”基础设施进化,让每份算力高效转化为新质生产力。


瑞莱智慧田天:大模型落地关键在于智能体组织,安全是核心前置门槛


大模型应用广泛落地中,AI安全隐患、AI被滥用等问题开始涌现。在瑞莱智慧视角下,怎么去看待这一问题。


DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此


第一,首先关注去提升AI自身的可靠性和安全性,如越狱攻击、偏见歧视、模型幻觉等,这是因为AI能力还不够强,需要对AI自身进行加固。


第二,随着AI生成能力越来越强,技术本身也是一个双刃剑,需要去防范AI滥用以及被人恶意应用所带来的一些危害。


第三,如果AI能力进一步增强,达到所谓AGI,能力全方位超越人类水平的时候,需要考虑怎么保证AGI的安全发展


围绕AI的内生和衍生安全,瑞莱智慧经过长期实践,已经有一系列平台产品落地。对于怎么确保AGI安全发展,瑞莱也在进行一些前沿的布局研究,包括怎么样搭建超级对齐平台,用AI监管AI,最终实现更加安全的超级智能。


可能大家会有疑问,是不是随着AI大模型能力越来越强,甚至到了AGI时代,自然而然变得更加安全可控,就不需要进行独立的安全研究和布局了。


类比人类社会智能的发展,古代人类个体智慧水平相比于现在,并没有那么大的差异。但古代人类没有办法形成很强的生产力,而现代人类系统,通过强有力的组织形式和分工取得了前人所无法想象的成就,其关键就在于如何将智能体组织起来


对于大模型也一样,今天大模型已具备非常强的能力水平,我们不需要单一的智能体具备无所不能的能力,但如果把现有的智能体通过比较好的方式组织并融入到各行各业的工作流之中,重构工作流程,就有可能大幅度解放AI的生产力。


在这个过程中,安全可控一定是非常核心的前置的门槛


华为王辉:网络安全进入新阶段 ,AI成为网络守护者


华为NCE数据通信领域总裁王辉在演讲中表示,当前全球AI产业正处于全面加速状态,带来网络升级、智能终端泛在和大模型普及等显著变化,持续加剧了企业网络安全风险。


他从网络安全的视角讲述了如何为AI产业保驾护航,以及AI如何为网络和安全产业做好深度赋能。


DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此


他表示,AI催生出了新的网络安全攻击场景,包括大模型越狱攻击(利用大模型自身漏洞进行控制)勒索软件攻击(大模型自动生成勒索变种)社会工程学攻击(大模型钓鱼新型攻击)等。


由此,网络安全也进入了新的阶段,他分享了华为的安全应对之道,即构建以AI为核心的新一代L4级网络自动驾驶系统,实现网络和安全的深度融合,整体包括三层:


  • 智能网元:内生安全,保障网络自主可控;内置AI,为整网智能化提供必要的数据要素;
  • 网安融合:云网边端的的深度融合,形成网安一体的立体式防御作战;
  • 智能决策:在攻击AI加持下,网络智能体尤其关键,在传统检测与响应的工作流外,能够更加自主的威胁分析、阻断与处置闭环。


最后,王辉强调了四个观点:


第一,未来网络安全将进入AI与AI对抗的螺旋式竞争阶段,取决于进化的速度。


第二,智能体的智能程度不是取决于对已知的决策,而是对未知的判断。智能体当前还是采用了大量的外挂,是面向过去经验的总结,提升模型自身的逻辑推理和规划能力,才能从已知走向未知。


第三,AI落地垂直行业是一个系统工程,不仅仅是引入大模型或智能体,更涉及到硬件、软件、模型甚至流程的重塑,紧密结合,相互协同,才能重构一个垂直行业。


第四,在AI这场国运级别的竞争中,要用最领先的AI技术赋能网络,用最安全的网络技术护航AI产业,推动新质生产力,做科技文明复兴的守护者。


各行各业从业者怎么用AI?


MSRA刘炜清:RD-Agent让每个研究员都有个Agent当科研助理


微软亚洲研究研究院首席研究员刘炜清博士谈到的,是大语言模型时代下的数据科学新引擎RD-Agent,其起源、现状和未来。


DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此


回望过去十年产业相关落地应用和工作,常用的开发范式是在海量数据中找到有价值的特征来训练模型,根据业务场景不断迭代渐进的过程,最终得到一个智能化解决方案。


但大模型时代到来,是等待被冲击还是选择被赋能?团队研发RD-Agent的初衷旨在让研究员和数据科学家人人都能拥有科研助理,来承担起重复但高门槛的工作。只需要人类专家提供一个想法以及数据,RD-Agent就能完成代码实现。


当前的阶段,他们更进一步的目标是构建通用的数据科学或机器学习智能体,以增强人类专家的能力和产出,甚至自动解决新场景和新问题并持续改进方案。


通过引入领域知识和经验优化算法,使其可以模仿人类专家,RD-Agent解决广泛数据科学任务的能力得到了显著增强,但也渐渐显现出「只是模仿专家,很难达到更高境界」这种瓶颈,团队正在快速迭代演进中尝试以数据驱动的路线来突破这一瓶颈。目前RD-Agent在Kaggle比赛测试上已经能够达到初阶从业者的水平。


未来他们期待RD-Agent可以自主发现新方法,能重塑数据科学和机器学习领域


最后可以这样总结,团队从最开始自动化为初衷,到现在是增强的阶段,到未来它能在不同场景数据中自主观察、分析和理解来改进现有的方法或者发明新的方法,为各行各业赋能。


数势科技谭李:让每个打工人都能有数据分析和决策助手


今天我给大家分享一个每个打工人都能拥有的数据分析和决策助手。


数势科技联合创始人谭李刚上台就点明了这次演讲的主题。


DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此


谭李首先从行业视角分析了数据分析领域的现状和挑战。他指出,即便是领先的互联网公司或优秀的传统企业,目前也只有10%的业务人员能随时获取所需数据,对于绝大多数业务人员来讲经常遇到的问题是数据分析面临大量的需求“排队”。


他分析了三个关键趋势正在加速新数据消费范式的到来:


  • 数据右移:数据权重从采集、入仓向消费端迁移,“以消费促治理,以消费驱动数据生产”成为主旋律。
  • 决策下移:从集中式决策转向分散式决策,各部门需要做出敏捷决策。
  • 管理后移:科技企业不再设置详细的前期业务规则,而是“招到优秀的人给他好的命题让他自主发挥”。


这三大趋势在需求侧,创造了大量数据即时消费的需求。而供给侧,随着DeepSeek的面世以及AI产业链各环节的发力,AI Agent落地的成本指数级降低。因此,AI Agent用于数据分析场景不仅成为刚需也成为可能。于是谭李介绍了数势科技的新一代决策分析智能体SwiftAgent


SwiftAgent是一款面向企业的数据分析与决策AI智能体,核心解决四层面问题:


及时提供数据和事实,即需即给;给出深度洞察和智能归因;生成智能报告,指引业务决策;关联行动,自主进行长距离任务规划和执行。


谭李还特别强调了企业级应用面临的挑战,为解决这些挑战,数势科技打造了完整的技术栈,解决企业级产品的数据安全、模型幻觉、计算性能问题。


最后,谭李宣布了数势科技即将发布的智能分析Agent白皮书,作为行业方法论引领的重要一步。


蚂蚁集团徐达峰:AI重构前端开发的难点与解决


蚂蚁集团平台智能体验技术负责人徐达峰基于团队在前端从业开发的实践,分享了AI编码落地的难点与解决方案。


DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此


徐达峰表示,AI前端研发已成为行业共识,但在整个软件研发的生命周期仍然有很大的提效空间,AI研发在企业落地主要面临AI辅助编码后续修改比率高,安全与可靠运行,兼容现有研发体系和思维模式等三大难点。


聚焦前端开发场景,蚂蚁前端技术团队打造了WeaveFox智能研发体系进行AI编码,主要有图生代码、意图生码和AI质检系统三大突破方向,让AI能根据用户输入的设计图,或者工程上下文补充逻辑代码,交付通过多模态技术检查产物质量。


当然对前端开发者来说,最棘手的不光是开发和改bug,还有不同终端的页面适配。蚂蚁前端技术团队为此制定了图生代码的UI IR标准,让AI前端开发一键跨端适配成为可能,能够生成各种框架库,比如说VUE和React,也包括后续的鸿蒙OS和安卓的一些界面实现类代码。


目前WeaveFox已在阿里和蚂蚁的实际投产,据介绍在超500名前端工程师的参与下,目前在设计图交付动线场景下 AI 已累计生成合并接近100万行代码;研发效率最高可提升5倍。


趣丸贾朔:AI取代了重复性的音乐工作流


那么AI又如何在音乐产业落地呢?趣丸科技副总裁贾朔分享了他们自身的观察与探索。


DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此


他首先指出2024年是AI音乐发展的重要节点,技术门槛、创作门槛大大降低。这既带来机遇也带来挑战,音乐行业部分工作可能被AI替代或冲击,也可能提高创作效率和质量。


站在2025年AI音乐应用元年的时间点,AI将以怎样的方式给产业带来正向影响?贾朔认为:


一方面,很多AI产业化应用,有可能是以相对来说润物细无声的方式在背后默默进行。


另一方面,他认为AI更有可能作为辅助的方式帮助现有的从业者、创作家,以更低的成本、更快的速度去完成更高质量的艺术创作。以之前的实践来看,AI创作提效提速初步估算在10倍以上。


这也看到了一种新的可能性——


AI的应用与传统产业不是一个替代跟竞争的关系,更有可能是协助产业升级的方式。


他们自研的音乐大模型在多模态音乐生成、中文人声歌曲生成、编曲能力等方面都有特色,甚至还通过了专业学生盲测,多数评测者难区分人声是机器还是真人,歌曲自然度已经突破音乐“图灵测试”,效果超越美国头部模型。


接下来2025年,应用层是他们探索的重要方向。当前他们以MIDI电子编曲为切入点,让音乐人掌握艺术创作的方向盘,由AI辅助帮助音乐人去快速地产生完整的作品。


圆桌对话:AI 产品如何在垂直赛道落地为王


按照惯例,大会最后迎来了一场备受瞩目的圆桌论坛,今年主题聚焦“AI产品如何在垂直赛道落地为王”。


圆桌对话嘉宾是四位垂直领域行业翘楚,分别是:


轻松健康集团技术副总裁高玉石


DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此


像素绽放PixelBloom (AiPPT.com)CEO赵充


DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此


心影随形科技(逗逗游戏伙伴)创始人、CEO刘斌新


DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此


狸谱APP负责人一休


DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此


讨论话题包括产品定位的关键决策、确定产品核心功能的思考历程、AI垂直应用的未来发展趋势等。


Q:为什么要把AI落地到现在的场景?如何确定产品的主打功能?


刘斌新表示,两年前看到ChatGPT后产生了“用AI创造快乐”的想法,想要做“伴随”用户的应用,给用户更多情绪价值。目前产品功能的底层逻辑,就是满足用户在游戏场景里对陪伴、成就和共鸣的需求。


一休则是在看到AI生图能力后,意识到AI可以让原来有创作欲但没有创作技能的普通用户,也能利用AI工具去创作内容。然后打造了狸谱APP,一款能用AI生成漫画和动漫的创作工具,把内容消费者转变为内容创作者,扩大了创作者群体。


Q:如何在容易同质化的场景用AI打造差异化优势?还有哪些进一步的差异化规划?


高玉石介绍目前平台有1.68亿注册用户,和数万多名医疗专业人员以及近百家医药和保险公司建立了伙伴关系,具有非常完整的用户生态和数据的优势,这些优势会进一步放大并转化成差异化优势。他以科普内容为例,表示平台沉淀了超过67万条科普内容,在疾病和健康相关数据有很深厚的积累,相对来说专业性和深入度更高。


赵充分享了对AI应用在产品和渠道侧的打法,首先AiPPT.cn在产品侧是不需要按钮的AI原生工作流程,就和传统PPT创作形成了最基础的差异化,而且覆盖品类范围广,四大PPT品类全都做。然后是渠道侧,目前AiPPT.cn携手200个生态伙伴共同开发市场,为很多知名AI平台如豆包、钉钉的PPT制作赋能,已经在全球积累了约2000万名用户。


Q:从产品面世至今,做AI产品有哪些的环境因素发生了重大变化?这对大家的产品有什么影响?


一休认为环境变化主要有两个,一是视频模型的快速迭代;二不得不提的是DeepSeek。在视频创作方面,一休透露他们原本设想搞类似于平行世界创作,但发现创作核心idea仍然要靠人完成,之后没有在这个方向继续探索下去。DeepSeek出来以后,他们也尝试了用它来写剧情。


刘斌新感受到的变化,首先是大模型底层变化让一些事情变得可能,例如AI搜索在以前有各种幻觉问题,得用各种RAG来做辅助,现在有了推理模型,模型自己能回答得很好。其次,用户对AI的接受度变高。

第三个变化是中国的AI应用正在走向全球。


赵充看来,最大的变化是今年应该是AI应用创业最好的时间,原因有三点:DeepSeek带动了整个AI应用的大盘;所有应用的范式在做切换,有大量的重新定义产品的机会;成本侧,又降了约10倍。


高玉石认为变化有两个,一个是AI技术发展很快,成熟度明显提升,能有效弥补目前自研模型在非核心能力上的各种空白,带来的好处是产品迭代周期和效率明显提升。另外,用户对AI接受度明显提高,但也变得更加理性。现在有层出不穷的AI产品,产品在场景里面有没有有效满足用户需求、有没有解决用户的核心痛点,很关键。


Q:从单次爆款到常青树,维持用户粘性和长期优势的关键因素是什么?


高玉石刘斌新都谈到了首先在解决用户的需求、解决用户痛点上面,真正提供端到端的完整体验。


随后高玉石谈到了以下两点:将用户使用数据与AI产品、场景等结合形成飞轮效应;以及像轻松健康集团这样已经形成完整生态的业务,将AI技术深度融入到业务流程,特别是关键流程,也很关键。他谈到了辅助医生创作科普视频的一系列AI产品和工具,一方面降低了医生进行健康科普的门槛,另一方面C端海量用户也能获取有价值的专业健康知识,增加生态内用户的粘性。


刘斌新则补充表示「做时间的朋友」,随着时代浪潮发展,更多技术迭代去交付更多能超出预期的功能。具体实操上有三个核心策略:通过构建丰富的人物设定与用户建立情感纽带;数据驱动深度洞察用户需求;开放生态协同,提供全方位立体化价值服务。


对于爆款持续打造,一休更有心得。她首先谈到精准匹配平台与人群属性的重要性,根据目标平台特性选择策略,深度洞察群体共性;此外还有内容设计激发传播冲动,强化社交基因与情感共鸣。不过创业公司容易陷入单次爆款热度消退后持续产出爆款的挑战中,现在正在增加小爆款频次,一步步往上走。


Q:根据观察,影响AiPPT.cn一系列成功及用户增长的关键是什么?


赵充谈到两个关键:需求是不是刚性?需求能不能得到满足?


对于需求刚性这件事,有个数据,全球每个月写PPT次数是10亿次,AI技术之后这个数在涨,很多之前不会写PPT的人开始写PPT了。


需求满足这件事,核心思考的是垂直场景适配、产品体验层面等问题,比如像PPT中文本生成,大模型生成的东西不能直接用,尤其在政务、医疗等场景,他们通常会外挂领域知识库实现专业化,从而更适配需求。


Q:下一轮增长的关键驱动因素会是什么?现在还能看到哪些新的场景/应用机会?


刘斌新认为方向可以看多模态的理解,理解指的是理解整个video时序里发生了什么,而不是单一图片的这一帧里面有什么物体。他觉得以前移动互联网常用的MVP模型在AI时代不适用了,需要预判用户的需求怎样随着技术的发展更好地解决,提前做好准备。


一休看好多模态生成,看好的技术方向有两点:一是实时生成,是精准可控性,模式不完全是文字的方式,可以直接是一种手势或者行为加上语音的方式。精准可控性加上实时生成的话玩法会非常多样,自由度非常高。


赵充分享了他们未来的三个核心策略。第一个是针对既有产品做深度场景化;第二个是出海;第三个事情是做新产品投资和孵化。他表示单品很难建立壁垒,靠产品矩阵、综合的经济模型才会更好。


高玉石整体比较看好大健康领域。他认为从传统的诊疗、健康科普、健康管理,甚至临床研究,药物研发,都存在着大量的机会。他还详细介绍了个性化和动态化的健康管理服务,以及基于此,针对特定用户群体提供定制化的保险产品和个性化的保险定价。


文章来自于“量子位”,作者“编辑部”。


DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此

关键词: AI , deepseek , 大模型 , 人工智能
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI漫画

【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用,可以让没有任何绘画基础的用户完成属于自己的漫画创作。

项目地址:https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file

在线使用:https://aicomicfactory.app/

3
AI音乐

【开源免费】suno-api是一个使用监听技术实现了调用suno功能,并封装好API的AI音乐项目。

项目地址:https://github.com/gcui-art/suno-api

4
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

5
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

6
截图转代码

【开源免费】screenshot-to-code是一个可以将网页截图或者原型图片直接转化成前端代码的AI工具。这个项目非常有想象力的让AI提高了前端的开发效率。

项目地址:https://github.com/abi/screenshot-to-code?tab=readme-ov-file

在线使用:https://screenshottocode.com/

7
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

8
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

9
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

10
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales