ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
当端侧AI赋能智能影像设备,这家公司一年全球爆卖百万台
8797点击    2024-11-05 10:11

AI赋能给稳定器的,不是功能叠加,而是重新定义运行方式和交互体验。


10月29日晚8点,一场科技产品发布会里的嘉宾引发了行业关注。 


发布会邀请了30位特殊嘉宾,——它们是30台各大品牌手机,开启不同拍摄软件,搭载在多款浩瀚AI稳定器上,主持人比个OK手势,30台手机便整齐划一地跟随主持人的位置追踪拍摄。 



当一位书法爱好者沉浸式地在书写时,无须其他人的介入操作,通过触控屏上的拍摄目标框选,稳定器可以聚焦锁定书法爱好者的手部,并紧跟手部动作跟随拍摄,同时手柄上的控制器屏幕可以分离放到桌面,实时预览拍摄画面,一个人即可沉浸式地完成整个拍摄过程。 




这些“手机观众”被搭载的稳定器设备,来自于深圳一家专注于智能影像设备的科技公司hohem浩瀚。此次,他们发布的“浩瀚M7”手机稳定器新品,不管是技术上还是功能上,在行业里都很超前。 


设计上,“浩瀚M7”不仅是一体化的形态,更采用了巧妙的模块化设计。基于正交三轴结构,创新性搭载了AI追踪模块和触屏控制器,同时内置高强度延长杆,及全彩RGB光效,可谓“叠满buff”。 


功能上,“浩瀚M7”不仅具备高性能三轴防抖功能,同时“AI追踪”全面升级到从追人到追万物的原生跟拍,还可以通过屏幕实时预览AI画面,远程控制调参。 


这项功能背后,恰恰是洞察到了全民直播短视频热潮下,更加细分人群的诉求——他们可以是专业车拍或地标建筑的摄影极客,也可以是拍摄萌宠的用户,甚至是不想露脸,爱好手作、艺术记录的人们。


在M7之前,为什么没有品牌能够解决手机“万物原生跟拍”的问题?除了要具备人群洞察的眼光,技术与思路,都是难题。


其他品牌实现物体追踪,用户需要先下载特定APP,或者限制手机系统才能实现原生跟拍。但只要用户必须迁就机器,就不是一个足够优秀的智能产品。 


AI物体追踪涉及到大量物体的模型训练,浩瀚采取分类物体模型的技术思路,建立起车、宠物、建筑等多样本图像数据库。但即使有了基础,实现仍面临难题,因为这些图像既要被准确识别,又要低延时传输到控制器屏幕上,还要平衡功耗,以及需要规划好人机交互的形式,看似小小的模块,在背后是一套完整复杂的系统。浩瀚创始人陈敏介绍,为了攻克任意物体识别跟踪和交互体验的难题,浩瀚持续保证研发团队专注且较高的投入,最终颠覆性地将AI画面预览、可视化调参、远程控制三大功能集成在浩瀚M7的触屏控制器上,高集成度和创新交互在行业内实属超前。 


可见,AI赋能给稳定器的,不是功能叠加,而是重新定义运行方式和交互体验。



浩瀚M7发布之后,2小时内一跃成为抖音3C数码类目销排第一。 


这台结合了防抖增稳、AI追踪、远程触控、智能运镜的手机稳定器足以证明,纵使身处垂直赛道,只要持续技术创新,解决细分用户的实际痛点,亦能在当下竞争残酷的智能影像赛道中快速破圈。


也正是靠着在稳定器领域的持续深耕,它背后的公司浩瀚卓越科技也获得了不小的商业成就。十年的时间里,浩瀚从深圳这片激烈的硬件热土杀出重围,成长为国家级专精特新“小巨人”企业。 


如今,这家公司的发展恰如其名——每年营收达到数亿规模,出货量突破百万台并持续攀升。在海外渠道,他们的手持稳定器产品在亚马逊等平台跃居品类头部;在国内,他们蝉联国内抖音、天猫等平台稳定器类目销量榜第一名。 


这家典型深圳公司的案例,提供了一个事实:尽管手持稳定器当下的渗透率不到1%,但专业垂直赛道从来不是一个困境,反而蕴藏着巨大的机会。 


“浩瀚M7”手机稳定器是一个小小的观察窗口,将眼光拉向浩瀚十年间的产品思路,可以发现,这家公司的破圈秘诀在于,不断推进智能影像产品的智能化和易用性进程


据浩瀚创始人陈敏介绍,浩瀚在AI算法模型上的投入可以追溯到2014年。浩瀚过去其实是第一家将蓝牙技术赋能到稳定器上的厂商,让手机稳定器的智能追踪能够借助手机的算力和电池来完成。而早在今年这轮AI硬件浪潮之前,浩瀚在2021年就已经突破性将“端侧AI”的能力,赋能到V2手机稳定器上,进一步赋予了手机稳定器成为“智能摄影师”的可能性。之后浩瀚推出的全新一代V3手机稳定器,创新性的磁吸式AI追踪器,可自由切换前/后置镜头,追踪精准度大大提升。浩瀚V3也在刚刚斩获了全球顶尖的消费科技界风向标——2025年美国CES创新奖项。 


当浩瀚稳定器已经脱离App限制、可自由追踪人物目标时,浩瀚M7又更进一步,不局限于人物目标,实现了更多场景下任意物体目标的识别和追踪拍摄。显然,只有当硬件的使用难度在一步步降低,更加智能及易用,产品才有了普适化的基础。 


在激烈的商业竞争中,鲜少有品牌能够保持这样对技术攻坚的持续热情。


过去十年,浩瀚并不是靠一款爆款产品打天下,在打磨产品的同时,也蕴含了他们对不同细分人群,在不同场景下需求的极致洞察,用更丰富的产品矩阵专注打透场景人群的需求,比如浩瀚手机稳定器的产品里面再细分出不同矩阵——M系列对应专业级严肃创作用户,X系列、V系列则对应消费级日常生活记录用户,所以从人、货、场,实现更精细化的营销策略打法。 


“持续进行产品创新,让AI跟拍稳定器普惠更多的用户,是我们未来的重要工作” ,“浩瀚”的创始人兼CEO陈敏表示。在他看来,未来,端侧AI驱动的稳定器还有更大的破圈可能性,这个赛道未来还很“浩瀚”。 


近期,36氪在与陈敏交流中,他分享了“浩瀚”如何不断革新手持稳定器技术,背后关键产品思路的迭代;以及作为一家典型的深圳硬科技公司,他们出海破圈的决心。

 

以下是交流实录(略经编辑) 


当AI成为稳定器底色,锦上添花还是噱头?


Q:对于一个人群渗透率目前还不高的品类而言,破圈是一件很重要的事情。你们的破圈打法和尝试是什么?


陈敏 :我们内部经常讲的大白话是:产品足够小巧便携、简单易用、价格普惠。我们背后的逻辑是,把这个产品从原来的小众的专业摄影器材人群,迈向大众人群。 


我们去年在国内抖音圈定了精致宝妈人群,她们需要更高频记录自己的日常生活。专门研发了一款小巧便携的产品,并采用了粉色的ID设计语言,在抖音定向做触达投放,销售了二十多万台。这一人群在我们触达之前,其实对手持稳定器这个产品类目是完全不了解的。 


当我们做泛消费人群的时候,是沉下心来,以不同的人群、场景的特点,针对性提供比较好的产品交互体验。 


Q :“浩瀚M7”上有哪些核心AI技术难点需要去突破? 


陈敏 :首先是,AI算法。对于人物、车、宠物这类常见拍摄主体,AI追踪针对性进行分类模型训练,识别准确度和跟踪效果都不错。对于拍摄不规则物体对象,识别成功率可能会低一些,比如45度车头可能识别率高,但稍微角度偏差一些可能会识别不准确,浩瀚团队也在针对这些场景不断优化中。 


其次,手持稳定器是电池类供电产品。对于端侧AI来说,核心挑战在于,如何实现低功耗与AI算力性能之间的平衡。我们持续不断地在优化我们的模型,比如手势识别、人物、衣着、色块,以及不规则形状在不同角度下的自适应追踪,随着我们的算法进一步迭代,在同样算力、功耗的情况下,明后年在我们的智能拍摄系统上,将会开放更多的AI拍摄功能体验。 


Q:这次浩瀚M7宣称有两大buff,具体来说强在哪里?


陈敏 :一个是再一次全面升级的AI追踪器。别看它外观上只是一个磁吸摄像头,它集成了AI算法、图像识别和补光灯三大模块。既能实现人物/物体追踪,而且端侧AI让用户不用下载特定APP,不用连接蓝牙,不限手机就能开启追踪。而且补光灯集成CCT和RGB全彩两种灯光模式。它就像是给浩瀚M7装上了一颗强健心脏,给稳定器赋能。 


另一个是行业首创的分体式触屏控制器。它集成了画面预览、可视化调参、远程控制三大功能,我们定制的1.4英寸的全彩屏,配合上AI追踪实时画面预览,同时磁吸分体式设计,哪怕是远距离场景也能控制,告别盲拍。 


Q :“智能跟拍摄影师”,对于用户来说是一项稳定器的痛点吗,还是锦上添花?


陈敏 :对于日常生活记录的用户来说,底层拍摄需求是没有被完全释放,拍视频、剪视频的难,导致大家没有百分百享受到在这个场景下该有的记录和分享的乐趣。 


未来,我们希望通过端侧AI的进一步赋能,让很多原来不会拍的人,只需要买个智能拍摄设备,就可以完成记录和分享任务。 


Q:随着手机厂商逐渐在提升防抖的功能,会不会对你们行业产生降维打击?


陈敏 :在2021年前,手持稳定器行业主打的功能就只有三轴防抖,它是一个纯执行单元。但在2021年之后,我们逐渐把端侧的算力能力集成到手持稳定器上,具备了AI视觉感知能力,意味着稳定器从原来纯粹的执行单元迭代成具备视觉感知、执行闭环的小机器人模型。在这个基础上,稳定器更像是一个“智能摄影师”的角色,防抖只是它最基础的功能。 


Q:浩瀚稳定器的功能几年内也发生了很多变化,这背后基于怎样的产品思路迭代,又有哪些关键的技术创新?


陈敏 :第一阶段:从电子防抖到物理防抖。像手机摄像头电子防抖,是通过对画面的裁切,以达到稳定图像的效果,对画质是有损的。且电子防抖很难应对人大幅度的晃动,所以也就有了稳定器的物理防抖,用户不用再担心手抖了,更不用担心画质受损。 


第二阶段:从防抖到初代AI追踪 。2016年之前,稳定器只有防抖功能,浩瀚发现仅仅“稳拍”对用户来说功能太单薄,他们还想要“帮我拍”的智能交互。浩瀚是第一家给稳定器加蓝牙APP和人脸追踪的厂家,我们在2016年就推出了“智能拍摄”这一产品方向,也就是初代的AI追踪。 


第三阶段:从初代的APP追踪到端侧AI追踪 。APP追踪拍摄推出一段时间后,我们看到一些弊端——用户的前置准备工作比较长,所有的功能是在特定的APP里去完成。因此2021年,我们是行业首创把端侧算力,集成到手持稳定器里。浩瀚推出的V2手机稳定器这款产品,不依赖手机APP和连接蓝牙,只需要对着机器做一个“OK”的手势,机器就会快速识别到这个拍摄目标,以达到任意拍摄软件都可跟拍的效果。 


第四阶段:端侧AI追踪的进一步迭代 。也就是近期浩瀚全新发布的M7。起因是有一位身穿斗笠跳舞的用户反馈在某支舞曲练习的时候追踪不灵敏,我们发现用户在跳舞时穿的服装很有特色,斗笠周围垂下来的薄纱遮住了人形特征,那在我们AI的视觉识别里面是一个非人物的特征,在当时的算法逻辑里面就不是按照人物目标去识别的。我们从这个用户反馈出发,进一步调研观察到有很多沉浸式直播、做手工的用户可能不想露脸,而是只想拍某一个身体部位,因此浩瀚M7实现了从追人到追万物。同时浩瀚M7还创新搭载触控屏,让AI的画面能通过屏幕实时预览,除了原来的手势交互,还能在触控屏上框选操作,整个交互变得更直观。 



Q:手持影像设备的渗透率是?提升渗透率的机会点是什么?


陈敏 :目前连1%都没到。手持稳定器这个品类这十年慢慢分化出两个方向。一个方向是不断的围绕着专业用户去做得更加专业,另外一个方向是围绕着泛消费者人群,设计上需要更加简单、易用,往3C消费这个维度去持续迭代。这是一个挑战,我们也看到了不错的机会。 


Q:你们布局第二增长曲线,是意味着放弃“小而美”?


陈敏 :“小而美”从某种维度上去解读,也可以理解为是在垂直赛道上足够聚焦,专注在智能影像拍摄的赛道,这个是浩瀚过去十年、以及未来5-10年会持续深耕聚焦的方向。我们的第二增长曲线和我们当前主营业务一直保持的是同一个目标,帮助用户更好的去记录和分享。


出海破圈的决心,从“硬骨头”啃起


Q :目前手持稳定器的赛道里,你们是什么身位?


陈敏 :从全球出货量上看,我们排在前二,我们在海外是亚马逊类目头部品牌、国内天猫、抖音销量第一。在今年双十一预售期间,我们也是云台类目销量&销售额双第一。作为成长期的创业公司来说,我们现在的任务是,借助产品创新的优势,快速去触达更多的用户人群,实现品牌的全球化布局。


Q :你们大概的出货量和市场分布情况?


陈敏 :去年全球出货量是百万台以上——60%以上的业务在海外,30%多在国内。海外市场我们主要覆盖北美、欧洲、日韩,2024年我们在亚太的东南亚和南美增长也很快。 


Q:2018年你们曾经经历了从贴牌到自主品牌的转变,为什么会有这个转变?


陈敏 :在2016-2017年和欧美传统的本土品牌贸易商的合作过程中,在商务上遇到了比较大的困境,每一次的订单、交付都在不断的压价格。在他们的心目当中,中国的硬件厂商只是“工厂”,只配获得最低廉的溢价。这在当时是大部分中国出海品牌都面临的一个问题。 


当时我们整个团队其实是有一点点憋屈的,2018年,我们就把所有贴牌的业务砍掉90%。这对我们来说是一个非常艰难的抉择,因为客户当时就说,“你要做自己的品牌,我就不给你订单”。 


当时我们觉得,我们未来如果要走得更远,不可能只是作为低廉的工厂去存活,看不到未来。 当时我们ToB的外贸的业务是经历了冰点,大概持续了半年左右。但是我们也比较幸运,我们在海外线上快速的打开了新的突破口,缓解我们更好的渡过了过渡期的阵痛。 


Q:在海外市场,从代工到做自己品牌,最艰难的地方是什么?


陈敏 :我觉得是调整个团队对于做事情的认知。原来我们更多是focus在产品上面,因为原来用户侧我们是不直接感知的。 


但转做自主品牌之后,最大一个转变是在focus用户,我们会接触到一线的用户和场景,整个团队的思维逻辑发生了巨大的变化。其实也是得益于这样的转变,才让我们对于用户和场景有了更进一步的深度认知,也激励我们在智能影像这个赛道不断突破向前。

 

文章来自于“晓曦”,作者“晓曦”。


关键词: AI , AI硬件 , 浩瀚M7 , AI影像
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales