ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
AI长焦成手机影像升级大方向,计算摄影会“杀死”光学影像吗?
5747点击    2024-11-01 10:08

小米OV悉数入局,人人都爱AI长焦?


大伙儿有没有发现,10月份这波新机仿佛达成了共识。


不管是标准版,还是Pro版,几乎都开始主打「长焦升级」。


像昨晚发布的小米15系列,Pro版本直接用上了前代Ultra定位才有的5000万像素、5倍光变IMX858潜望式长焦


再往前一点的vivo X200系列,Pro版本更是用上了前代Ultra定位才有的2亿像素、3.7倍光变HP9潜望式长焦


至于OPPO Find X8 Pro,则配备了一颗3倍光变潜望长焦和一颗6倍光变潜望长焦,帮助消费者越级享受到了双潜望长焦的快乐。


(图源:vivo)


至于那些主打纤薄小巧机身的机型?


你别说,这次小米15、OPPO Find X8,也都配备了完全可用的直立长焦,而vivo X200 Pro mini更是用上了一颗的5000万像素、3倍光变LYT600潜望式长焦


有趣的是,即便如此,这些旗舰新机在长焦上似乎也没有更多的优势。


回顾2024年,真我的剑走偏锋,让OV64B大底潜望一度下沉到了2000元价位段;曾经号称最大底的潜望长焦——IMX890,现在也是随随便便就能下放给主打性价比的子品牌用。


当以往抠抠搜搜的潜望长焦,今年甚至都能下放到标准版,乃至下放到中端机上面,你就知道国内这手机市场到底有多卷了。


(图源:真我)


诶,这时可能有的靓仔要疑惑了。


在这种情况下,旗舰新品又会怎么去强调自己的优势呢?


别问,问就是有「AI」


没错,不仅是影像超大杯,可以说今年年底的这一批旗舰手机,都会基于AI大模型做超分算法,来补强高倍率拍照下的解析力。


处于风口浪尖的我们,或许正在见证着AI影像时代的到来。


AI彻底释放了长焦的潜力


在我印象里,最早说把AI大模型融入影像的——


应该是小米吧。


今年年初,在小米14 Ultra发布会上,卢伟冰用了几乎一半的时间来强调了这款超大杯旗舰机的影像能力,具备全焦段徕卡光学大光圈四摄,以及全球首个「AI大模型计算摄影平台」AISP


(图源:小米)


按照卢伟冰当时的说法,AISP不仅能通过算法优化,让画面在明暗、景深、色彩等多个方面更具有审美的层次感;更重要的是,还可以在30倍或更高的光学变焦场景下,直接利用AIGC技术重绘图像,让远处的物体瞬间从毛边像素变得清晰。


这,便是所谓的AI长焦


具体原理其实挺好理解的,我想生成式人工智能大家应该有所耳闻吧,这是一种通过分析大量的数字化材料产生新颖的文本、图像、音乐和软件,然后跟进关键词/提示信息生成全新内容的能力。


通过生成式人工智能的应用,在原本相对模糊的长焦相片基础上,让AI来补充图像里面缺失的细节部分而不改变照片整体感觉,就可以使得照片在维持真实性的基础上更加清晰、自然,理论上用户也能够更好地欣赏到被放大的细节。


具体效果嘛……


就这么说吧,我手上的小米14,本身只有一颗3倍光学变焦镜头。


随便从高处拍摄一张园区里的照片,可以看到远处的红旗以及更远处的园区名字基本上都看不清楚了。


(图源:雷科技)


然后这是不换手机,直接拉到30倍,自动启动大模型长焦算法后的效果。


(图源:雷科技)


由于原本机身内的长焦镜头素质不高,因此很难给大模型提供清晰的影像,即便如此我们依然能看到大模型修复后的叶片、窗户和红旗细节,以及更远处的园区名字也是一览无余。


虽说涂抹感略重,但是对比以前一眼模糊的效果还是强上太多了。


或许正因如此,后面各家厂商也是纷纷跟进。在X100S、X200系列上,vivo通过AI大模型对超过十亿的物体数据学习,再结合AI多帧高像素算法,实现了远景画面的高清拍摄;OPPO Find X8系列更是直接宣传搭载了AI千里长焦,在20倍-120倍变焦时会利用新的AI计算方式,大幅提升基础解析力和细节表现。


通过AI对影像的升级,手机拍摄的照片确实变得更加清晰了。


手机影像提升是“螺丝壳里做道场”


作为旗舰手机的核心卖点之一,影像硬件配置一直都是各家厂商竞争的焦点,这点我想应该没有多少读者会反对吧。


而在过去十余年间,手机影像硬件配置的内卷基本可以分为三个部分。


第一部分是卷传感器,不断追求更大尺寸的主摄像头传感器,直至一英寸大小的传感器成为高端影像手机的标准配置。


第二部分是卷镜头数量,从传统基础的后置单摄,再到极限追求场景适配的多摄组合,直到近年才定下「主摄-长焦-超广角」的基本组合。


第三部分是卷镜头焦距,定下基本组合后,厂商自然就会将注意力转移到扩展镜头的焦段范围上,从超广角到长焦,进而实现5倍乃至更多倍的潜望长焦拍摄,同时加入2X和3X等中焦段镜头,以实现光学焦段接力。


(图源:OPPO)


当然,我不难理解厂商们为何孜孜不倦地追求影像硬件配置:


硬件配置是拍出一张好照片的基础,只有更强的硬件才会拥有更好的画质、更高的进光量以及更丰富的细节。


问题在于手机这个载体的物理形态。


用户对手机便携性、手感、颜值的需求日益苛刻,与此同时,厂商又需要想方设法在有限的空间塞入更大的电池,以及更多的元器件以实现更丰富的功能(如卫星通信),用户不断吐槽的“堆料”其实是难度极高的技术活儿,堪称“螺丝壳里做道场”。


这也让手机影像的提升变得难上加难。


受限于机身内部空间,手机的长焦镜头,注定不能无脑堆堆乐,因为相机模组的厚度是有一个不影响握持手感的「上限」在哪里的。


vivo X200 Ultra上那颗蔡司2亿APO长焦,基本就是手机所能容纳的上限了。


但是长焦天生又有着望远,以及压缩空间构图的需求,3.7倍光学变焦显然不足以满足摄影爱好者的需求。


所以咱们能看到,时间来到2024年,各家厂商都给长焦上了一套全新的AI长焦算法,它让手机不必过于卷硬件,而是更大程度地释放既有硬件威力。


和AI打配合,无疑是当下,乃至未来手机计算摄影的主流方向。


做好AI长焦的关键在于降低AI感


上面呢,咱们也说了不少AI长焦的优势了。


到这个点,我想细心的小朋友们也该发现了,“难不成这所谓的AI长焦,它就没有一丁点缺点吗?”


哈哈,那肯定不是的。


咱们小白自然是不咋讲究,但至少在小绿书上面,就有很多资深摄影佬,旗帜鲜明地站出来反对厂商们这么干——


“AI算出来的细节,它都不真实了,还算摄影吗?”


嗯……这么说,倒好像也没错。


看过咱们雷科技vivo X200系列评测的读者应该都知道,这AI长焦算法的优缺点其实都挺明显的。


在长焦倍数太大的时候,算法能给原本画质下降严重的图片,补上清晰的纹理线条和降噪。


看上去倒是讨喜,但是从下方的图可以明显看到,当小雷将倍数拉到20倍时,灯塔上的纹理全部是由AI进行后期处理重构的,确实有一种说不出的怪异感。


(图源:雷科技)


此外,就像AI绘画弄不好文字和手部细节那样。


现在的AI长焦,对于远处人脸细节的处理,还有各种拍摄字体的场景,都很容易抽风,在高倍率变焦下,本该横平竖直的字体,经过超分算法的处理后,甚至会变得扭扭捏捏、难以分辨。


更有甚者,直接显示口口口口。


(图源:雷科技)


只能说镜头里拍不出来的细节,指望AI脑补确实不太现实。


不过我相信随着大模型的进步和手机ISP算力的提升,AI算法会越来越成熟,这也是内部空间捉襟见肘的手机应该去发展的方向。


随着经验积累,手机对于算法是否介入也会变得更加敏感,应该能够尽可能地减少用户感到恐怖谷效应的情况。


至于那些抵触AI长焦的声音嘛……


我只能说随着大模型的发展,以后手机会用到AI的功能只会有多无少,建议还是跟上这股时代的潮流吧。


文章来自于“雷科技”,作者“雷科技”。


关键词: AI , AI手机 , AISP , AI摄像