关于索尼摇摇乐的一些测试和见解

8255 34

[6 楼] 漓江秋色 [泡菜] 24-11-18 09:27 rollingdice 发表于 2024-11-17 23:51 写漏了，100%放大指的是对于2亿4000万像素的100%放大，对于单张是200%，以此类推。因为要对比细节，所以保持所有截图构图统一。这样对比不好吧，要比还是原图100%才好。你看，两张图的树叶都明显不一样，一个是阔叶，一个象针叶了。
[5 楼] rollingdice [泡菜] 24-11-18 05:03 melfes 发表于 2024-11-18 02:50 A1开始支持抖一抖的机身对于拍摄中的物体抖动会自动识别了没错，A7R5也有运动补偿，是把运动的部分替代为原始低像素的第一张照片。宾得的算法也用第一张静止照片，而松下则是类似奥林巴斯，对运动物体进行多张平均值堆栈。我自己比较偏好后者的运动模糊的效果。
[4 楼] melfes [泡菜] 24-11-18 02:50 A1开始支持抖一抖的机身对于拍摄中的物体抖动会自动识别了
[3 楼] rollingdice [泡菜] 24-11-17 23:51 漓江秋色发表于 2024-11-17 23:27 这个100%图似乎不对，16张合成后的大小应该比单张大才对（长宽是单张的两倍）。写漏了，100%放大指的是对于2亿4000万像素的100%放大，对于单张是200%，以此类推。因为要对比细节，所以保持所有截图构图统一。
[2 楼] 漓江秋色 [泡菜] 24-11-17 23:27 这个100%图似乎不对，16张合成后的大小应该比单张大才对（长宽是单张的两倍）。
[1 楼] rollingdice [泡菜] 24-11-17 11:45 最近做了一个关于摇摇乐的测试，分享给大家，希望对这个功能有兴趣的朋友有帮助。摇摇乐，学名叫做像素偏移（pixel shift)，很多高端机型都有，利用机身五轴防抖模块移动传感器半个像素拍摄数张RAW再合成一张RAW，可以达到提高分辨率的目的。理论上，移动传感器的多张RAW堆栈可以实现最多2倍的空间分辨率从而实现类似光学变焦2倍数码变焦，这个之前谷歌的手持超分辨率的论文有说明。于是我做了一个小测试，我的相机是索尼A7R4，因为我只有一个索尼镜头35GM，于是使用了另外一部相机奥林巴斯EM13搭配光学变焦来衡量索尼的摇摇乐效果。所有照片统一物距，光圈统一F5.6，对于三个镜头都是最佳光圈，且三个镜头都是各系统最顶级的镜头，镜头的分辨率差别可以忽略。所有拍摄在三脚架上关闭防抖完成，室内无风。A7R4在35mm时的单张分辨率，和EM13在等效60mm的分辨率接近。这是因为A7R4的6100万像素在缩图到2000万像素时就是60mm左右，并且单个像素面积还比EM13稍微大一点。而使用16张摇摇乐并使用索尼自带软件IEDT合成的结果，分辨率和EM13在等效120mm时十分接近，甚至还有些不明显的领先。所以索尼的这套摇摇乐，是完全可以达到2倍分辨率或者2倍光学变焦的目的。这个分辨率的提升，对于商业产品拍摄提高了打印画幅，对于微距拍摄提高了放大倍率，对于风光拍摄提供了2倍的长焦，听起来非常好。但是实际上索尼官方在摇摇乐的介绍上就提到了只能用于静态拍摄，不能拍有运动的物体。于是我又做了一个对比测试。A7R4的摇摇乐合成的RAW，不放大还行，放到400%看细节，有很多红红绿绿的奇怪色带。这些诡异的颜色应该是由于索尼软件在后期堆栈的时候每张照片只取一个颜色通道的结果，移动后颜色的变化就不再均匀了。这个情况在dpreview上多被称作运动伪影(motion artifact），尼康和富士的高端相机也都会出现这样的情况。但是有意思的是，奥林巴斯的摇摇乐就没有这种情况。我的理解是，如果要用摇摇乐实现2倍分辨率，就必须各个通道分别合成，比如会出现伪影。奥林巴斯似乎对此进行了特殊处理，虽然没有伪影，但是分辨率会降低，我的静态实测，EM13的摇摇乐无法达到2倍的分辨率，同样用1245Pro测试，大概能够到1.6倍分辨率，当然这也是一个不错的效果了。所以似乎是在最大分辨率和能够拍摄运动物体中只能选一个。为了验证我的猜想，我自己写了一个程序，把A7R4输出的16张RAW先导出成JPG，再用傅立叶变换识别偏移像素值，把他们分别调整回原点再进行平均值堆栈，由于所有通道一起堆栈，相当于一个运动模糊的效果，得到了和EM13类似的结果，大概实现了1.5倍分辨率提升，和EM13的算法差距不大，并且EM13是用RAW操作的，我用JPG能实现1.5倍已经很满足了。自己堆栈有另外一个好处是，可以在RAW编辑软件（LR或者C1）里面对单张照片进行调整，再进行合成。如果在LR或者C1里面调整一张2亿4000万像素的RAW，没有独立显卡的话显示这张照片都得花一分钟。