RICOH THETA TECHNOLOGY

创新影像体验,精彩无极限。
RICOH 技术即将开拓未知领域。

使机身更加纤薄的光学技术

超薄双镜头折叠光学技术使机身超乎想象地纤薄。

照相机前部和后部采用超薄超广角镜头,鱼眼镜头以远超 180 度的视角采集光线,并使用两个 90 度的棱镜将光线分配到图像传感器的左侧和右侧,正是这一创新设计创造出了 RICOH THETA 球面图像。

因折叠式鱼眼镜片的对称分布,即使采用双镜头,THETA 也具有纤薄的机身,厚度仅为 17.9 mm(THETA V,不包括镜头部分)。
该设计不仅简洁时尚,镜头之间的距离也更短,产生的视差极小*1。

*1 两个摄像头的不同视角。

超薄的高广角镜头针对球面图形进行专门设计和调整。

统一提高整个图像的清晰度对于以最低程度的视差拼接两张图像、实现完全自然的外观而言十分重要。为此,我们采用了 RICOH 原创投影法。镜头涂层不仅覆盖可见光谱,还覆盖普通相机镜头不可见的红外光谱。因为中心与边缘之间存在波长体征与角度依赖性而定差异,调节鱼眼镜头通常并不容易。然而,尽管存在这一困难,我们也已经成功地在中心和边缘创造统一的颜色,可以获得美丽、自然的图像质量。

产生 360 度图像的图像处理技术

Kiyotaka Kitajima

创建无缝球面图像的流程

1.图像处理

首先,来自两个图像传感器的图像数据用于进行基本图像处理。下一步,除了普通数码相机上执行的基本图像处理之外,对图像进行更多处理以从两个图像传感器获得适当的亮度与颜色。具体来说,对两个图像传感器的个别感光度偏差进行校正,同时根据两个图像数据测得的亮度做出综合决策,为每个图像传感器应用曝光补偿。

2.图像拼接

下一步,为两个图像进行图像拼接。对于每个图像而言,图案匹配计算参考图像与对比图像在每个区域的偏移量,以检测拼接位置。然后,参考检测到的位置和每个光学镜头系统的特点,将两个图像转化成球面图像格式。融合两个球面图像格式的图像,最终形成一张球面图像。通过这种方式,图案匹配检测拼接位置,并将其应用到图像转化参数中,以形成球面图像格式,产生促进两个图像实时拼接的动态拼接过程。

1.图像处理

首先,来自两个图像传感器的图像数据用于进行基本图像处理。下一步,除了普通数码相机上执行的基本图像处理之外,对图像进行更多处理以从两个图像传感器获得适当的亮度与颜色。具体来说,对两个图像传感器的个别感光度偏差进行校正,同时根据两个图像数据测得的亮度做出综合决策,为每个图像传感器应用曝光补偿。

2.图像拼接

下一步,为两个图像进行图像拼接。对于每个图像而言,图案匹配计算参考图像与对比图像在每个区域的偏移量,以检测拼接位置。然后,参考检测到的位置和每个光学镜头系统的特点,将两个图像转化成球面图像格式。融合两个球面图像格式的图像,最终形成一张球面图像。通过这种方式,图案匹配检测拼接位置,并将其应用到图像转化参数中,以形成球面图像格式,产生促进两个图像实时拼接的动态拼接过程。

球面图像

在球面图像中使用墨卡托投影,将坐标分配到球形表面的每个像素位置。
换而言之,若将地球的经度和纬度视作两个坐标轴,地球的表面就是二维的。
用户可以使用专用的应用程序,用手指在图像上进行上下左右拖动更换视角,也可以缩放图像查看整个球面图像。在应用程序中,球面图像映射为球形物体的纹理,通过指定方向与视角,球面图像可以显示为附加在球体上的图形。

链接视频与音频的 360 度空间音频

360 度空间音频是指在 VR 查看器和头戴式耳机上播放时链接的视频和音频。
RICOH THETA V 根据观看者的视角方向,采用两种技术重现声场中的变化,带来更真实的身临其境式 VR 体验。

1.THETA V 空间音频录制 - 高保真立体声音响

1.THETA V 空间音频录制 - 高保真立体声音响

高保真立体声音响是一种三维音频技术,用于从 360 度方向录制空间音频,以[录制/播放]格式重现自然方向性。高保真立体声音响将音频源转化成四种信号,即基带信号 (W)、前/后扩大信号 (X)、左/右扩大信号 (Y)、以及上/下扩大信号 (Z),以重现带有方向性的声场。RICOH THETA V 具备多个内置的全向麦克风,这些麦克风从录制的音频源合成方向,创造出四种 WXYZ 信号。
TA-1 是一种可兼容高保真立体声音响的麦克风,它可将录制的音频源转化成四种 WXYZ 信号。
因为这种方法能够在录制之后环绕整个声场,即使 360 度图像的视角发生变化,声场也可以追踪图像的前/后、左/右、上/下移动,因此可以录制并播放十分接近真实场景的音频。

2.THETA V 空间音频播放 - HRTF(头部相关传输函数)

2.THETA V 空间音频播放 - HRTF(头部相关传输函数)

人们可以通过声音到达耳朵时两只耳朵之间的音量差异和滞后时间分辨音频的传入方向。通过理解这两个因素之间的差异,可以在播放时产生音频源在任意方向移动的感觉。
HRTF 在数学上表示(滤波)以上两个因素作为音频数据的不同特征值。当其与图像中使用三维音频录制的音频源相结合时,音频源可以像 360 度图像随着用户的头部移动一样前/后、左/右、上/下移动。
RICOH THETA V 采用这种技术,而将滤波器应用到录制音频中则可以检测出类似于真实场景的方向感与距离感。
* 因为 HRTF 的数据因个人的头部、身体以及耳朵形状的混响而异,因此每个人的感受可能都不相同。

依靠这两种技术背景,兼容 RICOH THETA V 空间音频文件格式的播放环境可与带头戴式耳机和头部跟踪功能的 HMD 或 VR 查看器进行配对,以伴随着 360 度音频观看 360 度图像,观看者可以产生一种身临其境的感觉,体验真实的视觉及音频 VR。