数字图像取证 - 基于像素的取证 3

Posted on Thu 25 February 2021 in Digital Image Forensics • 1 min read

缩略图

在JPEG文件格式中, 会在头部嵌入经过滤波，对比度调整，压缩的缩略图.这些特定的操作就导致了不同的相机厂商或软件厂商的细微差异。设一个原图为$f(x, y)$，那么一个图像经过下面6步骤进行制作

裁剪/填充
预滤波
降采样
对比度
亮度调整
JEPG压缩

裁剪/填充

当缩略图与原图的分辨率比例不相同时, 需要对图像进行裁剪/填充处理. 这一阶段会产生四个参数$c_l, c_r, c_t, c_b$分别表示左右上下的裁剪/填充系数

抽象预滤波, 降采样, 对比度以及亮度调整

完成裁剪/填充操作后, 后续的四个操作可以将其抽象为一组模型

$$ t(x, y) = \alpha(D\{\hat{f}(x, y) * h_1(x, y)\} * h_2(x, y)) + \beta $$

其中$t(x, y)$是缩略图,$D$表示降采样操作, $h_1$为预滤波, $h_2$为后滤波(可选, 一般用于锐化处理), $*$为卷积, $\alpha, \beta$则是对比度系数以及亮度系数.为了简化模型, 做出如下假设

预滤波器为圆对称高斯模型, $exp(-(x^2 + y^2)/\theta^2), 其中$\theta$为宽度.
预滤波器是单元和.
后滤波器的大小为3x3.
后滤波器是对称的, 即$(h_2(x, y) = h_2(-x, y),h_2(x, y) = h_2(x, -y))$. 产生如下形式的滤波器(a b a; b c b; a b a)
后滤波器也是单元和, 约束$c = 1 - (4a + 4b)

在以上的约束下, 缩略图模型将会产生11个参数, 2个缩略图尺寸参数, 4个填充/裁剪参数, 1个预滤波参数$\theta$, 2个后滤波参数$a, b$以及对比度参数$\alpha$和亮度参数$\beta$. 考虑到JPEG图像格式的特有参数128个, 即2个8x8的对亮度以及色彩通道的量化表. 故对于一个Jpeg文件总共可以产生139个参数对其进行描述.

求解剪切/填充参数

缩略图处理流程中剪切/填充的边界正相关于全尺寸图像的分辨率(已知), 但具体的比例仍然需要估算. 首先设定一个初始的符合分辨率比例关系的初始缩略图$\hat{f}_0(x, y)$. 故初始缩率图可以被建模为

$$ \hat{t}_0(x, y) = D\{\hat{f}(x, y)\} $$

其中$\hat{f}_0(x, y)$为原始图像, D为降采样操作, 其比例为$max(N_x/n_x, N_y/n_y)$, $(N_x, N_y)$以及$(n_x, n_y)$为图像和缩略图的尺寸. 随后初始缩率图经过各项异性(各个维度变换系数不相同)的缩放(scaling)和变换(translation)得到提取出的缩略图$t(x, y)$

$$ t(x, y) = \hat{t}(s_xx + \delta_x, s_yy + \delta_y) $$

其中$(s_xx, s_yy), (\delta_x, \delta_y)$分别为缩放和变换系数. 在灰度图上基于粗粒度至细粒度的差分匹配算法(coarse-to-fine differential registration)求解上述参数

求解滤波器以及对比度和亮度参数

求解各滤波器以及对比度和亮度参数, 可以通过减少真实图像与预估图像之间的误差进行求解. 即

$$ E_1(h_1, h_2) = \sum_{x, y}[t(x, y) - \alpha(D\{\hat{f}(x, y) * h_1(x, y)\} * h_2(x, y)) - \beta]^2 $$

但上述公式仅根据预滤波和后滤波得出, 无法求解对比度以及亮度. 故对于亮度与对比度系数, 给定滤波器的参数, 定义误差函数为

$$ E_2(\alpha, \beta) = \sum_{x, y}[t(x, y) - \alpha(D\{\hat{t}_h(x, y) + \beta)]^2 $$

其中$\hat{t}_h(x, y) = D\{\hat{f}(x, y) * h_1(x, y)\} * h_2(x, y))$ 利用最小二乘法即可$E_2$进行求解. 对于$E_1$则需要使用暴力搜索求解最小值, 或使用Nelder-Mead 最小化算法加速求解过程. 在实验中, 作者发现求解$E_1$时在傅里叶域中效果会更好, 即最小化

$$ E_1(h_1, h_2) = \sum_{\omega_x, \omega_y}[||T(\omega_x, \omega_y)|| - ||\hat{T}(\omega_x, \omega_y)||]^2 $$

其中$T(\cdot)$表示傅里叶变换后的真实缩率图$t(\cdot)$,$\hat{T}(\cdot)$表示傅里叶变换后的预估缩率图$D\{\hat{f}(x, y) * h_1(x, y)\} * h_2(x, y))$, $||\cdot||$表示傅里叶变换的量级. 由于经过$ t(x, y) = \hat{t}(s_xx + \delta_x, s_yy + \delta_y)$的初始校准, 低频特征时十分均衡的, 故该损失函数在高频特征上进行计算

最后是, 128个量化表系数可以直接从量化表中获取.

参考文档

1.E. Kee and H. Farid. Digital image authentication from thumbnails. In SPIE Symposium on Electronic Imaging, San Jose, CA, 2010.

Previous Post Next Post