数字图像取证 - 基于像素的取证 3

Posted on Thu 25 February 2021 in Digital Image Forensics • 1 min read

缩略图

在JPEG文件格式中, 会在头部嵌入经过滤波,对比度调整,压缩的缩略图.这 些特定的操作就导致了不同的相机厂商或软件厂商的细微差异。 设一个原图为\(f(x, y)\),那么一个图像经过下面6步骤进行制作

  1. 裁剪/填充
  2. 预滤波
  3. 降采样
  4. 对比度
  5. 亮度调整
  6. JEPG压缩

裁剪/填充

当缩略图与原图的分辨率比例不相同时, 需要对图像进行裁剪/填充处理. 这一阶段会产生四个参数\(c_l, c_r, c_t, c_b\)分别表示左右上下的裁剪/填充系数

抽象预滤波, 降采样, 对比度以及亮度调整

完成裁剪/填充操作后, 后续的四个操作可以将其抽象为一组模型

$$ t(x, y) = \alpha(D\{\hat{f}(x, y) * h_1(x, y)\} * h_2(x, y)) + \beta $$

其中\(t(x, y)\)是缩略图,\(D\)表示降采样操作, \(h_1\)为预滤波, \(h_2\)为后滤波(可选, 一般用于锐化处理), \(*\)为卷积, \(\alpha, \beta\)则是对比度系数以及亮度系数.为了简化模型, 做出如下假设

  1. 预滤波器为圆对称高斯模型, \(exp(-(x^2 + y^2)/\theta^2), 其中\)\theta$为宽度.
  2. 预滤波器是单元和.
  3. 后滤波器的大小为3x3.
  4. 后滤波器是对称的, 即\((h_2(x, y) = h_2(-x, y),h_2(x, y) = h_2(x, -y))\). 产生如下形式的滤波器(a b a; b c b; a b a)
  5. 后滤波器也是单元和, 约束$c = 1 - (4a + 4b)

在以上的约束下, 缩略图模型将会产生11个参数, 2个缩略图尺寸参数, 4个填充/裁剪参数, 1个预滤波参数\(\theta\), 2个后滤波参数\(a, b\)以及对比度参数\(\alpha\)和亮度参数\(\beta\). 考虑到JPEG图像格式的特有参数128个, 即2个8x8的对亮度以及色彩通道的量化表. 故对于一个Jpeg文件总共可以产生139个参数对其进行描述.

求解剪切/填充参数

缩略图处理流程中剪切/填充的边界正相关于全尺寸图像的分辨率(已知), 但具体的比例仍然需要估算. 首先设定一个初始的符合分辨率比例关系的初始缩略图\(\hat{f}_0(x, y)\). 故初始缩率图可以被建模为

$$ \hat{t}_0(x, y) = D\{\hat{f}(x, y)\} $$

其中\(\hat{f}_0(x, y)\)为原始图像, D为降采样操作, 其比例为\(max(N_x/n_x, N_y/n_y)\), \((N_x, N_y)\)以及\((n_x, n_y)\)为图像和缩略图的尺寸. 随后初始缩率图经过各项异性(各个维度变换系数不相同)的缩放(scaling)和变换(translation)得到提取出的缩略图\(t(x, y)\)

$$ t(x, y) = \hat{t}(s_xx + \delta_x, s_yy + \delta_y) $$

其中\((s_xx, s_yy), (\delta_x, \delta_y)\)分别为缩放和变换系数. 在灰度图上基于粗粒度至细粒度的差分匹配算法(coarse-to-fine differential registration)求解上述参数

求解滤波器以及对比度和亮度参数

求解各滤波器以及对比度和亮度参数, 可以通过减少真实图像与预估图像之间的误差进行求解. 即

$$ E_1(h_1, h_2) = \sum_{x, y}[t(x, y) - \alpha(D\{\hat{f}(x, y) * h_1(x, y)\} * h_2(x, y)) - \beta]^2 $$

但上述公式仅根据预滤波和后滤波得出, 无法求解对比度以及亮度. 故对于亮度与对比度系数, 给定滤波器的参数, 定义误差函数为

$$ E_2(\alpha, \beta) = \sum_{x, y}[t(x, y) - \alpha(D\{\hat{t}_h(x, y) + \beta)]^2 $$

其中\(\hat{t}_h(x, y) = D\{\hat{f}(x, y) * h_1(x, y)\} * h_2(x, y))\) 利用最小二乘法即可\(E_2\)进行求解. 对于\(E_1\)则需要使用暴力搜索求解最小值, 或使用Nelder-Mead 最小化算法加速求解过程. 在实验中, 作者发现求解\(E_1\)时在傅里叶域中效果会更好, 即最小化

$$ E_1(h_1, h_2) = \sum_{\omega_x, \omega_y}[||T(\omega_x, \omega_y)|| - ||\hat{T}(\omega_x, \omega_y)||]^2 $$

其中\(T(\cdot)\)表示傅里叶变换后的真实缩率图\(t(\cdot)\),\(\hat{T}(\cdot)\)表示傅里叶变换后的预估缩率图\(D\{\hat{f}(x, y) * h_1(x, y)\} * h_2(x, y))\), \(||\cdot||\)表示傅里叶变换的量级. 由于经过\( t(x, y) = \hat{t}(s_xx + \delta_x, s_yy + \delta_y)\)的初始校准, 低频特征时十分均衡的, 故该损失函数在高频特征上进行计算

最后是, 128个量化表系数可以直接从量化表中获取.

参考文档

1.E. Kee and H. Farid. Digital image authentication from thumbnails. In SPIE Symposium on Electronic Imaging, San Jose, CA, 2010.