01 / PATCH EXTRACTION
看一个 \(f_1\times f_1\) LR patch
SC:抽 patch,再投影到 LR dictionary 得到 \(n_1\) 个响应。
SRCNN:第一层 \(9\times9\) Conv 产生 64 张 feature maps。
02 / NON-LINEAR MAPPING
\(n_1\rightarrow n_2\):稀疏求解器
传统 SC 每个 patch 都要现场求:
$$\alpha^*=\arg\min_\alpha \lVert D_l\alpha-y\rVert_2^2+\lambda\lVert\alpha\rVert_1$$
SRCNN:用 \(1\times1\) Conv + ReLU 直接前馈近似这个非线性映射。
03 / RECONSTRUCTION
\(f_3\times f_3\) neighbouring patches
一个输出红点会被多个重叠 HR patch 同时预测;SC 最后做 HR dictionary projection + averaging。
SRCNN:第三层 \(5\times5\) Conv 学会如何融合邻域预测。
Fig. 3 的作用:SC 的 patch 提取、稀疏求解、HR 重建和重叠平均,都能被卷积层吸收。
→
SRCNN 进一步把这些模块变成 \(W_1,W_2,W_3\),端到端一起训练。
$$Y\rightarrow F_1(Y)\rightarrow F_2(Y)\rightarrow F(Y)$$
$$\hat X(i,j)=W_3\cdot\mathrm{vec}(N_{5\times5}(F_2,i,j))+B_3$$