· 👁 …
画像は、2次元の信号だ ── 回路で知っている道具が、そのまま効く
DCTはフーリエのいとこ、JPEGの圧縮はローパスフィルタ、ぼかしは畳み込み=回路の応答、モアレはエイリアシング。画像を「絵」でなく「2次元の信号」と見た瞬間、信号や回路の道具箱が、そっくりそのまま使えるようになる。
画像処理、と聞くと身構える人がいる。でも、ひとつ見方を変えるだけで、急に親しくなることがある ── 画像を「絵」だと思うのをやめて、「2次元の信号」だと思う。それだけで、回路や電波で使っている頭が、そっくりそのまま効きはじめる。
きっかけは、知人とJPEGの話をしていて、「画像処理って、電気回路みたいなところが多いんだね」と言われたことだった。まさにそうなんだ。むしろ、底は同じものだと言っていい。橋を何本か並べてみる。
- DCT(離散コサイン変換)は、フーリエ変換のいとこ。 画像の小さなブロックを「縞模様の波」の重ね合わせに開く操作で、やっていることは時間信号を周波数に分けるのと同じ。横軸が時間か空間か、の違いだけだ。
- JPEGの圧縮は、ローパスフィルタ。 8×8ブロックを波に分けて、細かい波(高い空間周波数)から削って捨てる。これは高域を落とすこと、つまりローパス。RCローパスやアンチエイリアスと、心はまったく同じだ。人の目が高周波に鈍いのを使って、見えないところを削っている。
- ぼかしやエッジ検出(畳み込み)は、フィルタ。 カーネルはインパルス応答で、画像と畳み込むのは、信号にフィルタを通すのと同じ計算。回路のステップ応答を思い浮かべればいい。ぼかしはローパス、エッジ検出(差分)はハイパス、という対応まできれいに付く。
- モアレは、エイリアシング。 細かい模様を粗くサンプルすると、ありもしない縞や渦が湧く。これはサンプリング定理を破ったときの折り返し雑音、そのものだ。
こう並べると、画像処理は「2次元に拡張した信号処理」だと分かる。1次元で知っている定理 ── フーリエ、フィルタ、サンプリング、たたみ込み ── が、軸が一本増えただけで、ほとんどそのまま持ち込める。だから、回路や信号をやってきた人にとって、画像は実は アウェイじゃなくてホームグラウンド なんだ。
JPEGを開けるラボ の「中の計算を見る」で、写真の好きな場所をタップすると、その8×8ブロックの周波数分解(DCT)が見える。なだらかな空を選べば高周波はほぼ0、鋭い縁を選べば高周波が立つ ── そして量子化で、それが削られていく。「画像=2次元の信号」を、場所を選んで手で確かめられる。
見た目のまるで違う分野が、底でつながっていた ── 私は、こういう瞬間がいちばん好きだ。新しい道具を覚えるより、すでに持っている道具が思わぬ場所で効く、と気づくほうが、ずっと遠くまで連れていってくれる気がする。
— ランキン
コメント
まだコメントはないよ。最初のひとことをどうぞ。