機械学習/ディープニューラルネットワーク

畳み込みニューラルネットワーク

画像超解像とは,画素数の少ない画像 (低解像度画像) から高周波成分が復元された画素数の多い画像 (高解像度画像) を生成する技術である.

例えば,犯罪捜査においては,防犯カメラなどに写った人物や車の拡大が求められることがある.他にも,生物学分野においては,顕微鏡画像に対して超解像を行い,従来の約 10 倍の拡大率で高精細な画像を生成することに成功している.いずれの分野においても画像超解像では,単に画素数を増やすだけではなく,高周波成分が復元された鮮明な画像を生成することが求められる.

単一画像のみからの超解像は,解が一意に定まらない劣決定逆問題である.画素数を増やす簡単な方法として,最近傍補間,双線形補間,双三次補間などの代数的補間法を用いることが考えられる.これらの手法は非常に高速ではあるが,最近傍補間と双線形補間では高周波成分が全く復元されず,双三次補間でも高周波成分が十分に復元されないため,超解像結果(超解像画像と呼ぶ) が鮮明でないという問題がある.

低解像度画像から失われた高周波成分を精度よく復元するために,大量の低解像度画像と高解像度画像の組からなる学習データを利用する手法が提案されている.Yang らは,学習データを用いて辞書学習を行う超解像手法を提案した.更に,Elad により,この手法における辞書学習アルゴリズムの改良も提案されている.これらの手法では,代数的補間法に比べて鮮明な超解像画像が得られるが,辞書学習と画像生成にかかる時間がどちらも長いという欠点がある….


馬場 敦之, 片岡 秀公, 北原 大地, 平林 晃,

直交射影層を用いた畳み込みニューラルネットワークによる画像超解像,”

電子情報通信学会信号処理研究会, 石垣, Mar. 2018, vol. 117, no. 516, pp. 347–352.

[Image Processing, Machine Learning] official access / pdf (preprint)


松浦 功一郎, 平林 晃, 北原 大地,

マルチトラック楽曲におけるGANを用いた大楽節の自動生成,”

日本音響学会2019年秋季研究発表会, 草津, Sep. 2019, pp. 1147–1150.

[Audio Signal Processing, Machine Learning] pdf


K. Yoshimoto, H. Kuroda, D. Kitahara, and A. Hirabayashi,

Deep neural network modeling of distortion stomp box using spectral features,”

Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), Auckland, New Zealand, Dec. 2020, pp. 339–345.

[Audio Signal Processing, Machine Learning] official access / pdf (preprint)