人工知能(Artificial Intelligence, AI)による画像分類は「教師あり学習」と「教師なし学習」の2つに区分されます。「教師あり学習」は、事前分類(ラベル付け)された画像のテストデータを用いて、データの特徴を学習するプロセスのことをいいます。
一方「教師なし学習」は、ラベル付けされたデータを用いずにデータセット内のパターンを検出し、類似データごとにグループ化する手法です。
「教師あり学習」の例としては、例えば、0から9までの手書き数字の画像を自動分類するものがこれに該当します(Figure1)。
深層学習はデータから自動的に特徴量を抽出する機械学習の一種です。人間の脳を模したニューロンモデルが利用されている点に大きな特徴があります。ニューロンとは、受け取った入力情報をもとに計算を行い、出力された計算結果をまた次のニューロンへと送り計算を繰り返す、ユニットを表します(Figure2)。
深層学習に搭載されたニューラルネットワークは、複数の層に分割されたニューロン群が相互に接続する形で構成されています(Figure3)。ニューロン群には入力層、出力層、隠れ層があり、この隠れ層が複数存在するのがニューラルネットワークの特徴です。
画像が深層学習モデルに入力されると、まず画像の最小単位であるピクセル(画素)に分解されます。その後、隠れ層で画像内のパターン探索を繰り返し、パターン検出の精度を高めていきます。
このパターン検出のプロセスを可視化するとFigure4のようになります。Figure4-aは、1つ目の隠れ層で検出された9つのランダムなパターンを示しています。把握されたパターンは、対角線や色のグラデーションなど、非常に単純なものです。しかし、4つ目の層になると、眼球(Figure4-b)や犬の顔(Figure4-c)など、より複雑なパターンが検出されるようになります。
深層学習はデータが揃えばあらゆる種類の画像に対して解析を行うことが可能です。したがって、深層学習を用いた画像分類は多くの分野での応用が期待できます。
医療分野におけるよく知られた例として、ある皮膚病変が癌であるかどうかの判定や、糖尿病性網膜症の診断支援などが挙げられます。CarbGeMではこれら画像分類技術の可能性に期待し、医療関係者と協力して医療への応用に取り組んでいます。現在取り組んでいるプロジェクトでは、深層学習アルゴリズムを活用してグラム染色画像から細菌感染症の菌種推定を行うことに成功しました。この技術をもとに、世界中の医師が迅速かつ容易に細菌感染症を診断できる診断支援モバイルアプリを開発し(Figure5)、世界中で拡大する薬剤耐性問題の解決に貢献することを目指しています。