AI技術のひとつ、画像処理とは?

この記事では、AI(人工知能)で使われる技術のひとつである、画像認識について解説します。画像認識とは、たとえば、AIが猫の写真を見たときに、犬でも狐でもなく「猫」と言い当てられる仕組みのことです。

AI(人工知能)が開発されるまで、コンピュータは猫の写真に猫が映っていることを認識することはできませんでした。顔が毛むくじゃらで、頭の上に耳がついていて、4本足で歩く小型動物は、猫以外にもいるからです。
しかし、AIを搭載したコンピュータは、大量のさまざまな種類の動物の写真のなかから、猫の写真だけを選ぶことができます。これは、AIに画像認識技術が搭載されているからです。この記事では、画像認識技術の基礎知識を紹介しますので、参考にしてください。

画像認識とは静止画や動画上の物体を識別すること

AI技術のひとつ「画像認識」とは、静止画や動画に物体が映っていることを認識し、その物体が「何であるか」を認知することです。
たとえば、公園の写真を画像認識機能のあるAIコンピュータに読み込ませると、コンピュータは「男の子2人と女の子3人、滑り台と砂場とチューリップと青空と雲が映っている」と判別します。

この説明だけ聞くと「コンピュータならそれくらいできて当然だ」と感じるかもしれませんが、画像認識は、AI以前には不可能で、AIの登場によってようやく可能になりました。画像認識には、以下2つの壁があります。

1.画像に映っている物体の区別が難しい

1つ目の壁は、画像に映っている物体の区別です。人の目や脳にとって、画像のなかの物体の認識は簡単なことです。それは、物体に「輪郭」をつけて、その他の物体と区別することができるからです。実際の物体には輪郭はついていませんが、脳が画像処理するときに輪郭をつけています。
しかし、画像認識技術が搭載されていない非AIコンピュータは、輪郭をつけることができないので、物体と物体の境目がわかりません。そのため、画像のなかの物体を認識できないのです。

2.画像に映っているものが「何なのか」わからない

画像のなかの複数の物体をひとつずつ切り分けることができても、非AIコンピュータでは、それが「何なのか」がわかりません。これがふたつ目の壁です。
非AIコンピュータでも、「2足歩行しているのが人で、4本の足で歩いているのが猫」と教えれば、人と猫の写真であれば見分けがつくかもしれません。しかし、立ち上がったゴリラと立っている人間の区別はつきませんし、猫と犬も区別できないでしょう。
このふたつの壁を、画像認識技術はどのように乗り越えたのでしょうか。次の項目で詳しく説明します。

画像認識技術の仕組みを2つのポイントで解説

ここでは、画像認識技術の仕組みを2つのポイントで紹介します。

1.輪郭づけの壁は画像処理で乗り越える

画像認識技術では、ひとつ目の壁である「輪郭づけ」を画像処理で乗り越えました。コンピュータにとって画像とは点の集合です。「絵=点の集り」という理解は、静止画でも動画でも、AIコンピュータでも非AIコンピュータでも同じです。

そのため、画像上のある物体を他の物体と区別するには、「点の集合体」をひとつの物体として認識できなければなりません。画像処理では、イレギュラーな点や歪んだ点を排除して、物体の明るさや色合いを調整して、ある物体を別の物体と切り離します。

2.「何なのか」の壁は大量の写真を学習して乗り越える

画像上の物体を認識できたら、次はふたつ目の壁である「その物体が何なのか」を乗り越えなければなりません。

AIコンピュータに大量の猫の写真を見せると、そのうち猫の特徴をつかめるようになります。すると、AIにまったく別の猫の写真を見せても、AIは「猫」と正答できるようになります。正答したら、AIに「報酬」を与えます。

さらに、AIに犬の写真を見せて「猫」と答えたり、猫の写真を見せているのに「猫ではない」と答えたりしたら「罰」を与えます。報酬と罰によって、AIは「なぜ正答できたのか」と「なぜ間違ったのか」を学習していきます。これを「強化学習」といいます。強化学習を繰り返すと、ほぼ100%、「その物体が何なのか」を言い当てられるようになります。

画像認識技術によってAIの可能性は大きく広がった!

画像認識技術は、AIの可能性を格段に広げました。
たとえば、画像認識技術を搭載したAI監視カメラを空港に設置すれば、事前にテロリストの顔写真を読み込ませることで、群衆のなかから容疑者を見つけることができます。最近のAI監視カメラは、サングラスやマスクをしていても人物を特定します。

過疎地の鉄道駅の構内にAI監視カメラを設置すれば、無人でも安全に運営することができます。なぜならAI監視カメラは、腹痛でうずくまっている人と、靴ひもを結び直すために腰をかがめている人を区別できるからです。

工場では人による目視検査を画像認識技術に置き換えることができます。
非AIコンピュータでも、製品の微小な傷を見つけることはできますが、画像認識技術を搭載したAIコンピュータなら、「縦方向の傷なら合格とするが、横方向の傷は不合格にする」といった「人によるさじ加減」を再現できます。

医療現場でも画像認識技術は活躍しています。CT画像から、ベテラン医師でも見逃してしまうような微小ガンを見つけることができるのです。

画像処理技術を搭載したAIコンピュータはあるものもないものも見つける

画像認識技術はいわば「ものすごい能力の目」です。その活用法は無限にあるといっても過言ではありません。

そして「見つける力」は、「見落とさない能力」でもあります。人の「見る力」は、存在するものを視認することは得意ですが、ないものを認識するのは苦手です。存在していたときの記憶が必要だからです。しかし、人の記憶には限界があります。画像認識技術を搭載したAIコンピュータは忘れることはないので、「存在しないこと」もしっかり見つけます。