画像認識技術を用いたシステム開発

この記事では、AI(人工知能)の画像認識技術を用いたシステム開発について解説します。AIが猫の画像を「猫」と認識できるのは「猫モデル」を持っているからです。モデルの精度を高めると、医師が見落とすような微細な肺がんも発見できるようになります。

AI(人工知能)はすっかり身近な存在になりました。AIを搭載した監視カメラは、人も物体も「それがそれであること」を認識します。この機能を自動車に搭載すると、自動車が安全を確保できるようになるので、自動走行が可能になります。

AIがこのような芸当をこなせるのは、「画像認識技術」が搭載されているからです。画像認識技術は人々の生活を変えようとしていて、今現在も進化を続けています。そこで今回は、画像認識技術を用いたシステム開発について解説します。

画像認識技術のシステム開発における3つのポイント

画像認識技術とは、画像データから顔や文字などの対象物を抽出して、その形や大きさ、数、明暗、色などの特徴を分析して識別する技術です。

ポイントは、1)対象物の抽出、2)特徴の分析、3)対象物の識別の3点です。

画像上に物体が映っていることを認識して、物体の特徴を洗い出し、対象物が「何であるか」を言い当てることができるわけです。この3つの作業を実行させることが、画像認識技術のシステム開発になります。

画像認識技術の目的は画像データを整理して有効活用すること

画像認識技術の目的のひとつは、画像データの整理と、画像データの利活用です。画像認識技術が存在しなければ、大量の画像データが保存されているサーバーは、単なる写真アルバムにすぎません。画像認識技術が存在することで、大量の画像データの一つひとつに、どのような情報が映っているかがわかります。画像データの内容を整理できると、画像データを使いやすくなるでしょう。

アットランダムに撮影した静止画や動画も、画像認識技術を使えば、有力な情報になります。似通った複数の画像の微妙な違いも、画像認識技術は見落とさないからです。

画像認識の精度を高めるためにはモデル作成が重要

画像認識の精度を高めるには、モデルが重要です。

たとえば、AIに「椅子を認識させたい」と考えたとします。しかし、事務所にある椅子と、高級ホテルのラウンジにあるソファと、公民館のパイプ椅子では、まったく形状が異なります。パイプ椅子に至っては、座るときの状態と、畳んで倉庫にしまっている状態では、外観がまったく異なります。

AIに椅子を認識させるには、ありとあらゆる椅子の画像を用意して、AIに「これが椅子である、これも椅子である」と学習させなければなりません。この「ありとあらゆる椅子の画像」がモデルになるわけです。

人が、事務所の椅子も高級ソファアもパイプ椅子も「椅子」と認識できるのは、それらのすべてに、人が座れるという特徴があることを知っているからです。画像認識技術を搭載したAIも、人と同じように特徴をつかんでいきます。

AIをレベルアップさせるにはモデル精度の向上が必要

AIを「使えるAI」にするには、モデルの精度を向上させなければなりません。

たとえば、肺のCT画像から肺がんを見つける画像認識AIを作ることになったとします。この肺がんAIが、肺がんが映っているCT画像に対して「がんがない」と判定したら、その患者は死亡リスクが高まってしまいます。

さらに、肺がんが映っていないCT画像に対して「がんがある」と判定したら、この患者は精密検査を受けなければならず、医療コストが膨らんでしまいます。しかも精密検査で「がんがない」ことがわかるまで、この患者は精神的な苦痛を味わうことになります。

このように、「あるのにない」と判定したり「ないのにある」と判定したりしてしまうことは、画像認識技術にとって致命傷になりかねません。モデルの精度が重要になるのはそのためです。

AIによる画像認識技術の活用例

画像認識技術は、すでにさまざまなシーンで活用されています。注目されているもののひとつは、自動運転車ではないでしょうか。

自動運転車の開発ではすでに、「どれだけ人間のドライバーに近づくことができるか」は終わりに近づいています。今の自動運転車の開発陣は「ベテランドライバーよりはるかに安全に走行できる方法」を研究しています。

画像認識技術が発達したことで、数百メートル先にある危険も検知できるようになりました。しかも、その数百メートルというのは「360度」であり「上下」であり、しかも「360度と上下を同時に」監視しています。1人の人間では、運転しながらここまでの周囲監視はできません。

画像認識技術を搭載したAIは、医療業界や自動車業界以外にも、工場の製品検査や、無人コンビニ、大規模スタジアムの顔認証ゲートなどでも使われています。

画像認識技術のメリットは情報を大づかみできること

画像認識技術のメリットは、情報を大づかみできることです。情報は今や、人・モノ・カネに次ぐ第4の経営資源と考えられています。企業やビジネスパーソンが競争力を獲得しようとすれば、とにかく大量の情報を手に入れる必要があります。

画像には、音声や文字や臭いにはない情報が大量に含まれています。「百聞は一見に如かず」ということわざのとおり、見聞きする情報の100倍の情報が、画像に含まれているといえるでしょう。

画像認識技術を使えば、画像から大量の情報を抽出するだけでなく、ユーザーが使いやすいように情報を整理できます。画像認識技術を搭載したAIが社会を変える、と言われているのは、決して大げさなことではありません。