コンピュータがパターン認識を行う
手書き数字認識
自由に筆記された手書き数字を計算機で,できれば人間以上に,高精度に認識してみようという研究です。まず,0から9の文字を形作っている線分の傾きや曲がり具合が文字ごとにどう違うかを,沢山の文字データを利用して計算機に学習させます。その後で新しい文字パターンを計算機に示すと,0から9のどの文字らしいかの確率を計算して,その確率が最大となる文字を認識結果とします。
情景内濃淡文字の抽出
私たちの身の回りを見渡すといろいろな文字が目から飛び込んできます。それらは雑音に埋もれていたり,途切れていたり,複雑なデザインが背景にあったりします。しかし,人間は容易に認識できます。これを計算機で行わせるため,様々な画像処理フィルタをいろいろ組み合せて適用し,文字部分をくっきり浮き上がらせるという研究です。遺伝的アルゴリズムを用いて最適な組み合わせを効率的に探索しています。
情景内カラー文字の認識
街中へ出て目にする様々なカラー文字が計算機で認識できれば,正にロボットの目として大活躍することになります。本研究では,まず,文字を含む領域を検出してから,文字と背景を色情報に着目して分離します。次に,かすれ/つぶれや雑音による劣化を含み,さらにいろいろな字体により形が異なる文字を,雑音や変形に強いマッチング法を用いて認識します。現状の認識率は80%を越えたところで,まだまだこれからです。
顔領域の検出
画像や映像中から人を計算機で自動検出できれば,監視システムとして様々な用途が考えられます。この研究では,肌色に着目して,顔領域の検出を行います。まず,肌色と非肌色の違いをたくさんのサンプルデータにより神経回路モデルで学習して,肌色画素が集まった領域を顔候補として抽出します。次に,肌色領域の形や面積,さらに目らしきものの位置を調べて,顔領域であるかどうかの最終判定を行っています。
顔領域の正規化・認識
画像や映像中に現れる顔領域は,正面顔であっても傾きや大きさが様々です。本研究では,まず,目・鼻・口といった顔の主要パーツの位置を検出して,その位置関係を用いて顔領域の向きと大きさが一定になるようにそろえます。次に,個人ごとの顔の特徴の分布を顔画像に特有な表現空間の中で調べることにより,誰の顔であるかを確率的な信頼度に基づいて判定しています。部分的な隠れや横顔にも対応するのが今後の課題です。
指紋画像の修復とずらしマッチング
コンピュータネットワーク社会におけるセキュリティ確保や犯罪防止のため,指紋のような身体特徴を用いた個人認証は緊急の技術課題です。本研究では,まず,乾燥指やかすれ/つぶれにより劣化した指紋画像を修復して,指紋隆線(凹凸による縞模様)をくっきりさせます。次に,2枚の指紋画像が同一の指紋かどうか判定するための前段処理として,縦および横方向のずらしマッチングによりおおまかな位置合わせを行います。
指紋画像の高精度マッチング
指紋画像を採取する際の指の置き方や力の入れ具合で,指の向きが回転することや画像が大きく歪むことがあります。まず,こうした回転・伸縮・歪みの変形を吸収する強力なマッチング手法を適用しています。さらに,微細な指紋形状の違いを調べるために,指紋の渦を中心とする複数の観測窓を設けて,それらを細かく動かして正確な照合が取れるか判定します。他人受理率および本人拒否率を1%以下にするのが目標です。