中間層7セルのニューラルネットで MNIST 認識率 96% まで来ました。前処理に左右 22.5° の回転を入れたのですが、これが効きました(前回はこちら)。
種明かしです。MNISTの画像を見ていたら、左右上下のブレよりも回転のブレのほうが目立っていたのです。45°まで回転させると別物になってしまうのでその半分にしました。トレーニングデータを左右22.5度ずつインフレートさせる考え方もあるのですが、トレーニングデータにならなくなること(悪筆化)を考えて、テスト時に0°、左22.5°、右22.5°で結果を出し、どれか正解があれば良しとしました。
プリミティブな仮説検証でしたが、この路線で進むのであれば、トレーニングデータを精製し、テスト時によりバリエーションの多い前処理を行い正解を探すことになるでしょう。さらに次の段階となると、コンテキスト、前後関係から正解候補のバイアスをかけることになります。構造化された知識情報システムの一部、一次情報の認識エンジンとしてのニューラルネットという扱いです。実用性も高く、仕組みとしても面白そうですね・・・と、ここまで書いて昔の記憶が蘇ります。お気づきの方もいるかもしれません。第五世代コンピュータ、30年前のニューラルネット・ブームもここで壁にぶつかりました。一次情報の分節化、知識表現と記憶、推論、仮説など、ここからが本当のAIです。実用化までに必要な費用、時間は桁違いと見てください。1年、2年ではありません。¥1億、¥2億でもありません。
永島志津夫
全社のシステムを少ない人数で見ていれば時に見落としもあるかもしれません。
オフィスエヌ ショートレビュー5万円から。
連絡先 office.nagasima#gmail.com (#を@に変えてメールをお願い致します)