2020年2月3日月曜日

システムの費用対効果 〈Python AI ニューラルネット - MNIST その4〉

MNIST 認識率 98.8%

前処理なしで二つのニューラルネットの結果を使います。一つ目のニューラルネットで誤答だったデータだけで学習させた二つ目のニューラルネットで正解だったら良しとしました(前回は左右22.5°回転の前処理をしました


epoch 1-17 が1つ目のニューラルネット、それ以降が2つ目のものです




二つ目のニューラルネットの中間層は50セルに強化しました。これまでのブログの通り 7セルでも 9割は判別可能です(システムの投資対効果 〈Python AI ニューラルネット〉) “読み易い数字” であれば7セルで対応可能ですが、残り 1割は悪筆の “読みにくい数字” です。より多くの特徴が必要と考えました。2のような3とか、7のような1とかですね。いろいろやっても悪筆は認識率が下がります。2のような3は、2でよかったということもあります。やはり前後関係、コンテキストから2である、と判断バイアスを掛けるほうがいいのではないでしょうか。

中間層1層では前処理か中間層の並列化が工夫のしどころで、20年以上前のニューラルネットブームでも同じでした。計算機センターではなくノートPCで、  FORTRAN や C ではなく Python で試行錯誤できること、結果をWebに上げられるのは助かりますね。アマチュアでも色んなことができます。それだけ情報技術が当たり前、電卓のようなものになったということでしょうかね。人間が遅れをとらないようにしないといけませんね。ちょっと大変です・・
永島志津夫

全社のシステムを少ない人数で見ていれば時に見落としもあるかもしれません。
オフィスエヌ ショートレビュー5万円から。
連絡先 office.nagasima#gmail.com (#を@に変えてメールをお願い致します