2020年2月5日水曜日

システムの費用対効果 〈Python AI ニューラルネット - MNIST その5〉

深層学習 Chainer で試してみました。中間層50セルが二層で、結果は97%


トレーニングデータの正解率は99.7%なのですが、テストデータは97%台でした。99%を超えるネットワークもあるようですが、中間層のアフィン変換、ノイズリダクションなどの前処理が効いているのでしょうか。単純に中間層を増やしてもテストデータの正解率はあまり上がりません。多層化が認識の本筋ではないことを示唆しています。

文字認識ではビットマップ認識(書かれた結果のみを追う)とモーション認識(手書きのプロセスを動的に追う)の2系統があり、綴り情報が複雑にはなるのですがモーション認識の方が正解率は高くなります。日本語ではこれが顕著に出ます。文字や音声など人が発する情報の場合、認識は行動(運動)を推測する側面があります。 “1と書こうとしたのかな” と推測するのですね。

当事者の考えとして興味深いものがありました。 「ディープラーニングを用いた自然言語処理の今と、ビジネス面でのネガティブな事実」 株式会社Preferred Networksの海野裕也氏のお話しです。機械翻訳ですが、量、スピードが課題精度が落ちてもいいのでお金を払う、というシーンであれば機械学習がビジネスとして成立するとお話しされています。その通りですね。コンピュータは賢くありません、人間は優秀です。ただそれでは量、スピードが追いつかず大きな課題になっているというシーン。課題解決の効果指標は費用対効果、投資対効果で、不便になること、スイッチングコストを加味して、一般に投資対効果は10倍最低でも3倍はないと GO されません。それくらい大きな課題であればコンピュータ化する価値ありということです。

億単位、なかには100億円単位の投資をした会社もあるようですが、多層化ばかりに投資したのではなければ良いと思います。
永島志津夫

全社のシステムを少ない人数で見ていれば時に見落としもあるかもしれません。
オフィスエヌ ショートレビュー5万円から。
連絡先 office.nagasima#gmail.com (#を@に変えてメールをお願い致します