人工知能を作る準備をする
人工知能を作るために使用するPythonのライブラリをインストールします。
scikit-learn:機械学習のライブラリ
scipy:科学計算のライブラリ
numpy:数値計算のライブラリ
matplotpb:グラフ表示のライブラリ
ここではWindowsのコマンドプロンプトを使いインストールする方法について説明します。
それぞれ下記のように入力します。
他にもWindowsにwheel形式でインストールする方法もあります。またmacOSにインストールする方法について詳しくは下記の著書に掲載してますので、ぜひご購入してみてください。
「手書きの数字を認識するアプリ」を作る。
(「教師あり学習」にて)
「教師あり学習」とは「問題と答えのペア」をたくさんコンピュータに与えて特徴を学習させる方法。文字認識や音声認識、翻訳などで使われる。
「教師なし学習」とは答えのないたくさんのデータを調べ、似たデータをまとめて特徴を抽出したり、グループ分けをしたりします。
「強化学習」とはいろいろコンピューターに試行錯誤させて、よい結果が出た時に「報酬」を与えて強化していく方法です。ロボット制御や将棋、囲碁などで使われます。
sklearnのデータを確認する
コンピューターに学習させるためには大量のデータが必要となってきます。sklearnにはテスト用のデータがあるので今回はこれを活用します。どんなデータが入っているのかを確認してみましょう。
ファイル名を「sklearn.py」のように一行目の「import sklearn.datasets」と一緒の名前にするとエラーになるので気をつけてください。
出力結果
データの個数を見てみると1797個入っているようです。
この画像データは8×8の数値のリストとなっており、濃淡を数値で表しています。0が一番明るい白で、16が一番暗い黒です。
つまり、このデータは数字の0を表していることになります。
それでは次にこの数値リストを青色の濃淡を使って画像化してみます。matplotlibを使って表示させてみます。
出力結果
さっきは1つのデータを見てみましたが、他のデータはどうなっているか確認してみましょう。
たくさんのデータを繰り返し表示するのでfor文を使います。とりあえず30個をみてみましょう。
出力結果
このような数字がsklearnに1797個も用意されているようです。