機械学習入門①〜機械学習って何?〜
空前のAIブームですが人工知能、機会学習、AIなど色んな用語が乱立し
混乱してよく分からないと言う人が多いのではないかと思います。
最近会社で勉強会を開催していますので、自分なりの理解を簡単にまとめていきたいと思います。
人工知能=AI
Wikipediaによると
コンピュータを使って、学習・推論・判断など人間の知能のはたらきを人工的に実現したもの。
と言う事。
正確な定義はなく、人間の知能のような働きをするソフトウェアと言う事です。
例えば、ソフトバンクのPepper君にも人工知能が内蔵されていますし、自動車の自動運転技術、ルンバなどのお掃除ロボットなどもそうです。
人間がやっているようなことをコンピューターが代替してくれる場合に大きい意味で人工知能と言うワードを使います。
では、一方で機会学習って言うのは何でしょう。
機械学習
ではどうやって人工知能を実現するのか?
と言う場合に登場するのが機械学習です。
つまり機会学習は、人工知能を実現するための方法の事です。
大量のデータからパターンを学ばせる方法が機械学習です。
よく例に使われるのが、迷惑メールの分類です。
大量のメールデータから、どれが迷惑メールかそうでないかを学習します。
分類には数式が使われます。
もっとも簡単な例だと「Y=AX+B」のようなグラフです。
このグラフを境界値として、直線の上部が通常のメール or 下部が迷惑メールのような分類をします。(超簡略化していますが実際の数式はもう少し複雑かと思われます。)
このデータの境界を決める数式を求めるのが機械学習です。
中学くらいの数学では、Y=2X+1のグラフにおいて、X=1の時のYを求めなさい、と言う問題が多いですよね。
そうではなく機械学習は全く逆です。
大量のYとXを学習データとして渡すと言う事です。
そして大量の学習データ(XとY)からY=AX+B のAとBを求めて、分類グラフを求めるのが機械学習です。
そして、この分類の方法がアルゴリズムと言うものです。
分類の方法が沢山あるのは、データの境界線が単純に直線で分類出来るもの、曲線になるもの、2次元空間で分類できないので
3次元などのより高次元になるもの、線では分類できず、いくつかの島にグループ化されているものなどデータの分布形態が様々となってくるためです。
簡単ですが、自分の理解を纏めてみました。
次回は、いくつかの機械学習の種類について纏めたいと思います。