デブのDEV日記

港区で働くデブによるDEV(DEVELOPE)やデブ飯の記録。そんな美味いならデブになっても構わない。

機械学習入門①〜機械学習って何?〜

空前のAIブームですが人工知能、機会学習、AIなど色んな用語が乱立し
混乱してよく分からないと言う人が多いのではないかと思います。

最近会社で勉強会を開催していますので、自分なりの理解を簡単にまとめていきたいと思います。

人工知能=AI

Wikipediaによると

コンピュータを使って、学習・推論・判断など人間の知能のはたらきを人工的に実現したもの。

と言う事。
正確な定義はなく、人間の知能のような働きをするソフトウェアと言う事です。
例えば、ソフトバンクのPepper君にも人工知能が内蔵されていますし、自動車の自動運転技術、ルンバなどのお掃除ロボットなどもそうです。
人間がやっているようなことをコンピューターが代替してくれる場合に大きい意味で人工知能と言うワードを使います。

では、一方で機会学習って言うのは何でしょう。

機械学習

ではどうやって人工知能を実現するのか?
と言う場合に登場するのが機械学習です。
つまり機会学習は、人工知能を実現するための方法の事です。
大量のデータからパターンを学ばせる方法が機械学習です。

よく例に使われるのが、迷惑メールの分類です。
大量のメールデータから、どれが迷惑メールかそうでないかを学習します。
分類には数式が使われます。
もっとも簡単な例だと「Y=AX+B」のようなグラフです。
このグラフを境界値として、直線の上部が通常のメール or 下部が迷惑メールのような分類をします。(超簡略化していますが実際の数式はもう少し複雑かと思われます。)
このデータの境界を決める数式を求めるのが機械学習です。

中学くらいの数学では、Y=2X+1のグラフにおいて、X=1の時のYを求めなさい、と言う問題が多いですよね。
そうではなく機械学習は全く逆です
大量のYとXを学習データとして渡すと言う事です。

そして大量の学習データ(XとY)からY=AX+B のAとBを求めて、分類グラフを求めるのが機械学習です。

そして、この分類の方法がアルゴリズムと言うものです。
分類の方法が沢山あるのは、データの境界線が単純に直線で分類出来るもの、曲線になるもの、2次元空間で分類できないので
3次元などのより高次元になるもの、線では分類できず、いくつかの島にグループ化されているものなどデータの分布形態が様々となってくるためです。

簡単ですが、自分の理解を纏めてみました。

次回は、いくつかの機械学習の種類について纏めたいと思います。