機械学習アルゴリズムの仕組みとECにおける活用の可能性

2019年02月15日
2019年02月15日
#AI
#機械学習
#深層学習

RPAなどに代表されるように、ロボットは今やブルーカラーの仕事だけでなく、デスクワークや頭脳労働と言われるホワイトカラーの仕事をも人間の代わりに行い、人間よりもはるかに高い精度とスピードで業務を効率化しつつあります。

このようなデスクワークにおけるロボット技術を支えているのが、機械学習やAIといった新しいテクノロジーの存在です。これらの最新技術は日々進化を続け、分野によっては人間を上回るパフォーマンスを発揮することもありますが、どのような仕組みで機能しているかはあまり知られておらず、その成果だけが先行して世間で話題になっているのが現状です。

まだまだ発展途上の技術である一方、すでに実践レベルにも到達していることも考えると、機械学習の運用はケースバイケースで、活用の方法次第であるとも考えられます。機械学習はどのようなアルゴリズムで成り立ち、どうやって私たちの生活に役立ってくれるのでしょうか。

今回はそんな機械学習アルゴリズムについての解説や、AI、ディープラーニングといったキーワードとの区別を明確にしつつ、どのようにして活用するかをご紹介していきたいと思います。

機械学習とは

機械学習は与えられた情報を自律的に吸収・学習し、自らその情報に含まれたルールや法則、傾向などを見出すことを言います。これまでのロボットに搭載されていたのは、与えられたプログラムに従って情報を処理するだけであったため、自発的に法則を見つけ出したりということはできませんでした。

しかしながら機械学習の能力をロボットに搭載することで、これまで人の仕事と考えられていた物体の認識、あるいは情報のグループ分けなどを行えるようになったのです。

身近に存在する機械学習の活用

機械学習は近未来的な響きを持っていますが、今ではIT関係を中心に幅広く活躍しています。例えば画像認識機能はポピュラーな例の一つで、大量の人間の顔を読み込ませることで人の顔の特徴を記憶させ、特定の基準に基づいてグルーピングや識別を行うことができます。

あるいは迷惑メール設定などもその一つです。受診するメールが迷惑メールかそうでないかを過去のメールログから分析し、自動的に迷惑メールであると思われるものを受信トレイから弾くことも可能になります。

2018.02.15

SNSの投稿画像をAIで解析。特定ドリンクの消費シーンだけを詳細に分類・集計

　株式会社ブレインパッドは、日本コカ・コーラ株式会社のプロジェクトの一環として、SNSの投稿画像をAIで解析し、ドリンクの消費シーンを分析する取り組みを実施したことを発表しました。　食品メーカーにとって、自社商品がどのような生活シー...

機械学習の仕組み

機械学習は統計学から発達した学問であるとも言われ、線形回帰モデルを応用してその役割を果たします。こちらのサイトでは商品の販売数を例に、販売数に関わる様々な因子が影響しながら販売数を予測するプロセスをグラフを用いて紹介されています。

出典：http://gagbot.net/machine-learning/ml2

商品の販売予想数をyとしながら、配布チラシの枚数、予測日が日曜日かどうか、予測日の天気は晴れかどうかなどをxと置き、予想数を計測していきます。

上の説明では因子となるxは単純化した方がわかりやすいため、xをチラシの枚数に限定してグラフを生成しています。このグラフによると大体チラシの枚数が多いほど販売予想数yは大きくなるという式が成立しているので、チラシ枚数によって売上予測数は上下するということになります。

いわゆる単回帰分析と呼ばれる手法ですが、複数の変数が加わることによって重回帰分析となり、より複雑な予測値をはじき出すことができるようになります。

単回帰分析とは

単回帰分析は機械学習におけるアルゴリズムの一つで、機械学習にはこれ以外にも複数のアルゴリズムが存在しています。機械学習によってもたらされる「予測」はこういったアルゴリズムを活用して形成されており、グラフの傾きや切片を自動的に生成していくようになるのです。

これまでの売上予測なのではあくまでも計算を行ってくれるだけで、自動的に変数などを生成するということはなかったのですが、機械学習はこのような点で従来のプログラムを凌駕しているといえるでしょう。

機械学習アルゴリズムの概要

単回帰分析は機械学習アルゴリズムにおけるほんの一部で、実際には数多くのアルゴリズムがすでに存在しています。

分類（Classification）

分類はその名の通り、複数のオブジェクトを自動的に分類するためのアルゴリズムです。分類の中でもさらに枝分かれがあり、2クラス分類とマルチ分類が存在します。2クラス分類はシンプルな正誤判定や、1か0の判断など、Yes/NOクエスチョンに最適な分類法で、マルチ分類は植物の名前や野菜の種類など、答えが複数存在する場合に活用する分類です。

ロジスティック回帰やランダムフォレスト、ディシジョンジャングルなどがアルゴリズムとして含まれます。

2018.07.17

ECサービスの利便性向上と活性化を促進してくれるサイレント認証とは～ラストワンマイル問題の解決のヒント～

ラストワンマイルの問題は、従来型のECには必ず付いて回る懸念事項であり、現在のEC運営者が最も頭を悩ませる問題の一つであるともいえるでしょう。この問題をいかに解決するかというのにも多くの取り組みがなされてきましたが、現代の取り組みの...

回帰(Regression)

回帰は今までのデータを振り返りながら、実績をもとに関連性のあるなしを導き、今後の予測に応用するという手法です。

先ほどの売上予測もそうでしたが、これまでの晴れの日の集客や曜日別の売り上げなど過去のデータを参考にしつつ、次に似たような条件下で予測を立てるときにどのような結果がもたらされるかを膨大なデータから高い精度で割り出すというものです。逆にいうと、数値を予測するときは会期が使われるとも考えられるでしょう。

分析同様ランダムフォレストが用いられたり、線形回帰やニューラルネットワークを利用します。

2018.03.26

ドイツのOtto社に見る人工知能（AI）の活用方法~欧州原子核研究理事会の研究が小売企業にもたらした効果とは

ドイツのハンブルグにあるEコマース小売販売業者Ottoのオフィスには人工知能（AI）が採用されており、ここに小売ビジネスの未来形を垣間見ることができます。そしてこのテクノロジーのおかげで、すでに対処ボリューム、スピード、そして正確さといった...

クラスタリング(Clustering)

クラスタリングも複数のオブジェクトの分類に活用するためのプロセスです。上述で紹介した分類との最大の違いは、教師あり学習か、そうでないかという点です。

教師あり学習というのは、あらかじめ与えられるデータにラベリングが行われているかそうでないかというもので、例えば「良し悪し」というラベルが貼られているものは判断基準が存在する、つまり教師ありということになります。一方教師なし学習というのはこれとは異なるラベリングでオブジェクトを分類させるなど、元となる判断基準が存在しないところから分類を行う手法になります。

クラスタリングはこのような後者の教師なし学習を行います。

異常検知(Anomaly Detection)

異常検知は分類や回帰などとは少しカテゴリが異なるのですが、これもあるがリズムの一つとして紹介することができるでしょう。

異常検知には教師ありとなしの二種類が存在します。教師ありの異常検知は現在の危険やエラーを検知するための機能で、例えば壁にヒビが入っていることから現在の危険性を報告したり、電気が供給されていない状態を報告してくれます。

教師なしの異常検知はいわゆる未来の脅威を検知するというものです。異音や振動、温度などから将来重大な脅威が発生する可能性を検知し、不具合発生をあらかじめ予見することで異常と判断し、検知するというものです。

人間からすればどちらも「異常は異常」という気もしますが、機械学習においてこの二つは異なるベクトルに位置していることは注目すべきでしょう。

機械学習と深層学習の違い

人工知能やロボット技術についての話が出る際、機械学習と同時に出てくるのが深層学習(ディープラーニング)についての話題です。機械学習と深層学習は同じ学習と付いているワードですが、深層学習の方が機械学習に比べてさらに込み入ったテクノロジーとなっています。

一歩踏み込んだ技術の深層学習

深層学習は機械学習アルゴリズムのニューラルネットワークを発展させた技術です。ニューロンという生物の神経細胞をモチーフとしたこのアルゴリズムは、長い研究の歴史を持っているポピュラーなテクノロジーで、日々世界中から研究成果が寄せられています。

ニューラルネットワークには入力層や出力層などといった各層を備えており、複数のノードがエッジで結ばれる構造をしています。各ノードの値はそのノードの接続する前の層のノードから値が計算されますが、この計算方法も複数の種類に分かれます。

わかりやすい深層学習の例としては、例えばCNN(Convolution Neural Network)というものがあります。これは画像認識において活躍する接続方法で、入力画像の特徴を捉えつつ縮小処理を行うことができるというものです。

つまり画像を自ら抽象化し、画像を分類してしまうことを可能にしまうのです。

機械学習と深層学習の関係

深層学習の方が優秀な成果を出してくれるということは理解できたかもしれません。ただそれでも深層学習よりも機械学習を人工知能に搭載する上で重視されるのは、一つに計算コストが機械学習の方が安く、簡単な問題に対しては機械学習が素早いとされているためです。

深層学習の出番は機械学習では対処できない複雑な問題に直面した時が最も活躍するため、これら二つを使いわけることでうまくAIを運用していくことが可能になるということです。

機械学習の活用方法

それでは機械学習を実際にビジネスの場面で運用していく場合、どのようなシチュエーションが想定できるのでしょうか。

機械学習はあくまでもAIの学習プロセスの一環であるため、それがユーザーの目に見えることは多くありません。それでも高い経営効率を追求する多くの大企業ではあらゆる分野において機械学習が導入されており、実際に利益を拡大させています。

2018.07.09

動画に合わせてAIが広告配信やECへ誘導。その仕組みや事例を解説します。

「人工知能を使うと動画に合わせて広告配信できるらしいけど、仕組みはどうなっているんだろう…」と思っている方。 AIを使うと動画に広告を入れることができ、お客さまの購買へとスムーズにつなげることが可能です。とはいえ、実際...

価値ある生成コンテンツの判別

例えばユーザーがインプットすべき有益で質の高いコンテンツを判別するのに機械学習は活躍します。一般的に人が生成するコンテンツは質が高く、プログラムで生成されるコンテンツは粗悪であるという認識がひろまっていますが、実際のところ人が作ったコンテンツにおいても粗悪なものは多く、そういったものがユーザーに提供されないよう、機械は膨大な数のコンテンツを仕分ける必要があります。

機械学習は何度もそういった仕分け作業や過去の仕訳データを参照にすることで、人間以上のスピードと正確性で分類を行うようになることができます。