機械学習アルゴリズムの仕組みとECにおける活用の可能性
RPAなどに代表されるように、ロボットは今やブルーカラーの仕事だけでなく、デスクワークや頭脳労働と言われるホワイトカラーの仕事をも人間の代わりに行い、人間よりもはるかに高い精度とスピードで業務を効率化しつつあります。
このようなデスクワークにおけるロボット技術を支えているのが、機械学習やAIといった新しいテクノロジーの存在です。これらの最新技術は日々進化を続け、分野によっては人間を上回るパフォーマンスを発揮することもありますが、どのような仕組みで機能しているかはあまり知られておらず、その成果だけが先行して世間で話題になっているのが現状です。
まだまだ発展途上の技術である一方、すでに実践レベルにも到達していることも考えると、機械学習の運用はケースバイケースで、活用の方法次第であるとも考えられます。機械学習はどのようなアルゴリズムで成り立ち、どうやって私たちの生活に役立ってくれるのでしょうか。
今回はそんな機械学習アルゴリズムについての解説や、AI、ディープラーニングといったキーワードとの区別を明確にしつつ、どのようにして活用するかをご紹介していきたいと思います。
機械学習とは
機械学習の仕組み
機械学習アルゴリズムの概要
機械学習と深層学習の違い
機械学習の活用方法
機械学習の活用例
しかしながら機械学習の能力をロボットに搭載することで、これまで人の仕事と考えられていた物体の認識、あるいは情報のグループ分けなどを行えるようになったのです。
あるいは迷惑メール設定などもその一つです。受診するメールが迷惑メールかそうでないかを過去のメールログから分析し、自動的に迷惑メールであると思われるものを受信トレイから弾くことも可能になります。
商品の販売予想数をyとしながら、配布チラシの枚数、予測日が日曜日かどうか、予測日の天気は晴れかどうかなどをxと置き、予想数を計測していきます。
上の説明では因子となるxは単純化した方がわかりやすいため、xをチラシの枚数に限定してグラフを生成しています。このグラフによると大体チラシの枚数が多いほど販売予想数yは大きくなるという式が成立しているので、チラシ枚数によって売上予測数は上下するということになります。
いわゆる単回帰分析と呼ばれる手法ですが、複数の変数が加わることによって重回帰分析となり、より複雑な予測値をはじき出すことができるようになります。
これまでの売上予測なのではあくまでも計算を行ってくれるだけで、自動的に変数などを生成するということはなかったのですが、機械学習はこのような点で従来のプログラムを凌駕しているといえるでしょう。
ロジスティック回帰やランダムフォレスト、ディシジョンジャングルなどがアルゴリズムとして含まれます。
先ほどの売上予測もそうでしたが、これまでの晴れの日の集客や曜日別の売り上げなど過去のデータを参考にしつつ、次に似たような条件下で予測を立てるときにどのような結果がもたらされるかを膨大なデータから高い精度で割り出すというものです。逆にいうと、数値を予測するときは会期が使われるとも考えられるでしょう。
分析同様ランダムフォレストが用いられたり、線形回帰やニューラルネットワークを利用します。
教師あり学習というのは、あらかじめ与えられるデータにラベリングが行われているかそうでないかというもので、例えば「良し悪し」というラベルが貼られているものは判断基準が存在する、つまり教師ありということになります。一方教師なし学習というのはこれとは異なるラベリングでオブジェクトを分類させるなど、元となる判断基準が存在しないところから分類を行う手法になります。
クラスタリングはこのような後者の教師なし学習を行います。
異常検知には教師ありとなしの二種類が存在します。教師ありの異常検知は現在の危険やエラーを検知するための機能で、例えば壁にヒビが入っていることから現在の危険性を報告したり、電気が供給されていない状態を報告してくれます。
教師なしの異常検知はいわゆる未来の脅威を検知するというものです。異音や振動、温度などから将来重大な脅威が発生する可能性を検知し、不具合発生をあらかじめ予見することで異常と判断し、検知するというものです。
人間からすればどちらも「異常は異常」という気もしますが、機械学習においてこの二つは異なるベクトルに位置していることは注目すべきでしょう。
ニューラルネットワークには入力層や出力層などといった各層を備えており、複数のノードがエッジで結ばれる構造をしています。各ノードの値はそのノードの接続する前の層のノードから値が計算されますが、この計算方法も複数の種類に分かれます。
わかりやすい深層学習の例としては、例えばCNN(Convolution Neural Network)というものがあります。これは画像認識において活躍する接続方法で、入力画像の特徴を捉えつつ縮小処理を行うことができるというものです。
つまり画像を自ら抽象化し、画像を分類してしまうことを可能にしまうのです。
深層学習の出番は機械学習では対処できない複雑な問題に直面した時が最も活躍するため、これら二つを使いわけることでうまくAIを運用していくことが可能になるということです。
機械学習はあくまでもAIの学習プロセスの一環であるため、それがユーザーの目に見えることは多くありません。それでも高い経営効率を追求する多くの大企業ではあらゆる分野において機械学習が導入されており、実際に利益を拡大させています。
機械学習は何度もそういった仕分け作業や過去の仕訳データを参照にすることで、人間以上のスピードと正確性で分類を行うようになることができます。
機械学習は日々膨大なデータが集まる消費者行動の分析、予測には最適なテクノロジーと言えるでしょう。加えてディープラーニングに比べて導入・運用も容易なため、多くの企業において機械学習の活躍が期待できます。
「欲しいものを的確に見つける」がモットーのこの機能は、スマホで撮影した写真やスクリーンショットをアップロードし、それに類似する商品をタオバオやTmallなどから検索してくれるというものです。
あらかじめ用意されたデータにテキストで検索するのではなく、画像から商品を直接検索してくれるサービスは、その商品名が具体的にわからない場合にも重宝します。実際、このサービスの導入によって、成約が15%アップしたというデータもあります。
商品登録可能件数は100億件以上も登録できる拡張性も備えているため、今後の利用者増加にも対応することができます。
早いうちから自社で機械学習の導入方法を検討していく施策を考えていくことも大切になってきていると言えるでしょう。
このようなデスクワークにおけるロボット技術を支えているのが、機械学習やAIといった新しいテクノロジーの存在です。これらの最新技術は日々進化を続け、分野によっては人間を上回るパフォーマンスを発揮することもありますが、どのような仕組みで機能しているかはあまり知られておらず、その成果だけが先行して世間で話題になっているのが現状です。
まだまだ発展途上の技術である一方、すでに実践レベルにも到達していることも考えると、機械学習の運用はケースバイケースで、活用の方法次第であるとも考えられます。機械学習はどのようなアルゴリズムで成り立ち、どうやって私たちの生活に役立ってくれるのでしょうか。
今回はそんな機械学習アルゴリズムについての解説や、AI、ディープラーニングといったキーワードとの区別を明確にしつつ、どのようにして活用するかをご紹介していきたいと思います。
機械学習とは
機械学習は与えられた情報を自律的に吸収・学習し、自らその情報に含まれたルールや法則、傾向などを見出すことを言います。これまでのロボットに搭載されていたのは、与えられたプログラムに従って情報を処理するだけであったため、自発的に法則を見つけ出したりということはできませんでした。しかしながら機械学習の能力をロボットに搭載することで、これまで人の仕事と考えられていた物体の認識、あるいは情報のグループ分けなどを行えるようになったのです。
身近に存在する機械学習の活用
機械学習は近未来的な響きを持っていますが、今ではIT関係を中心に幅広く活躍しています。例えば画像認識機能はポピュラーな例の一つで、大量の人間の顔を読み込ませることで人の顔の特徴を記憶させ、特定の基準に基づいてグルーピングや識別を行うことができます。あるいは迷惑メール設定などもその一つです。受診するメールが迷惑メールかそうでないかを過去のメールログから分析し、自動的に迷惑メールであると思われるものを受信トレイから弾くことも可能になります。
機械学習の仕組み
機械学習は統計学から発達した学問であるとも言われ、線形回帰モデルを応用してその役割を果たします。こちらのサイトでは商品の販売数を例に、販売数に関わる様々な因子が影響しながら販売数を予測するプロセスをグラフを用いて紹介されています。商品の販売予想数をyとしながら、配布チラシの枚数、予測日が日曜日かどうか、予測日の天気は晴れかどうかなどをxと置き、予想数を計測していきます。
上の説明では因子となるxは単純化した方がわかりやすいため、xをチラシの枚数に限定してグラフを生成しています。このグラフによると大体チラシの枚数が多いほど販売予想数yは大きくなるという式が成立しているので、チラシ枚数によって売上予測数は上下するということになります。
いわゆる単回帰分析と呼ばれる手法ですが、複数の変数が加わることによって重回帰分析となり、より複雑な予測値をはじき出すことができるようになります。
単回帰分析とは
単回帰分析は機械学習におけるアルゴリズムの一つで、機械学習にはこれ以外にも複数のアルゴリズムが存在しています。機械学習によってもたらされる「予測」はこういったアルゴリズムを活用して形成されており、グラフの傾きや切片を自動的に生成していくようになるのです。これまでの売上予測なのではあくまでも計算を行ってくれるだけで、自動的に変数などを生成するということはなかったのですが、機械学習はこのような点で従来のプログラムを凌駕しているといえるでしょう。
機械学習アルゴリズムの概要
単回帰分析は機械学習アルゴリズムにおけるほんの一部で、実際には数多くのアルゴリズムがすでに存在しています。分類(Classification)
分類はその名の通り、複数のオブジェクトを自動的に分類するためのアルゴリズムです。分類の中でもさらに枝分かれがあり、2クラス分類とマルチ分類が存在します。2クラス分類はシンプルな正誤判定や、1か0の判断など、Yes/NOクエスチョンに最適な分類法で、マルチ分類は植物の名前や野菜の種類など、答えが複数存在する場合に活用する分類です。ロジスティック回帰やランダムフォレスト、ディシジョンジャングルなどがアルゴリズムとして含まれます。
回帰(Regression)
回帰は今までのデータを振り返りながら、実績をもとに関連性のあるなしを導き、今後の予測に応用するという手法です。先ほどの売上予測もそうでしたが、これまでの晴れの日の集客や曜日別の売り上げなど過去のデータを参考にしつつ、次に似たような条件下で予測を立てるときにどのような結果がもたらされるかを膨大なデータから高い精度で割り出すというものです。逆にいうと、数値を予測するときは会期が使われるとも考えられるでしょう。
分析同様ランダムフォレストが用いられたり、線形回帰やニューラルネットワークを利用します。
クラスタリング(Clustering)
クラスタリングも複数のオブジェクトの分類に活用するためのプロセスです。上述で紹介した分類との最大の違いは、教師あり学習か、そうでないかという点です。教師あり学習というのは、あらかじめ与えられるデータにラベリングが行われているかそうでないかというもので、例えば「良し悪し」というラベルが貼られているものは判断基準が存在する、つまり教師ありということになります。一方教師なし学習というのはこれとは異なるラベリングでオブジェクトを分類させるなど、元となる判断基準が存在しないところから分類を行う手法になります。
クラスタリングはこのような後者の教師なし学習を行います。
異常検知(Anomaly Detection)
異常検知は分類や回帰などとは少しカテゴリが異なるのですが、これもあるがリズムの一つとして紹介することができるでしょう。異常検知には教師ありとなしの二種類が存在します。教師ありの異常検知は現在の危険やエラーを検知するための機能で、例えば壁にヒビが入っていることから現在の危険性を報告したり、電気が供給されていない状態を報告してくれます。
教師なしの異常検知はいわゆる未来の脅威を検知するというものです。異音や振動、温度などから将来重大な脅威が発生する可能性を検知し、不具合発生をあらかじめ予見することで異常と判断し、検知するというものです。
人間からすればどちらも「異常は異常」という気もしますが、機械学習においてこの二つは異なるベクトルに位置していることは注目すべきでしょう。
機械学習と深層学習の違い
人工知能やロボット技術についての話が出る際、機械学習と同時に出てくるのが深層学習(ディープラーニング)についての話題です。機械学習と深層学習は同じ学習と付いているワードですが、深層学習の方が機械学習に比べてさらに込み入ったテクノロジーとなっています。一歩踏み込んだ技術の深層学習
深層学習は機械学習アルゴリズムのニューラルネットワークを発展させた技術です。ニューロンという生物の神経細胞をモチーフとしたこのアルゴリズムは、長い研究の歴史を持っているポピュラーなテクノロジーで、日々世界中から研究成果が寄せられています。ニューラルネットワークには入力層や出力層などといった各層を備えており、複数のノードがエッジで結ばれる構造をしています。各ノードの値はそのノードの接続する前の層のノードから値が計算されますが、この計算方法も複数の種類に分かれます。
わかりやすい深層学習の例としては、例えばCNN(Convolution Neural Network)というものがあります。これは画像認識において活躍する接続方法で、入力画像の特徴を捉えつつ縮小処理を行うことができるというものです。
つまり画像を自ら抽象化し、画像を分類してしまうことを可能にしまうのです。
機械学習と深層学習の関係
深層学習の方が優秀な成果を出してくれるということは理解できたかもしれません。ただそれでも深層学習よりも機械学習を人工知能に搭載する上で重視されるのは、一つに計算コストが機械学習の方が安く、簡単な問題に対しては機械学習が素早いとされているためです。深層学習の出番は機械学習では対処できない複雑な問題に直面した時が最も活躍するため、これら二つを使いわけることでうまくAIを運用していくことが可能になるということです。
機械学習の活用方法
それでは機械学習を実際にビジネスの場面で運用していく場合、どのようなシチュエーションが想定できるのでしょうか。機械学習はあくまでもAIの学習プロセスの一環であるため、それがユーザーの目に見えることは多くありません。それでも高い経営効率を追求する多くの大企業ではあらゆる分野において機械学習が導入されており、実際に利益を拡大させています。
価値ある生成コンテンツの判別
例えばユーザーがインプットすべき有益で質の高いコンテンツを判別するのに機械学習は活躍します。一般的に人が生成するコンテンツは質が高く、プログラムで生成されるコンテンツは粗悪であるという認識がひろまっていますが、実際のところ人が作ったコンテンツにおいても粗悪なものは多く、そういったものがユーザーに提供されないよう、機械は膨大な数のコンテンツを仕分ける必要があります。機械学習は何度もそういった仕分け作業や過去の仕訳データを参照にすることで、人間以上のスピードと正確性で分類を行うようになることができます。
検索機能の強化
検索エンジンに入力されたキーワードなどから、そのユーザーにとって最も最適な検索結果を提供します。これはECサイトにおける検索機能にも当てはまり、ユーザーの閲覧履歴や購入履歴から本当に求めている商品を1ワードから見出し、最適化する手伝いをしてくれます。機械学習は日々膨大なデータが集まる消費者行動の分析、予測には最適なテクノロジーと言えるでしょう。加えてディープラーニングに比べて導入・運用も容易なため、多くの企業において機械学習の活躍が期待できます。
機械学習の活用例
機械学習のポピュラーな例としては、アリババの提供する「Image Search」が挙げられるでしょう。「欲しいものを的確に見つける」がモットーのこの機能は、スマホで撮影した写真やスクリーンショットをアップロードし、それに類似する商品をタオバオやTmallなどから検索してくれるというものです。
あらかじめ用意されたデータにテキストで検索するのではなく、画像から商品を直接検索してくれるサービスは、その商品名が具体的にわからない場合にも重宝します。実際、このサービスの導入によって、成約が15%アップしたというデータもあります。
商品登録可能件数は100億件以上も登録できる拡張性も備えているため、今後の利用者増加にも対応することができます。
さいごに
機械学習はますます世の中で使われるようになっていくことになると考えられます。早いうちから自社で機械学習の導入方法を検討していく施策を考えていくことも大切になってきていると言えるでしょう。