昨今、ビッグデータなどの大量データを取り扱うことが増えました。その大量データを有効に使うためのひとつの方法として「機械学習」が注目され、既に生活の中の様々なシーンで使われています。
この記事を読むと、機械学習の基本と利用例、今後の活用のヒントについて学ぶことができます。
機械学習とは
まず、「機械学習」の定義と、近年になって機械学習が注目されている理由について解説していきます。
- 機械学習の定義
機械学習(Machine Learning)とは、大量のデータを分析する方法の1つで、データから「機械」が自動的に「学習」し、データの中のルールやパターンを発見する方法です。
- 機械学習が注目されている理由
機械学習は、最近注目を集めているDXやビッグデータ、AI(人工知能)などを推進・活用していく上で、とても深い関連性を持っています。すなわち、AIに学習能力を与え、ビッグデータを処理して分析するために必要であることから注目されているのです。
機械学習の3つの学習方法
機械がデータを学習する方法は大きく分けて3つあります。
- 教師あり学習
- 教師なし学習
- 強化学習
それぞれの学習方法について詳しく解説します。
教師あり学習
「教師あり学習」とは、例題(入力データ)と正解(出力データ)の両方を与えることでパターンを学習させる方法です。例えば、様々な形状をした車(正解)が映っている写真(例題)や、雨(正解)が降っている時の雨雲の状況(例題)を機械に学ばせるケースです。
学習していない事象についても、与えられた例題から推測して正解を導きだすことができますが、裏を返せば、人間が回答を与えることができない事象には対応できないという欠点があります。また、例題(入力データ)が多ければ多いほど精度が上がるため、精度を上げたければ大量の例題(入力データ)が必要になります。
教師なし学習
「教師なし学習」とは、与えられたデータを蓄積することで、自らその背景にあるパターンを見つけ出していく学習方法です。そのため、「教師あり学習」と比べると、大量のデータは必要ないですが、入力データから予測ができない事象を学習することができないという欠点があります。
ECショップなどで顧客の購入データを分析して商品をレコメンデーションしたり、顧客の属性は取引振りを分析して顧客をセグメンテーションしたりする場合に活用されます。
強化学習
教師あり・なし学習とは異なり、例題(入力データ)も回答(出力データ)もなく、システム自身が試行錯誤を繰り返しながら、どうすれば最大報酬をもらえるか、最適な行動を見つけ出していく学習方法です。
将棋や囲碁がその例です。様々な状況が想定されるため、明確な回答をあらかじめ与えることが難しいので、報酬の大きさによって高いスコアを与えることによって、機械が最も効率がいい行動をとれるようになっていきます。
機械学習の5つの用途
機械学習の用途は次の5種類に分類されます。
クラス分類
「クラス分類」とは、様々なデータを決まったカテゴリー(クラス)に分けることをいいます。過去のデータを元に傾向を導き出して将来を予測する場合(売上予測や天気予報など)や、写真に写っているものが「犬」なのか「ネコ」なのかを自動で判別する画像分類などで使われます。
回帰
「回帰」とは、様々なデータをもとに新しい数値を予測することです。過去の実績データを教師として学習します。例えば、このくらいの広告費を投入すれば売り上げがどれくらい伸びるのかなどです。それが予測できることによって、材料の購入や仕入れる商品の量を調整することができ、無駄がなくなります。
次元削減
「次元削減」とは、データの次元を少なくしていくことです。
例えば、身長と体重のデータを「体格」という形でひとつにまとめる場合です。この場合、教師となるデータは必要ありません。
クラスタリング
「クラスタリング」とは、データをある一定の規則に基づいて分けることです。
「分類」と似ていますが、「分類」があくまでも答えを与える「教師あり学習」であるのに対して、「クラスタリング」は機械が自分で共通するパターンを見つけ出す「教師なし学習」です。クラスタリングは、顧客情報の分析やSNS等の繋がりのグルーピングなどに使われます。
レコメンデーション
過去の購入履歴や閲覧履歴、顧客情報、位置情報などから「この商品を購入した人は、この商品も買っている」などの法則を導くことです。より多くのデータを学習することで、より正確な購買予測が可能となります。
機械学習でできること
こうした機械学習は、既に生活の様々な場面で広く活用され、私たちの生活をより快適に便利にしてくれています。具体的な例をご紹介します。
コールセンター業界や通販事業での活用
コールセンター業界や通販事業では、チャットボットが利用されています。インターネット上で問い合わせをする時にチャット画面を目にされた方も多いのでないでしょうか。チャットボットは、機械が質問を分析して分類することで問い合わせ対応を人間に代わって行うことができます。問い合わせ対応にかかる人件費の削減や、オペレーター不在時にも顧客自身で問題を解決すること助けることで顧客満足度の向上にも寄与しています。
医療業界での活用
医療業界活用されているのが画像診断です。医師による判断は医師の経験が元になっており、すべての医師が同じ判断をするとは限りません。また、医師も人間である以上、所見を誤ったり、症状を見逃したりする可能性もあります。画像診断を利用することでそうした所見の誤りも防止できますし、例えば、胃がん患者の胃の画像を多数機械に学習させることで、人間の目では判別が難しい早期胃がんの発見率が飛躍的に増加しているという例もあります。
銀行・金融業界での活用
銀行・金融業界では、セキュリティレベルの向上に機械学習が活用されています。大量の取引データの中から、不正請求やマネーロンダリングなどの犯罪が疑われる取引を検知することにより金融犯罪の抑止や早期発見に寄与しています。
上記の3つに加えて、「需要予測」があり、小売業などで活用されています。過去の売上データの推移や顧客の購買動向などを機械に学習させることによって今後の商品需要を予測し、それに基づいて、仕入れや生産量を調整することができるので、商品廃棄などのリスクを最低限に抑えることができます。
今後、機械学習に期待されること
これまで見てきたように、機械学習は既に身近の様々な場面で活用されていますが、今後はその活躍の場をさらに広げていくものと思われます。
少子高齢化によって、今後の日本の労働者人口は減少していくと予想されており、機械学習は、あらゆる業界で、その労働力不足を解消する手段として期待されています。機械学習が得意とするところは、スピード、大量のデータの解析・分析・検知です。今まで人間が行うと膨大な時間と手間がかかっていたような作業を担うことで、人の作業量を減らすことができます。具体的に活躍が期待されるシーンをご紹介します。
銀行・金融業界での活用
銀行・金融業界は、依頼書や決算書、契約書など特に書類が多い業界です。文字認識が搭載されたOCRを併用することで書類に記載された内容を解析し、入力作業や照合作業を自動で行えるようになりなれば、より速く、より正確で、より効率的な対応が可能になります。
医療業界での活用
医療業界の人材不足や医療の地域格差も深刻な問題です。
画像診断がより広く活用されることで、医師の経験による所見の違いが少なくなり、診断のスピードや正確性に差がなくなれば、地域による医療格差の問題も解消されると期待されています。
また、薬の調剤の分野でも、薬剤師の負担が問題となっています。調剤作業の自動化や、調剤ミスの検知などの領域で機械学習が期待されています。
物流業界での活用
物流業界で機械学習の活用が期待されるのは、主に検品・管理業務です。これらには一定の基準があるため、それを機械学習させることにより、コンピューターによる検品・管理の自動化が可能になります。
また、配送業務において、配送ルートを自動検知させることにより、スムーズな配送ができるようになります。道路の渋滞を予測する技術も進んでいるため、それと連携すれば、渋滞を避け効率的に配送できるルートを提案できるようになります。
まとめ
機械学習は様々な分野での活用が期待されていますが、活用に当たっては注意すべき点もあります。自社がやろうとしていることは機械学習に本当に適しているのか、機械学習に100%を期待できないことを理解しているか、より有効な結果を導き出すために十分な学習データが用意できるかなどに注意して、機械学習の導入検討を進めていく必要があるでしょう。