2017年05月10日

ビッグデータに出て来る「BI」って?「BA」って?

当連載では「ビッグデータ」や「IoT」という言葉を中心にテーマを置いて、「人が輝くIT」について追及をして来ましたが、正直言いましてこれらの言葉それ自身には「釣り」的な要素が多く、実体の薄いメディア用語であることが多いので、実業務での活用を検討されている皆さんは実用度や適応例を見極める力が重要となります。

そもそもメディアで流行する言葉というのは定義が曖昧なことが多いものです。拡大解釈をしてしまい、後付けであれもこれもと「事例」に仕立て上げてしまうことが少なからずあります。直近な例で言えばいま最も流行っている「IoT」も、センサーを使っていれば別にインターネットに繋がっていなくても、データ分析に活用していなくても「IoT」の範疇と見なしてしまう事例が多いようです。そんなことから、あれもこれもと急激に「IoT」の事例が増えて企業に煽って来ます。

筆者の実感としても、メディアで取り上げられるタイミングと実業務で役立てることが出来るタイミングに4~5年の開き、時差があると感じています。筆者は20~30年前は、IT業界をリードする大手ITメーカーに所属し、その企業が発表する新製品・新テクノロジーが雑誌の特集に踊るという時代をずっと見て来ましたが、メディアで発表される内容を内情を知る立場として、「美化」され具合は肌で感じていました。

さて話を少し本題に戻しますが、「ビッグデータ」や「IoT」自身の言葉には、実際はそれほど大きな意味を持ちません。単にテクノロジーを指している言葉であって、今後のポテンシャルを示唆しているに過ぎないからです。前号で書きましたようにデータを格納するところに大きな課題が企業には潜在していますし、活用しやすく整理して格納するのは至難の業です。多くの企業がこの壁を乗り越えられずにいます。そしてたとえ整理、格納が出来たとしても、肝心なのはそれをどう生かして「データ」から「情報」へ加工していけるかです。そこに全てがかかっています。

もちろん「ビッグデータ」のテクノロジーにより、昔には出来なかった大量のデータを格納して高速にアクセス出来るようになったことは意義深いです。諦めてゴミのように捨てていたデータが、いきなり宝の山と変わることになりました。「IoT」にしても同様です。センサーが抽出する無機質なデータをインターネットで繋いでデータを保存し、それらを分析に活用出来るようになりました。

さてこれらの「素地」を企業が生かすも殺すも、そのあとの分析能力にかかっています。これがIT業界の用語では「BI]や「BA」と呼ばれているものなのです。他のメディア流行語と同様に「BI」も「BA」も言葉自体にはそれほど意味を持ちません。「BI」や「BA」は今に始まった話ではなく、20年以上前からも言われていた言葉です。

大昔に「マルチプラン」という名前の表計算ソフトが流行り、今では「エクセル」が主流になっていますが、それと同じことです。「エクセル」が世に出てから30年近く経っていますが、実のところ未だに企業では、企業の重要情報を「エクセル」で加工し、分析しているところが殆どです。しかも、十分それで事足りているのかも知れません。

だから、敢えて高額な「BI」ツールや、もっと高額な「BA」ツールを導入する動機づけがなかなか進まないのです。大手企業や、情報の活用価値を理解している一部の企業が導入し、さらなる差別化に奔走していますが、多くの企業が概念で理解はしていても、自社でどう活用したらいいのかわからずにいるのが実態です。


そんな「BI」や「BA」ですので、流行している割には両者の違いを理解している人が多くないような気がします。どちらもツールを導入して、人間では気づかなかったであろう意味ある「関係」を導き出してくれるところは一緒だからです。筆者も恥ずかしながら、正直感覚でしか理解していない時期が長く、「BA」ツールを使いこなして初めて違いがわかったほどです。

この「正直感覚でしか理解していない」レベルの違いを説明した「BIとBAの違い」は図1のようになります。

「BI」と「BA」の違いを理解する (用途から見て)  

図1の赤字の部分が「BI」、緑字の部分が「BA」となります。「BI」はBusiness Intelligenceの略ですが、一般的に現状の分析と言われています。現状のデータの傾向値や相関関係を見つけ出す時に使います。「BA」はBusiness Analyticsの略ですが、一般的に未来の予測分析と言われています。確率統計の手法を利用して、現状データから「モデル」と呼ばれるパターンのようなものを導きだして、その「モデル」の通りに未来になったらどうなるだろうかを確率的に予測するものです。

ただ、両者をわかりづらくしているのは、現状分析をする「BI」であっても傾向値や相関関係を導き出せるので、そこから未来を予測出来るではないかとユーザーは思ってしまうからです。私は「BI」と「BA」の違いの理解が遅れた理由もそこにありました。

「BI」と「BA」の決定的な違いは、その傾向値や相関関係を導く際の変動要素(要因)の要素数の多さにあります。

2

「BI」は基本的に2軸で傾向値を導き出します。例えば、季節別・商品別で売上に傾向はあるだろうかとか、地域別・商品別では売れ筋に違いがあるだろうかとか、単価別・顧客別にはどうだろうかという風に、X軸Y軸を人間側が試行錯誤で設定しながら相関関係のある軸を見つけるのが「BI」の作業になります。

「BA」はこれらの変動要素(要因)を全てツールにインプットし、2軸を選ぶ段階からツールにお願いしているところが大きく違います。「BA」の場合はシミュレーションに近い作業をツールが行うことになります。それが確立統計で言う適正モデルの探索であり、そのモデルの適正度の精査であり、そのモデルを利用してこれから起こるだろう未来の予測になります。「BI」では、この要素(要因)とこの要素(要因)の間に何か傾向はあるか?と人間の勘を頼りにツールで検証していく形となります。「BA」では、この結果になるためにはどの要素(要因)が大きく影響しているかと見つけ出してくれる形になります。

こちらを見てみてください。(図3)

手法から見たBIとBAの違い


仮説を立てて関係があるかを見ていく「BI」ツールと、過去の結果から影響する要因を見つけ出し、そのモデルを元に未来を予測する「BA」ツールとでは、ツールの使い方も変わって来ます。「BI」ツールでは正規化されたデータさえ出来てしまえばあとはツールを起動するだけです。(図3上側)とてもシンプルですが、逆にツールを起動したあとに、要素(軸)をユーザーが仮説を立てながら選んで表を作ったりグラフを作ったりしていきます。「BA」ツールはそういった作業の前にモデルを作る操作から始まります。(図3下側)正規化されたデータを元にそのうち7割くらいを使ってモデル(パターン)をツールに見つけてもらいます。モデルを見つけたあとにそのモデルの精度を確認するために、残りの3割のデータを使って検証を行います。そこそこ信頼に足りうるモデルと確認出来たら、それを使って現在発生して来たデータをインプットに使って、これらのデータがどうなるのかを予測出来るようになるのが「BA]ツールです。

下記はある有名な「BA」ツールを使ってそれらの操作をデザインした時の画面です。

4ここでは内容を理解する必要はないのですが、流れとして見ていただければいいと思います。まずデータを正規化しているフローの部分に始まり、黄色のひし形がツールにモデルを見つけてもらっている部分になります。そのあとモデルを検証し、そのモデルを使って実際に調べたい現在のデータを入力にして未来を予測しています。

3つほど具体例を挙げてこの「BA」を操作する時の流れを説明したいと思います。

あるECサイトのWebでのアクセス履歴と購買結果のデータがあったとします。

どのページにどれだけ滞在していたとか、どのページに飛んでいったというWeb履歴情報以外に、ユーザーの特性情報(性別・年齢・地域等)がわかっています。「BA」ツールだと、これらの沢山ある要因となるデータから、どの要因が購買に結びついたかを把握することが出来ます。これをモデルとして登録します。そして今月のWebアクセスデータを元に、どのユーザーが購買する確率が高いかを確率の高い順にリストアップすることが出来ます。確率の高い人から、背中を押すアクションを起こせば効率的な営業活動が出来るわけです。これが「BI」ツールだと、これらの情報から縦軸・横軸をユーザー側が模索しながら指定していって、傾向値のあるグラフを作るところまでで、最後の判断は人間の作業となります。

もう1つの例は、同じようなアクセス情報を「BA」ツールでは、特徴のある顧客層毎にグルーピングすることが出来ます。例えば購買頻度は低いけれど高額のものを買う層とか、低額のものをちょくちょく買う層とか、家電製品ばかりを買う層とか、「BA」ツールが勝手に特徴毎にグループを分けてくれます。次にこれらのグループ毎に、ある一定期間での売上トップ10のリストを作ることも出来ます。そこまで出来上がれば、そのグループ毎に売上トップ10でまだ買っていない商品を中心にDMを打てば購買に至る確率が高まるわけです。

3つ目の例は、ある塾で会員数減少に悩んでいたとします。離塾防止の対策をしたいのですが、何が原因で離塾していくのかわからなかったとします。「BI」ツールの場合ですと、過去のデータからありとあらゆる組み合わせでグラフを作っていき、離塾する人と相関関係のある要因を探っていくことになります。これが「BA」ツールだと、膨大な要因を含めたデータをそのままインプットすると、離塾に影響の高い要因を確率の高い順に示してくれることになります。


確率・統計なんて実利に合わない学校での勉学だと思いがちな学問でしたが、こうやって便利なツールの登場によって、理論は知らなくてもビジネスとして応用出来る時代がやってきたのです。「ビッグデータ」や「IoT」といったテクノロジーの素地と、学問を使い勝手よくしたツールを組み合わせて、よりユーザーフレンドリーな無駄のない営業活動が出来るようになって来ています。20世紀のような「足で稼げ!」的な営業活動はもう過去のものとなり、消費者にとっても「押し売り」に対して辟易するのではなく、欲しいと思っていたものがタイムリーに目の前に提示される時代の到来です。