Nomolytics
Nomolyticsの概要
Nomolyticsとは、Narrative Orchestration Modeling Analyticsの略で、従来のテキストマイニングにクラスタリング技術のPLSA(確率的潜在意味解析)とモデリング技術のベイジアンネットワークという2つの人工知能技術を組み合わせたテキストデータの新しい分析技術です(特許登録済:特許第6085888号)。
Nomolyticsでは、まず従来のテキストマイニングによりテキストデータの文章に含まれる単語を抽出し、それぞれの単語が同時に出現する頻度をデータ化した共起行列を作成します。次にその共起行列をインプットにPLSAを適用し、使われ方の似ている単語をトピックにまとめ上げます。そして全テキストデータに対してどのトピックがどれくらい該当するのかという重みを計算し、テキストデータをいくつかのトピックによって説明可能にします。このトピックの重み情報に他の属性情報を紐づけたデータを作成し、そのデータを用いてトピックを属性別に集計することで、各属性の傾向をトピックをベースに把握できます。最後にこのトピックのデータをインプットとしてベイジアンネットワークを適用することで、トピックや他の属性情報との間に潜む確率的な因果関係をモデル化します。その確率モデルを用いることで、各要因が他の要因に与える影響を確率的にシミュレーションします。
このようにNomolyticsでは、膨大なテキストデータをいくつかのトピックに変換して解釈を容易にし、またテキスト情報内に潜む要因関係をモデル化することで、テキストデータからビジネスアクションに有用な特徴を把握することを支援します。
なお、Nomolyticsの技術(特許第6085888号)は弊社代表の野守耕爾が有限責任監査法人トーマツに所属しているときに出願・登録をしたものであり、現在その特許権利は弊社と有限責任監査法人トーマツで保有しています。
Nomolyticsのメリット
Nomolyticsにより、従来のテキストマイニングのように膨大なテキストデータを膨大な単語から解釈するのではなく、いくつかのトピックという人間が理解しやすい形に整理して解釈できます。そしてベイジアンネットワークによってそのトピックや他の属性情報との関係をモデル化することで、テキスト情報内に潜む要因関係を可視化することができ、例えばアンケートの顧客満足度に寄与する自由記述のトピックにはどのようなものがあるのか、コールセンターで抑制したい問い合わせトピックの発生に寄与する属性要因にはどのようなものがあるのかなど、施策に重要なキードライバーの発見も期待できます。
また、従来のテキストマイニングは基本的にこのテキストデータではこのような記述傾向があるという現状を把握する手法になりますので、仮にこの現状から何か条件が変わったらそれに伴って結果がどのように変化するのかというシミュレーションをすることはできません。これに対してNomolyticsではベイジアンネットワークで構築した確率モデルを用いることでこの変化に伴うシミュレーションを実行できます。例えば、口コミで話題にされるトピックによって口コミ得点がどのように変化するのか、消費者属性や製品属性によってコールセンターのある問い合わせの起こりやすさがどのように変化するのかといった、各要因の条件を変化させたときの他の要因の結果の挙動を確率的にシミュレーションできますし、逆にその結果の発生確率を最大化、最小化するような各要因の条件も発見することができます。従来の現状把握に留まるテキストマイニングでは、分析結果から何かビジネスアクションを検討しようとしても、そのアクションによってどのような結果になりうるのか効果を評価しづらいですが、Nomolyticsではこれを確率的にシミュレーションすることができます。
Nomolyticsによる特許分析事例のダウンロード(4931KB)
Nomolyticsを適用した弊社の特許分析サービスの紹介資料のダウンロード(2511KB)
有限責任監査法人トーマツ所属時のNomolytics関連資料はこちら
- 温泉地の口コミデータ分析の論文(2016年)
- 温泉地の口コミデータ分析のセミナー公開資料(2016年)
- ホテルの口コミデータ分析の論文(2014年)
- ホテルの口コミデータ分析のセミナー公開資料(2014年)