分析コラム
分析手法の解説
テキストマイニング
テキストマイニングは、テキストデータに記述されている内容の特徴や傾向を把握するための手法です。テキストデータの文書情報に含まれる単語を抽出し、その出現頻度を集計したり統計解析を実行することで、単語を軸にデータの傾向を可視化します。
PLSA(確率的潜在意味解析)
PLSA (確率的潜在意味解析)は、行列データの行の要素xと列の要素yの背後にある共通特徴となる潜在クラスzを抽出する手法です。自然言語処理の領域ではトピックモデルと呼ばれる手法の一つですが、データクラスタリングの手法としても適用されます。
ベイジアンネットワーク
ベイジアンネットワークは、複数の変数の確率的な因果関係をネットワーク構造で表すモデリング手法です。それぞれの変数の関係の強さを条件付確率で表現し、ある変数の状態を条件として与えたときの他の変数の起こり得る確率を推論することができます。
決定木
決定木は、特定の特徴がよく現れるようなデータのかたまりを見つけ、その分類ルールを木構造で探索するデータマイニング手法です。データクラスタリングや予測モデリング、要因関係の可視化など、様々な分析目的で適用できるとても便利な分析手法です。