各列ヘッダーをクリックするとソート(降順/昇順)ができます。 |
同義語・同義係り受け・削除単語の詳細は2.1 辞書管理をご参照ください。 |
各列ヘッダーをクリックするとソート(降順/昇順)ができます。 |
偏りスコアについてキーワード抽出で使用するスコアは、単語(係り受け)の出現数が対象グループにおいてどの程度偏っているかを表しています。特徴マップやホットスポットと同様、カイ2乗値を利用したクラメールの連関係数(V)により、確率分布中央(期待値)からのずれ(偏差)を数値化しており、偏りがない場合は0、偏りが最大のときは1をとります。 例として、グループyにおける単語wのスコアを算出する場合は、以下の計算式となります。
①カイ2乗値(Χ2)の計算 偏りスコア = V ad - bc < 0 のとき 偏りスコア = V * -1 ※a b c d の値の何れかが5以下の場合、イェーツの補正処理が入ります。 その為、補正処理の該当ケースでは上記偏りスコアの計算値と異なる場合があります。 |
同義語・同義係り受け・削除単語の詳細は2.1 辞書管理をご参照ください。 |
|
||
横棒グラフ | 縦棒グラフ | 円グラフ |
横帯グラフ | 縦帯グラフ | マトリックス |
ヒートマップ | ||
分析軸に選択できるデータの種類
|
ホットスポットで使用するスコアについてホットスポットで使用するスコアは、属性値の出現数が対象グループにおいてどの程度偏っているかを表しています。キーワード抽出や特徴マップと同様、カイ2乗値を利用したクラメールの連関係数(V)により、確率分布中央(期待値)からのずれ(偏差)を数値化しており、偏りがない場合は0、偏りが最大のときは1をとります。 例として、選択グループyにおける属性値tのスコアを算出する場合は、以下の計算式となります。
①カイ2乗値(Χ2)の計算 偏りスコア = V ad - bc < 0 のとき 偏りスコア = V * -1 ※a b c d の値の何れかが5以下の場合、イェーツの補正処理が入ります。 その為、補正処理の該当ケースでは上記偏りスコアの計算値と異なる場合があります。 |
|
属性クロス分析では、いくつか表示方法が変わります。前述でふれたグラフ表示以外に、分析データにより 下図のようなグラフが表示される場合があります。 |
|
箱ひげグラフ |
連続データ(数値データ、年齢、価格等)の場合は、 最大、最小といった統計値を箱ひげグラフにて表示します。 上端が最大値、下端が最小値を表します。 |
|
||
折れ線グラフ | 棒グラフ | 帯グラフ |
|
|
|
名詞のみの単語(または係り受け)ランキング上位 300件が表示されます。マッピングに利用する単語(または係り受け)に チェックを付け、[OK]ボタンをクリックしてください。
|
|
「属性指定」に指定できるデータ型は数値型の属性のみです。 |
|
|
|
等高線表示をしている時に、サーモグラフの任意の場所をクリックすることでテキスト抽出が行えます。 |
|
|
[等高線の内部] 選択した等高線より内側にあるテキストを全て抽出します。 [選択付近] オプションで設定した範囲に入るテキストを抽出します。 |
|
|
特徴マップで使用するスコアについて特徴マップで使用するスコアは、属性値の出現数が対象グループにおいてどの程度偏っているかを表しています。キーワード抽出やホットスポットと同様、カイ2乗値を利用したクラメールの連関係数(V)により、確率分布中央(期待値)からのずれ(偏差)を数値化しており、偏りがない場合は0、偏りが最大のときは1をとります。 例として、グループyにおける属性値tのスコアを算出する場合は、以下の計算式となります。
①カイ2乗値(Χ2)の計算 偏りスコア = V ad - bc < 0 のとき 偏りスコア = V * -1 その為、補正処理の該当ケースでは上記偏りスコアの計算値と異なる場合があります。 |
テキスト本文 |
教師データ1 |
教師データ2 |
教師データ3 |
|