2.2 プロジェクト設定
このプロジェクトに関する個別の設定を行うことができます。
メニューをクリックすることで各設定の画面に遷移します。
2.2.1 MAデータ登録
2.2.1.1 概要
テキスト文章には、1つの項目に複数の値が登録されているものが存在します。
また、値が複数の項目に渡る場合などに、複数入力できるようなフィールド設計となっているケースがあります。
このような属性項目をMA(マルチアンサー)と呼びます。MAの場合、一般的に入力データの形式は
1・0フラグ型か、同種フィールド型のいずれかになります。
通常これらのデータは、全ての列を独立して捉え、個々のフィールド単位での集計しか行ないません。
MAデータ登録することで、複数列を疑似的に1フィールドとして捉え、属性クロス分析による
各種集計やグループ作成に活用可能となります。
MA登録前は個別の列の集計結果のみ表示します。
MA登録後複数列での集計結果が表示可能となります。また、MAデータを利用したグループの作成も可能です。
|
2.2.1.2 機能詳細
2.2.2 振り分け属性設定
2.2.2.1 概要
各種のグループ作成で振り分けられた情報を、データ属性として登録することができます。
これにより、ある自由回答設問で回答した内容によって、他の自由回答設問でどのような回答をしているか、
または、問合せの内容別に回答内容の傾向をキーワード抽出するといったことが可能となります。
振り分け属性の登録方法については、
「4 グループツリー」の「振り分け属性」をご参照ください。
2.2.2.2 機能詳細
2.2.2.2.1 振り分け属性の一覧
登録されている振り分け属性名を一覧表示します。
-
◇ 新規追加
-
振り分け属性グループを新規登録します。
-
◇ 属性名
-
登録した属性名を表します。
-
◇ 削除
-
選択している振り分け属性を削除します。登録グループの一覧も全て削除されます。
-
◇ 並び替え
-
振り分け属性をドラッグして順序を移動させることができます。
2.2.2.2.2 登録グループ
振り分け属性として登録されたグループの一覧を表示します。
-
◇ 選択
-
チェックが入ったグループが振り分け属性として登録されたグループとなります。
-
◇ グループ
-
グループ名を表します。
-
振り分け属性に登録されているグループの削除
-
振り分け属性として登録されているグループは削除することが出来ません。
削除したい場合は、振り分け属性を削除してからグループの削除を行なってください。
|
2.2.2.2.3 並び替え
振り分け属性として登録されているグループの並び順を変更します。
-
◇ 所属グループ
-
登録したグループ名を表します。
列ヘッダーをクリックするとグループ名の昇順に並び替えます。再度クリックすると降順に並び替えます。
-
◇ 件数
-
登録したグループ件数を表します。
列ヘッダーをクリックするとグループ件数の昇順に並び替えます。再度クリックすると降順に並び替えます。
-
◇ 上へ
-
選択しているグループの順番を一つ上にします。
-
◇ 下へ
-
選択しているグループの順番を一つ下にします。
2.2.3 ユーザー定義スコア設定
2.2.3.1 概要
注目したい単語や係り受けをユーザー定義スコアとして登録することができます。
注目の単語や係り受けを登録する際、それぞれの単語や係り受けに対して重み付けの点数を
付けることで、テキストごとに登録単語の出現から点数付け(スコアリング)を行なうことが可能です。
スコアの定義はユーザーが自由に設定することができ、ユーザー定義スコアを利用することで、
膨大なテキストの中から注目すべきテキストを抽出することが可能となります。
ユーザー定義スコアは下記のように、様々な分析機能で利用することが可能です。
-
スコアを用いた時系列推移(時系列モニタ)
-
スコアを用いたマッピング
-
スコアを属性データとして利用したクロス分析
-
スコアを属性データとして利用したキーワード抽出
-
スコアを用いた絞込み条件が行えるデータ参照
2.2.3.2 機能詳細
2.2.4 グループツリーCSV出力
グループツリーの内容をCSV形式でファイル出力します。
[グループツリーCSV出力]リンクをクリックするとファイルのダウンロードが開始します。
-
◇ 1階層 ~ n階層
-
グループ名を表示します。
グループツリーに登録されている階層数により可変となります。
-
◇ テキスト件数
-
グループに属するテキスト件数を表示します。
-
◇ 作成条件
-
グループの作成条件を表示します。
2.2.5 インポート設定
※ プロジェクト種別が「CSV取込プロジェクト」の場合に表示します。
分析データ取り込み時の設定を行います。
-
取り込み期間を指定する
-
-
期間指定
-
データインポート時の対象データを範囲指定します。
-
直近指定
-
データインポート時の対象データを最新データからの直近で指定します。
-
未来日付のデータはインポートしない
-
チェックを入れた場合、インポートデータの未来日付のものは除外となります。
-
キーが重複したデータを更新する
-
キー項目に指定した項目の値が重複した場合に、対象データを更新します。
チェックをしない場合はキー項目の重複有無に関わらず全て追加登録します。
-
更新しないフィールドの指定
-
重複キーのデータをアップデートにチェックを入れた場合に指定出来ます。
既に取り込んでいるデータを新規データで更新する時に値を上書きさせたくない項目を指定して下さい。
-
インポート時にコード変換を行う
-
チェックを入れるとデータインポート時にコード変換も続けて行います。
2.2.6 データ削除
選択したグループに含まれるデータを完全に削除します。
確認ダイアログが表示され、「はい」を押下するとデータ削除が実行されます。
注:データを削除後、自動的に再構築を実施します。
2.2.7 コード変換
2.2.7.1 概要
プロジェクトに取り込んだフィールドの内容が、実際の値として入力されているのではなく、
コード化された値として入力されている場合に、変換をかける機能です。
2.2.7.2 機能詳細
2.2.8 再構築
編集した辞書の内容や、MAデータなどの設定を反映する場合に実行します。
再構築を実行すると、最新の辞書内容や設定を取り込みテキストの形態素解析・構文解析を行ない、
各分析・全グループを作成し直します。新規プロジェクトの作成・入替インポート時は自動的に
「再構築」が実行されます。
- ユーザ単語、同義語の候補を抽出する
-
チェックを入れると再構築時にユーザ単語、同義語の候補の抽出も行います。
2.2.9 属性設定
2.2.9.1 概要
分析に使用するテキスト属性を設定する機能です。
2.2.9.2 機能詳細
2.2.9.2.1 分析機能選択
属性比較機能の存在する分析機能がリストに表示されます。
2.2.9.2.2 テキスト属性一覧
プロジェクトに登録されたテキスト属性の一覧が表示されます。
-
表示選択チェック
-
表示対象とするテキスト属性を選択します。
-
属性名
-
テキスト属性の名称を表示します。
-
並び替え
-
テキスト属性をドラッグして表示順を変更することができます。
2.2.9.2.3 全ての分析に反映
現在選択されている分析機能の表示選択・並び順を他の分析機能にも反映します。
2.2.10 単語の非表示設定
2.2.10.1 概要
単語を非表示に設定します。
削除単語へ登録することなく非表示を行なうので、構文解析処理が不要です。
2.2.10.2 機能詳細
- 頻出単語リスト
-
単語ランキングの上位100件を表示します。
非表示設定に登録する単語をダブルクリック、または「>>」ボタンで非表示単語リストへ追加します。
- 単語入力
-
頻出単語リストに表示されていない単語を、個別に設定します。
入力セルへ単語を入力し、プルダウンリストから品詞を選択します。
「追加」ボタンで非表示単語リストへ追加されます。
- 非表示単語リスト
-
非表示設定された単語のリストを表示します。
非表示設定を解除するには、単語を選択し、削除アイコンをクリックします。
-
単語ランキング画面からの登録
-
単語をクリックし、右クリックメニュー「単語を表示しない」からも非表示単語を登録可能です。
|
2.2.11 グループ一括削除
2.2.11.1 概要
複数のグループを一括で削除できます。
2.2.11.2 機能詳細
- OK
-
選択しているグループを削除します。
- キャンセル
-
一括統合画面を閉じます。
2.2.12 特許情報分析設定
※ プロジェクト種別が「CSV取込プロジェクト」の場合に表示します。
2.2.12.1 概要
特許情報の分析に使用する設定を編集することができます。
2.2.12.2 機能詳細
2.2.12.2.1 文献番号設定
CyberPatent Deskと連係する際にキーとなる属性項目を設定します。
本項目が未設定の場合、CyberPatent Deskと連係できません。
2.2.12.2.2 特許分類項目設定
特許分類項目として使用する属性を設定します。
3. グループの作成の
3.2.5 特許分類コードで、設定した項目を使用することができます。
- IPCフィールド
-
IPCフィールドの元とする属性を設定します。
本項目を設定して登録すると、「区切」で設定した文字を区切り文字としたMAが自動登録されます。
- 筆頭IPCフィールド
-
筆頭IPCフィールドとして使用する属性を設定します。
- FIフィールド
-
FIフィールドの元とする属性を設定します。
本項目を設定して登録すると、「区切」で設定した文字を区切り文字としたMAが自動登録されます。
- Fタームフィールド
-
Fタームフィールドの元とする属性を設定します。
本項目を設定して登録すると、「区切」で設定した文字を区切り文字としたMAが自動登録されます。
- MAが自動登録されるフィールドについて
- IPCフィールド、FIフィールド、Fタームフィールドを設定すると、登録時にMAが自動登録されます。
MAの抽出には時間がかかる場合がございますので、設定登録時はご注意下さい。
また、IPCフィールド、FIフィールド、Fタームフィールドの各フィールドを条件として
作成したグループが存在する場合は各フィールドの設定を解除することができなくなります。
-
各フィールド設定時に自動登録されるMAの名前は以下の表の通りです。
- なお、自動登録されたMAは、設定を解除して登録を行った場合に自動的に削除されます。
|
2.2.13 独自分類コード設定
2.2.13.1 概要
独自の分類コードを登録することができます。
2.2.13.2 機能詳細
2.2.13.2.1 独自分類コード一覧
登録された独自分類コード一覧を表示します。
- 独自分類コード名
-
コード名を表示します。
- テキスト属性
-
設定されている属性を表示します。
- 区切り
-
設定されている区切り文字を表示します。
2.2.13.2.2 独自分類コード入力部分
独自分類コードを追加・更新します。
- 独自分類コード名
-
コード名を入力します。
- テキスト属性
-
設定可能な属性項目がリストに表示されます。
- 区切り文字
-
直接入力か、決まった区切り文字から選択することができます。
- 新規登録
-
「名前」「項目」「区切り」の内容を入力し、「追加」ボタンをクリックします。
同時にMA登録も行います。
- 登録変更
-
変更したいコードを選択します。
入力部分に表示された内容を変更し、「更新」ボタンをクリックします。
同時に同名のMAも更新します。
-
制限事項
-
・同じ名前のコードは設定できません。MAにも同名があった場合にも設定できません。
・独自分類コードを使ってグループを作成した場合、そのコードは削除できません。
また、そのコードを更新する場合は名前を変更することができません。
|
2.2.14 グループツリーCSVインポート(P5)
2.2.14.1 概要
CSVファイルをインポートしてグループを登録します。
2.2.14.2 機能詳細
TRUE TELLER パテントポートフォリオ P5の「ツリー構造を MS-Excel 形式で出力」にて
Excel形式でツリーを保存後、CSV形式で保存したCSVファイルをインポートすることができます。
なお、インポートできるグループの種別は単語、係り受け、文字列一致、
テキスト属性(CSVを出力したプロジェクトと同じ名前の属性が存在する場合のみ)、
特許分類コード(プロジェクトに特許分類項目が設定されている場合のみ)、
それらの複合条件、見出しのみです。
2.3. お気に入り
2.3.1 概要
分析結果をお気に入りに登録することで、そのときの分析設定をいつでも呼び出すことができます。
これにより、分析の度にオプションを設定する手間が省け、また他の分析者と同じ分析結果を共有することができます。
※ 旧バージョンの「スナップショット」にあたる機能です
2.3.2 機能詳細
[お気に入り]メニューをクリックすると、お気に入り一覧が表示されます。
お気に入りに追加する
-
お気に入りの登録画面を表示します。
表示内容
-
◇ タイトル
-
お気に入りのタイトルが表示されます。
-
◇ 結果データ
-
結果データの有無が表示されます。
右クリックメニュー
-
◇ 開く
-
お気に入りを実行し、分析画面に実行結果が表示されます。
-
◇ 現在のグループで開く
-
現在選択中のグループに対して保存した分析設定が実行されます。
-
◇ 結果データを最新にする
-
結果データを最新にします。
結果データを保存している場合のみ選択可能です。
-
◇ 設定変更
-
お気に入りの設定変更画面を表示します。
-
◇ 現在の表示内容で上書きします
-
現在表示している分析結果でお気に入りを上書きします。
-
◇ 削除
-
お気に入りを削除します。
ダブルクリック
お気に入りを実行し、分析画面に実行結果が表示されます。
閉じる
お気に入り一覧画面を閉じます。
2.3.3 お気に入りの追加
お気に入りに登録したい分析画面を表示した状態で、お気に入り一覧の[お気に入りに追加する]ボタンを
クリックすると、お気に入りの登録画面が表示されます。
◇ タイトル
お気に入りのタイトルを入力します。
◇ コメント
お気に入りに関するコメントを入力します。
◇ 結果データを保存する(ポータルでの利用)
お気に入り実行時にリアルタイムで分析処理を実行するのではなく、あらかじめ実行結果を蓄積しておくことができます。
お気に入りの表示速度を早くすることが可能です。
◇ キャンセル
お気に入り登録画面を閉じます。
◇ 登録
入力した内容でお気に入りを登録します。
2.3.4 お気に入りの設定変更
お気に入り一覧画面で、お気に入りを選択し、右クリックメニューの[設定変更]をクリックすると、
お気に入りの設定変更画面が表示されます。
◇ タイトル
お気に入りのタイトルを変更できます。
◇ コメント
お気に入りに関するコメントを変更できます。
◇ 結果データを保存する(ポータルでの利用)
お気に入り実行時にリアルタイムで分析処理を実行するのではなく、あらかじめ実行結果を
蓄積しておくことができます。
お気に入りの表示速度を早くすることが可能です。
◇ キャンセル
お気に入り更新画面を閉じます。
◇ 更新
入力した内容でお気に入りの設定を変更します。分析結果は更新されません。
2.3.5 お気に入りの上書き
お気に入り一覧画面で、お気に入りを選択し、右クリックメニューの[現在の表示内容で上書きします]を
クリックすると、お気に入りの上書き画面が表示されます。
◇ タイトル
お気に入りのタイトルを変更できます。
◇ コメント
お気に入りに関するコメントを変更できます。
◇ 結果データを保存する(ポータルでの利用)
お気に入り実行時にリアルタイムで分析処理を実行するのではなく、あらかじめ実行結果を蓄積しておくことができます。
お気に入りの表示速度を早くすることが可能です。
◇ キャンセル
お気に入り更新画面を閉じます。
◇ 更新
入力した内容でお気に入りを更新します。現在表示している分析結果で上書きされます。
2.3.6 他プロジェクトからインポート
お気に入り一覧画面で、「他プロジェクトからインポート」ボタンをクリックすると
プロジェクト選択画面が表示されます。
◇ プロジェクト名
選択したプロジェクトからお気に入りをインポートします。
◇ 閉じる
プロジェクト選択画面を閉じます。
2.4 タスク
2.4.1 概要
分析処理をタスクとして登録し、バックグラウンドで実行することができます。
処理に時間がかかる分析をタスク登録することで、その間、別の分析の実行が可能になります。
分析結果は、タスク一覧から表示することができます。
タスク一覧画面では、削除の操作が可能です。
2.4.2 機能詳細
[タスク]メニューをクリックすると、タスク一覧が表示されます。
2.4.2.1 分析タスク
分析タスクが表示されます。
表示内容
-
◇ ID
-
タスクIDが表示されます。
-
◇ タスク名
-
タスク名(選択グループ名-分析機能)が表示されます。
-
◇ 完了日時
-
タスクのステータス(待機中、処理中、エラー)及びタスク処理が完了した日時が表示されます。
右クリックメニュー
-
◇ 開く
-
タスクの実行結果画面を表示します。
-
◇ 削除
-
タスクを削除します。
ダブルクリック
タスクの実行結果画面が表示されます。
閉じる
タスク一覧画面を閉じます。
2.4.2.2 タスク登録
設定した分析条件でタスクを登録します。
実行中の分析もタスク登録可能です。
登録したタスクはタスク一覧の[分析タスク]タブに表示されます。
2.4.3 タスク実行結果画面
各分析タスクの実行結果が表示されます。
3. グループの作成
メイン画面の左側にある「グループツリー」は、膨大なテキストデータの中から、特定の単語や属性を含むテキストを
抽出してグループを作り、階層的にテキストを分類するために使用します。
また、グループツリー上のグループを選択することで、選択されたグループを対象にして各種の分析を行なうことが
可能となります。
3.1 グループの作成
グループを作成したい場所を選択し、下記のいずれかの方法で新規グループ作成画面を起動します。
-
◇ 「グループ作成」ボタンからランチャーを起動し、一覧から選択
-
-
◇ 「グループ作成」ボタンのプルダウンから選択
-
-
◇ 右クリックメニューから選択
-
各グループの作成方法は以下をご参照ください。
3.2 通常グループの作成
通常グループを作成します。
1.抽出条件を選択します。
2.抽出条件毎の設定を行います。
詳細の設定方法は以下をご参照ください。
3.グループ設定を行います。
必要項目を入力し、[完了]ボタンをクリックすると、グループが作成されます。
-
◇ グループの名称
-
グループ名称を入力します。
※一括で複数のグループを作成する場合、指定した項目名で自動作成されます。
-
◇ 解析対象とするテキストフィールド
-
分析機能の実行対象とするテキストフィールドを選択することが可能です。
※複数のテキストフィールドがある場合に表示されます
-
◇ 上位グループを同時に作成する
-
作成されるグループの上位に見出し用のグループを同時作成することができます。
上位グループは、ラベル、排他ラベル、合算グループから選択することができます。
-
◇ 統計値は算出しない
-
統計値を算出せずにグループを作成することができます。
※統計値が無いグループの配下に新たにグループを作成する場合はデフォルトONになります。
◇統計値とは
- 単語、属性値の件数やスコアの事を指します。
◇統計値を算出しないメリット
- グループ作成、インポートの際に処理時間が短縮されます。
テキストは抽出されますが、ランキングのカウント等は算出されません。
◇統計値を算出しないデメリット
- ①以下の分析機能が制限されます。
・ランキング
・キーワード抽出
・時系列分析 ※系列:単語の場合
・アラート分析
・特徴マップ
・話題の広がり
・マッピング ※プロット:単語プロット、係り受けプロットの場合
②統計値を算出していないグループの配下に機械学習グループを作成することができません。
※統計値を算出していないグループの統計値を算出したい場合には、
右クリックメニューの「統計値を再算出」やグループ編集画面から算出することができます。
※統計値を算出しない設定はデータの振り分けだけを行うグループに設定すると有効です。
|
3.2.1 単語・係り受けの有無
抽出条件の種類を「単語・係り受けの有無」に指定すると、単語や係り受けを条件にグループを作成することができます。
条件とする単語を直接入力するか、単語リスト・係り受けリストから選択して「>>」ボタンで抽出条件へ追加します。
単語と係り受けの条件は同時に設定することができます。
- ◇ 単語
-
-
◇ 単語リスト
-
出現件数の高い順に単語ランキングを表示します。
選択して「>>」ボタンか、ダブルクリックで抽出条件へ追加することができます。
CtrlキーやShiftキーを押しながら複数選択することができます。
-
◇ リストの設定
-
作成したプロジェクトのテキスト解析フィールドが2項目以上選択している場合に表示します。
後述する3.2.1.1 リストの設定で選択したテキスト解析フィールド項目にある文章の中で
出現件数の高い順に単語ランキングを単語リストに表示します。
-
◇ 単語を追加する
-
単語を入力し、「+」ボタン、またはEnterキー押下で条件へ追加できます。
否定チェック時は、否定単語として登録されます。
一致条件を任意で指定することもできます。
一致条件 … 指定した文字列が部分的に一致する単語を抽出対象とすることができます
- ◇ 係り受け
-
◇ 係り受けリスト
-
出現件数の高い順に係り受けランキングを表示します。
選択して「>>」ボタンか、ダブルクリックで抽出条件へ追加することができます。
CtrlキーやShiftキーを押しながら複数選択することができます。
-
◇ リストの設定
-
作成したプロジェクトのテキスト解析フィールドが2項目以上選択している場合に表示します。
後述する3.2.1.1 リストの設定で選択したテキスト解析フィールド項目にある文章の中で
出現件数の高い順に係り受けランキングを係り受けリストに表示します。
-
◇ 係り受けを追加する
-
単語1、単語2を入力し、「+」ボタン、またはEnterキー押下で条件へ追加できます。
否定チェック時は、否定単語として登録されます。
一致条件を任意で指定することもできます。
一致条件 … 指定した文字列が部分的に一致する単語を抽出対象とすることができます
-
◇ 抽出条件 / 除外条件
-
グループに含める単語(係り受け)/除外する単語(係り受け)を同時に条件として指定することができます。
-
◇ CSVアップロード/ダウンロード
-
CSV形式ファイルを使用して抽出条件、除外条件の設定が可能です。
-
◇ いずれかを含む(OR) / 全てを含む(AND)
-
複数の単語(係り受け)を指定した場合、いずれかの単語(係り受け)を含む文章の抽出を行うか、全ての単語(係り受け)を含む文章の抽出を行うかを指定します。
-
◇ 連想語辞書
-
抽出/除外条件で単語を選択した場合に、選択した単語から連想される単語の一覧を表示します。
リスト上で単語をクリックすることで指定した設定先に追加します。
- ◇ 設定先
-
- 検索条件
- 単語リスト/係り受けリストの検索条件に、選択した連想語を設定します。
- 抽出条件
- 抽出条件/除外条件に、選択した連想語を追加します。
- ◇ 技術分野
-
技術分野に関連する連想語に絞り込むことが可能です。
日本語プロジェクトの場合に指定可能です。
-
◇ 選択項目毎に個別でグループを作成する
-
チェックすると条件に追加した単語(係り受け)ごとにグループを一括作成します。
3.2.1.1 リストの設定
単語リスト、係り受けリストに表示するランキングに使用するテキスト解析フィールドを選択します。
-
◇ フィールド名
-
ランキングに使用する単一、又は選択グループのテキスト解析フィールドを選択します。
[選択グループのテキストフィールド]を選択した場合、選択グループを作成した際に
3.2 通常グループの作成などで選択した「解析対象とするテキストフィールド」となります。
3.2.3 文字列一致
抽出条件の種類を「文字列一致」に指定すると、任意の文字列を条件にしてグループを作成することができます。
単語や係り受けで指定できない文字列を抽出条件としたい場合に利用します。
-
◇ NOT条件
-
指定した条件のNOT条件でグループを作成します。
-
◇ 文字列一致
-
入力文字列は、改行までが一つの条件となり、入力した文字列は「部分一致」で抽出されます。
-
◇ いずれかを含む(OR) / 全てを含む(AND)
-
複数の文字列を入力した場合に、入力文字列のいずれかを含む文章の抽出を行うか、全てを含む文章の抽出を行うかを設定します。
3.2.4 ユーザ定義スコア
抽出条件の種類を「ユーザ定義スコア」に指定すると、選択したユーザー定義スコアを条件に設定することができます。
設定したユーザ定義スコアに基づいて解析されたグループを作成します。
-
◇ NOT条件
-
指定した条件のNOT条件でグループを作成します。
-
ユーザ定義スコア
-
使用するユーザ定義スコアを選択します。
-
スコア値条件
-
抽出対象とするスコア定義のスコアに対する検索条件を設定します。
-
◇ 等号・不等号条件
-
スコアに対する等号・不等号条件を選択します。
-
◇ スコア条件
-
スコアに対する値の条件を設定します。
3.2.5 特許分類コード
抽出条件の種類を「特許分類コード」に指定すると、特許分類項目を用いた条件を設定することができます。
-
◇ 属性項目
-
属性項目を選択します。
-
◇ 分類タイプ
-
「IPC」、「FI」、「Fターム」「ユーザ登録」を選択します。
選択すると桁数指定が変更されます。
-
◇ 桁数指定
-
指定した属性項目の値を上位○桁で自動分類されたグループが一覧に表示されます。
-
◇ 集計結果一覧
-
グループを選択し「>>」ボタンで条件へ追加できます。
名称/件数の列ヘッダーをクリックすることで並び替えることも出来ます。
また、文字列一致で検索することも出来ます。
-
◇ リストに追加
-
入力セルへ値を入力し、プルダウンリストから一致条件を入力して「追加」ボタンで条件へ追加できます。
-
◇ いずれかを含む(OR) / 全てを含む(AND)
-
複数の属性を指定した場合に、属性のいずれかを含む文章の抽出を行うか、
全てを含む文章の抽出を行うかを設定します。
-
◇ 選択項目毎に個別でグループを作成する
-
チェックすると条件に指定した項目ごとにグループを作成します。
3.3 合算グループを作成
直下に所属するグループに含まれるデータを自動的に合算(OR)して抽出します。
直下の小分類をまとめあげて大分類を自動作成したいときなどに利用します。
-
◇ 合算グループの名称
-
合算グループの名称を入力します。
-
◇ 解析対象とするテキストフィールド
-
分析の対象とするテキストフィールドを指定します。
※複数のテキストフィールドがある場合に表示されます。
-
◇ 統計値は算出しない
-
統計値の算出有無を設定します。
※統計値が無いグループの配下に新たにグループを作成する場合はデフォルトONになります。
3.4 etcグループを作成
選択されたグループ内のどの子グループにも含まれないデータを排他的に抽出します。
主なグループを作成した後に、そのいずれにも含まれないデータを抽出することで、
新たな話題、少数派の意見などを把握することができます。
-
◇ etcグループの名称
-
etcグループの名称を入力します。
-
◇ 解析対象とするテキストフィールド
-
分析の対象とするテキストフィールドを指定します。
※複数のテキストフィールドがある場合に表示されます。
-
◇ 統計値は算出しない
-
統計値の算出有無を設定します。
※統計値が無いグループの配下に新たにグループを作成する場合はデフォルトONになります。
3.5 機械学習グループを作成
機械学習のアルゴリズムを利用して、データを分類することができます。
グループに所属する教師データの相対的な特徴を学習し、より傾向が近いグループにテキストを分類します。
※本機能は傾向の比較による分類のため、分類グループが2つ以上必要です。
1.機械学習の種類を選択します
-
◇ 教師データなし(クラスタリング)
-
正解データを使わず、単語の出現傾向からCyberPatent Desk テキストマイニングが分割ポイントを自動的に決定し、分類を行います。
-
◇ トピックモデル
-
トピックモデルを用いたクラスタリングを行います。
-
◇ k平均法
-
k平均法を用いたクラスタリングを行います。
2階層まで同時に作成できます。
-
◇ 教師データあり
-
分類グループ名を入力し、「+」ボタンまたはEnterキー押下で分類グループへ追加できます。
-
◇ ナイーブベイズ
-
ナイーブベイズという分類手法を用いた学習分類を行います。
2.機械学習の種類毎の条件を設定します
各種類ごとの作成方法は以下をご参照ください。
3.5.1 トピックモデルで機械学習グループを作成
トピックモデルで分類してグループを作成します。
1.分類条件の設定
-
◇ 作成する分類グループ数
-
分類する数を指定します。2~100までの整数で指定します。
-
◇ 基準単語の指定方法
-
分類条件に使用する単語の指定方法を選択します。
-
◇ 上位単語を使用する
-
利用する品詞で選択した品詞の出現件数が高い単語を指定件数分使用します。
-
◇ 個別に単語を指定する
-
後述する3.5.1.1 単語指定で使用する単語を直接選択します。
-
◇ その他グループを同時に作成する
-
分類結果に加えてその他グループを同時に作成するかを選択します。
分類されなかったテキストが格納されます
-
◇ グループ内の特徴的な単語を分類グループ名にする
-
分類結果からグループ名を付けるかどうかを選択します。
2.機械学習グループの設定
-
◇ 解析対象とするテキストフィールド
-
分析の対象とするテキストフィールドを指定します。
※複数のテキストフィールドがある場合に表示されます。
-
◇ 機械学習グループの名称
-
機械学習グループの見出しとなる名称を入力します。
3.5.1.1 単語指定
分類条件に使用する単語を選択します。
-
◇ 単語リスト
-
出現件数の高い順に上位300件の単語ランキングを表示します。
チェックを入れてOKボタンをクリックすると、使用単語に追加できます
-
◇ リストの設定
-
作成したプロジェクトのテキスト解析フィールドが2項目以上選択している場合に表示します。
後述する3.5.1.2 リストの設定で選択したテキスト解析フィールド項目にある文章の中で
出現件数の高い順に上位300件の単語ランキングを単語リストに表示します。
-
◇ 全選択(ページ内)
-
単語リストの表示されているページを全て選択します。
-
◇ 全解除(ページ内)
-
単語リストの表示されているページの選択をすべて解除します。
3.5.1.2 リストの設定画面
単語リストに表示するランキングに使用するテキスト解析フィールドを選択します。
-
◇ フィールド名
-
ランキングに使用する単一、又は選択グループのテキスト解析フィールドを選択します。
[選択グループのテキストフィールド]を選択した場合、選択グループを作成した際に
3.2 通常グループの作成などで選択した「解析対象とするテキストフィールド」となります。
3.5.2 k平均法で機械学習グループを作成(1階層)
k平均法で分類してグループを作成します。
1.分類条件の設定
-
◇ 作成する分類グループ数
-
分類する数を指定します。2~100までの整数で指定します。
-
◇ 基準単語の指定方法
-
単語の指定方法を選択します。
-
◇ 上位単語を使用する
-
利用する品詞で選択した品詞の出現件数が高い単語を指定件数分使用します。
-
◇ 個別に単語を指定する
-
先述の3.5.1.1 単語指定で使用する単語を直接選択します。
-
◇ その他グループを同時に作成する
-
分類結果に加えてその他グループを同時に作成するかを選択します。
分類されなかったテキストが格納されます
-
◇ グループ内の特徴的な単語を分類グループ名にする
-
分類結果からグループ名を付けるかどうかを選択します。
2.グループの設定
-
◇ 解析対象とするテキストフィールド
-
分析の対象とするテキストフィールドを指定します。
※複数のテキストフィールドがある場合に表示されます。
-
◇ 上位ラベルを同時に作成する
-
作成されるグループの上位に見出し用のラベルを同時作成することができます。
3.5.3 k平均法で機械学習グループを作成(2階層)
k平均法で分類してグループを作成します。
さらに分類結果のグループに対してk平均法での分類を実行してグループを作成します。
1.分類条件の設定
- ◇ 1階層目
-
1階層目の分類条件を設定します。
-
◇ 作成する分類グループ数
-
分類する数を指定します。2~100までの整数で指定します。
-
◇ 基準単語の指定方法
-
単語の指定方法を選択します。
-
◇ 上位単語を使用する
-
利用する品詞で選択した品詞の出現件数が高い単語を指定件数分使用します。
-
◇ 個別に単語を指定する
-
先述の3.5.1.1 単語指定で使用する単語を直接選択します。
-
◇ その他グループを同時に作成する
-
分類結果に加えてその他グループを同時に作成するかを選択します。
分類されなかったテキストが格納されます
-
◇ グループ内の特徴的な単語を分類グループ名にする
-
分類結果からグループ名を付けるかどうかを選択します。
- ◇ 2階層目
-
2階層目の分類条件を設定します。
-
◇ 作成する分類グループ数
-
分類する数を指定します。2~100までの整数で指定します。
-
◇ 基準単語の指定方法
-
利用する品詞で指定した品詞から出現件数の高い順に指定した件数を分類条件の作成に使用します。
-
◇ その他グループを同時に作成する
-
分類結果に加えてその他グループを同時に作成するかを選択します。
分類されなかったテキストが格納されます
-
◇ グループ内の特徴的な単語を分類グループ名にする
-
分類結果からグループ名を付けるかどうかを選択します。
2.グループの設定
-
◇ 解析対象とするテキストフィールド
-
分析の対象とするテキストフィールドを指定します。
※複数のテキストフィールドがある場合に表示されます。
-
◇ 上位ラベルを同時に作成する
-
作成されるグループの上位に見出し用のラベルを同時作成することができます。
3.5.4 ナイーブベイズで機械学習グループを作成
ナイーブベイズで分類してグループを作成します。
1.分類グループの設定
-
◇ 分類グループを追加する
-
分類グループ名を入力し、「+」ボタンまたはEnterキー押下で分類グループへ追加できます。
-
◇ テキスト属性から分類グループを自動作成し、同時に教師データとして登録する
-
選択したテキスト属性から分類グループを自動で作成します。
選択した属性をもつデータは、同時に教師データとして登録されます。
プロジェクト内に正解データが存在する場合に便利な機能です。
2.分類手法および機械学習グループ名の設定
-
◇ 分類手法
-
機械学習のアルゴリズムを選択します。
-
◇ 優位度
-
分類実行の閾値とする優位度を入力します。
優位度とは「分類候補上位2グループ間の対数尤度差」を表す値で、分類対象テキストごとに算出されます。
この値が大きければ大きいほど分類の確度が高いことを示します。
-
◇ 学習に使用する単語
-
学習に使用する単語数を入力します。
-
◇ 解析対象とするテキストフィールド
-
分析の対象とするテキストフィールドを指定します。
※複数のテキストフィールドがある場合に表示されます。
-
◇ 機械学習グループの名称
-
機械学習グループの見出しとなる名称を入力します。
-
◇ 統計値は算出しない
-
統計値の算出有無を設定します。
3.6 ラベルを作成
ラベルはグループツリーを整理するための見出しとして使用します。
各分析機能の「グループ比較」表示をする際にはラベルを作成しておくと便利です。
ラベルには上位のグループに含まれる全データがそのまま引き継がれて所属します。
-
◇ ラベルの名称
-
ラベルの名称を入力します。
-
◇ 解析対象とするテキストフィールド
-
分析の対象とするテキストフィールドを指定します。
※複数のテキストフィールドがある場合に表示されます。
-
◇ 統計値は算出しない
-
統計値の算出有無を設定します。
※統計値が無いグループの配下に新たにラベルを作成する場合はデフォルトONになります。
3.7 排他ラベルを作成
直下に所属するグループを互いに排他的にすることができます。
排他グループ直下では、並び順で上位のものに優先的にデータが分類され、一度分類されたデータはそれ以下のグループには分類されません。
どれかひとつのグループにデータを所属させたい場合などに便利です。
-
◇ 排他ラベルの名称
-
排他ラベルの名称を入力します。
-
◇ 解析対象とするテキストフィールド
-
分析の対象とするテキストフィールドを指定します。
※複数のテキストフィールドがある場合に表示されます。
-
◇ 統計値は算出しない
-
統計値の算出有無を設定します。
※統計値が無いグループの配下に新たにラベルを作成する場合はデフォルトONになります。
4. グループツリー
グループツリー上で任意のグループを右クリックすると、コンテクストメニューが表示されます。
4.1 グループ作成
4.2 グループ編集
4.3 グループ名変更
4.4 統計値を再算出
選択したグループの統計値を再算出します。
-
◇ 選択グループ
-
選択グループのみ統計値を算出します
-
◇ 下位グループ(選択グループを含む)
-
選択グループおよび下位階層のグループの統計値を算出します
-
[統計値再算出の制限]
-
・親分類グループ(機械学習 教師データなし)の統計値を再算出することはできません。
-
・分類グループ(機械学習 教師データなし)の統計値を再算出することはできません。
|
4.5 グループのコピー・貼り付け
既に作成済みのグループの作成条件をコピーして、別のグループの配下に同一条件のグループを作成することが可能です。
グループを選択し、右クリックメニュー「コピー」からコピー条件を選択します。
その後、コピー先グループを選択し、右クリックメニュー「貼り付け」を実行するとコピーが完了します。
-
◇ グループをコピー
-
選択グループおよび下位階層のグループをコピーします。
◇ 選択グループのみコピー
-
選択グループのみをコピーします。
◇ 下位グループのみコピー
-
選択グループの下位グループのみをコピーします。
-
◇ 貼り付け
-
コピーしたグループを選択グループに貼り付けます。
解析対象フィールドが複数存在する場合、以下の画面が表示されます。
◇ 解析対象フィールド設定を維持する
-
ONにした場合、コピー元のグループに設定した解析対象フィールド設定を保持して貼り付けします。
OFFにした場合、コピー先の解析対象フィールド設定を引き継ぎます。
-
[グループのコピーの制限]
-
・分類グループ(機械学習)をコピーすることはできません
-
・未分類グループ(機械学習)をコピーすることはできません。
-
[グループの貼り付けの制限]
-
・「機械学習グループ」配下に対して貼り付けは実行できません。
|
4.6 削除
グループを右クリックして「削除」を選択すると、グループ削除の確認ダイアログが出ます。
OKをクリックすると該当グループは削除されます。
4.7 グループの移動と統合
|
|
グループをドラッグして順序を移動させることができます。 |
|
|
グループをドラッグして他のグループに重ね合わせることで、グループを
統合することができます。
上記のダイアログでOKをクリックすると、グループが統合されます。
「統合後に[統合元グループ名]を削除する」にチェックを入れると、
統合後に統合元のグループが削除されます |
-
[グループの移動の制限]
-
・別階層にドラッグした場合、グループは移動ではなくコピーされます。
-
[グループの統合の制限]
-
・「通常グループ」のみ統合可能です。
・統合後は、「通常グループ(複合条件)」に変更されます。
・統合先が「複合条件」の場合は、抽出条件は統合先から引き継ぎます。
・統合先が「単一条件」の場合は、抽出条件は統合元から引き継ぎます。
・両方とも「単一条件」の場合は、抽出条件は OR に統一されます。
|
4.8 他プロジェクトからツリーをインポート
他のプロジェクトのグループ作成情報をインポートすることができます。
「選択グループ以下に別プロジェクトのグループをインポート」を選択するとプロジェクト選択を表示します。
1.プロジェクト選択画面でグループを取り込むプロジェクトを選択します。
2.取り込むグループを選択します。
-
◇ 選択グループとその下位グループすべて
-
選択グループと、下位階層のグループ作成条件が全てコピーされます。
-
◇ 選択グループのみ(下位グループを含まない)
-
選択グループのグループ作成条件が全てコピーされます。
-
◇ 下位グループのみ(選択グループを含まない)
-
選択グループ自体はコピーせず、選択グループの下位階層グループがコピー対象になります。
-
◇ コピー元の解析対象フィールド設定を引き継ぐ
-
コピー元の解析対象フィールドをすべて内包している場合に設定可能です。
ONの場合、コピー元の解析対象フィールド設定を維持してインポートします。
OFFの場合、コピー先の解析対象フィールド設定をセットします。
-
制限事項
-
取り込む対象のグループ作成条件が、テキスト属性やMAグループ等の場合、
実行中のプロジェクトにも同一の属性が存在する必要があります。
同じデータ形式で複数のプロジェクトを作成する場合(商品別等)、1つのプロジェクトにグループを作成し、
当機能で別プロジェクトへグループをコピーすると効率的です。
|
4.9 振り分け属性に登録
選択グループを振り分け属性に登録します。
-
◇ 選択グループのみ登録
-
選択しているグループを個別に属性化します。
-
◇ 下位グループを一括登録
-
選択している下位階層のグループを属性化します。
属性名を選択し[OK]ボタンをクリックします。
|
|
属性を新規に作成する場合は、属性登録画面にて「属性を新規作成」をクリックし、
新規に登録する属性名称を入力し、「OK」ボタンをクリックします。
|
4.10 選択グループに他グループを統合する
選択グループに複数のグループを一括で統合できます。
「選択グループに他グループを統合する」を選択すると一括統合画面を表示します。
-
◇ OK
-
選択しているグループを統合します。
「統合後に統合元グループを削除する」が選択されている場合は
統合完了後に選択しているグループが削除されます。
-
◇ キャンセル
-
一括統合画面を閉じます。
4.11 グループ所属情報エクスポート
選択グループに属するデータ内容をCSV形式でファイルに出力します。
出力したCSVは、CyberPatent Deskの社内分類機能へのアップロードに利用できます。
-
◇ 出願番号
-
特許情報分析設定で設定した属性項目の値を出力します。
-
◇ アップロードする組織
-
空を出力します。
-
◇ アップロードする社内分類
-
グループ名を「>」区切りで出力します。
4.12 上へ/下へ/並べ替え
選択グループ、または選択グループの子グループの並び順を変更できます。
-
◇ 上へ/下へ
-
選択したグループを同一階層内で一つ上/一つ下に移動します。
-
◇ 並べ替え
-
選択したグループの子グループを並べ替えます。
並び順は名前の昇順/降順、テキスト件数の昇順/降順より選択することができます。
4.13 このグループの文献情報を表示
-
◇ 一覧表示で表示する
-
選択グループに属する文献情報でCyberPatent Deskの一覧表示画面を表示します。
-
◇ 公報めくりで表示する
-
選択グループに属する文献情報でCyberPatent Deskのめくり画面を表示します。