Watson

Personality Insights

特徴

個人の心理的な特性をその個人が書いたテキスト文書から分析します。 (最低1000文字程度、SNSのつぶやきでも可)
ビッグ・ファイブ、価値、ニーズの3つの次元に分割して出力します。

想定ユースケース

個客対応型マーケティング、おすすめ商品の提示。
人と人、人と組織のマッチング。

 

画像説明
画像説明

個性(Big 5)

Openness to experience 独創的・好奇心が強い vs. 着実・警戒心が強い

Conscientiousness 手際が良い・まめな人 vs. 楽 天的・不注意

Extraversion 社交的・エネルギッシュ vs. 孤独を好む・控えめ

Agreeableness 人当たり良い・温情のある vs. 冷たい・不親切

Neuroticism 繊細・神経質 vs. 情緒安定・自信家

欲求

Kevin FordのUniversal Needs Map (欲求と社会的価値の関係)
ブランドの選択/ 商品の選択/ 職業の選択/・・・

価値観

Schwartzの価値概説

  • Self-transcendence (自己超越)
  • Conservation (保存)
  • Self-enhancement(自己高揚)
  • Open to change (変化に対する需要性)

テキストから性格を推定する仕組み

  1. 各手順を明確にし、ドキュメント化すること
  2. 業務システムの導入経験のある人材を準備すること
  3. SAP Business One の機能をよく理解した技術者を準備すること

特徴量抽出方法

特定カテゴリの表現がどの程度含まれているかを分析

日本語の性格分析に有効なカテゴリを集めたカテゴリ体系を構築

-> Japanese Category for Personality Identification(JCPI)

下記構成要素からなる約90種類のカテゴリを設定

【構成要素】

助詞(〔格助詞〕〔係助詞〕など)
字種(〔漢字〕〔カタカナ〕など)といった日本語独特カテゴリ

〔読書〕〔遊び〕〔イベント〕(などの独自カテゴリ)

心理学の世界を中心に世界中で使われているLinguistic Inquiry and Word Count (LIWC) を参考にしたカテゴリ

特徴量分析結果

サンプルデータ収集の結果、big5のそれぞれの要素と強い相関のある、特徴的な日本語表現が見つかっています。これらの特徴量を使って、機械学習モデルを構築しました。

各要素の性格値(0から1までの値を取る)の、予測値と実測値(性格分析結果)の比較を交差検定法(学習データ以外のデータで精度評価を行う)で行いました。
その結果、平均絶対誤差 (MAE) は約 0.1であることがわかっています。