この記事では次の内容について説明します:
センチメント概要
センチメントは、ある状況や出来事、意見に対する見方や態度と定義されています。
センチメント分析は、テキストを分析してその意見を決定します。 その上でその意見には、「ポジティブ」(肯定的)、または「ネガティブ」(否定的)といったラベルが付けられます。これを極性と呼びます。
総合的な極性スコアに基づいて、文書全体のセンチメントが「ポジティブ」、「ネガティブ」、または「ニュートラル」(中立)のいずれかに決定されます。ポジティブとネガティブの両方があり、よりポジティブであれば、極性スコアはポジティブとしてランク付けされます。
Meltwaterがセンチメントを決定する方法
当社のセンチメントモデルは、世界クラスの深層学習
アーキテクチャであるトランスフォーマーテクノロジーを活用しています。トランスフォーマーベースのセンチメントモデルは、自然言語処理の分野で最高の精度スコアを誇ります。
当社の最新モデルには、特に高レベルの精度を確保するための機能が組み込まれています。
注意機構 - テキスト内の最も重要で関連性のある単語に焦点を当てて理解を導き出します。
例えば、「ウィンドウ(window)を閉じるためにマウスをクリックしました」といった文では、「クリック」という単語に注意を払うと、ここでの「マウス」は動物ではなくコンピューターのアクセサリを指しており、「ウインドウ」は家にある窓の意味ではなくコンピュータのブラウザウィンドウを指していることを、モデルは理解できるようになります。
「注意」を人間に当てはめて考えてみましょう。誰かの話を聞いたり文章を読んだりするとき、意味を引き出して理解するために、私たちは無意識のうちに最も重要な単語に集中します。
文ベースの埋め込み - 当社の新しいモデルは、Google(BERT) によって構築された事前トレーニング済みのオープンソースモデルを応用しています。旧モデルが単語をベクトルとして表現するのに対し、BERTは文全体をベクトルとして表現するため、この当社のモデルでは、複数の意味を持つ単語を処理することが可能です。例えば、「mouse」です。他の例を次に示します。
Meltwaterのセンチメント
センチメントは特定の記事、またはSNS投稿の全体的なセンチメントを示します。これは、各結果を見て、メッセージのトーンをポジティブ・ネガティブ・ニュートラル・評価なしのいずれかに集約するものです。これらは、当社の自然言語処理(Natural Language Processing/NLP)アルゴリズムから得られたものです。こうして結果にコンテキストを与えることで、自社ブランドや気になる話題の全体的なトーンを把握することができます。
242の言語に対して言語検出をサポートし、218の言語と方言に対して完全なセンチメント分析を提供します。
以下は、Meltwaterでのセンチメント利用の例です。
ポジティブ(肯定的):ここでは、ユーザーがCoca-Colaのキャンペーンが好きだと表明しています。
ネガティブ(否定的):このユーザーは、Coca-Colaの味に対してネガティブな感情を抱いています。
ニュートラル(中立):このユーザーは、Coca-Colaのコレクターとしての事実を、感情を込めずに述べているに過ぎません。
ここで、少し難しい問題があります。自然言語処理とセンチメント分析の精度は高いものの、完璧ではありません。スラング、皮肉、推論、暗黙の了解などの要素によって、センチメントの受け止め方は人によって違います。同じメッセージを見ていても、センチメントは人それぞれ違うこともあります!その例を見てみましょう:
このユーザーはPepsiが好きだと言っていますが、これはPepsiにとってポジティブな意見です。
また、PepsiよりもCoca-Colaの方が好きだという意見もありました。その場合、Coca-Colaにとってはポジティブで、Pepsiにとってはネガティブです。でも、彼らはPepsiも好きだと言っていたので、やはりPepsiにとってはポジティブなのでしょうか?
このユーザーはPepsiとCoca-Colaを挙げていますが、RC Colaという別のブランドは挙げていません。これはRC Colaにとって、ネガティブ、ポジティブ、ニュートラルのいずれでしょうか?
この例は、自然言語処理を使っても、結果の全体的な目標に関連してセンチメントを決定する際には、コンテキストが依然として重要であることを強調するために使用しています。割り当てられたセンチメントに同意できない場合もありますが、それは問題ありません。次のセクションでは、Meltwaterでセンチメントを上書きする方法について説明します。
センチメント評価の上書き
センチメントを上書きでは、文書のセンチメント評価を変更することができます。
現在のセンチメントをクリックします
プルダウンメニューから「ポジティブ」、「ニュートラル」、「ネガティブ」、「評価なし」を割り当てます。
重複したコンテンツがある場合、「すべての文書に適用しますか?」と質問するウインドウが表示されます。重複したすべての結果にセンチメントを適用するか、選択した1つの結果だけに適用するかを選択します。
新しいセンチメントの割り当てが完了したら、センチメントのマークが変更されます。
重要事項
センチメント評価の変更はアカウントレベルで行われており、ウィジェットやExcelファイルにも反映されます。
センチメントの変更は、センチメントアイコンを再度クリックして「リセット」を選択すると元に戻ります。
チームのどのメンバーがセンチメントを変更したかを確認する方法はありません。
センチメント評価の一括上書き
それぞれの結果を個別に上書きするのではなく、一括選択することで、コンテンツフィードのセンチメントを一度に上書きできます。
コンテンツストリームで文書を選択してください(最大500の文書を一度に選択できます)
コンテンツフィードのアクションバーにてセンチメントの顔文字(笑顔)をクリックします。
新しいセンチメントを選択するか、またはセンチメントをリセットして元のセンチメントへ戻します。
留意点: 一度に変更できる文書は500件までであるため、500件を超える結果を選択したり、コンテンツフィードの上部にある[すべて選択]ボックスを選択して[結果合計すべてを選択]をクリックしたりすると、センチメントのエモティコンが画面から消えてしまいます。
センチメントに関するレポート
ダッシュボード内には、記事の全体的な調性を理解するのに役立つ「センチメント」と「センチメントスコア」というウィジェットがあります。
センチメント - コンテンツに、ポジティブ、ネガティブ、ニュートラルのセンチメントスコアを割り当てます。こうして記事にコンテキストを与えることで、自社ブランドや気になる話題の全体的なトーンを把握することができます。センチメントの割合は以下のようなドーナツグラフ、折れ線グラフ、棒グラフ、円グラフで表示されます。
センチメントスコア - ネガティブな記事に対するポジティブな記事のパーセントを計算し、「ニュートラル」な記事は無視します。
前期間と比較したセンチメント - このメトリックは、結果のセンチメント概要を提供します。これは、ポジティブなセンチメントの結果からネガティブなセンチメントの結果を差し引いて計算され、これをセンチメント評価のある文書全体と比較します。数式:([ポジティブな文書の数] - [ネガティブな文書の数]) / ([センチメント評価のある文書数]) x 100
プロのヒント記事の半分がポジティブで、残りの半分がネガティブの場合、スコアは「0」となります。また、記事のすべてがポジティブの場合、スコアは「+ 100」となります。
エンティティレベルのセンチメント検索
エンティティレベルのセンチメントで検索できるようになりました。
センチメントを細かく設定できる新しいブーリアンを使用することで、特定のエンティティ(例:ブランド、競合他社、製品など)がネガティブ、またはポジティブな文で言及されている記事や投稿を検索することができますが、文書の全体的な文書は異なる場合があります。
例えばこのクエリは、Teslaがエンティティとして識別され、ネガティブな文に登場するすべての文書を検索します:
enrichments.namedEntities[canonicalName:Tesla AND sentiment.discrete:v]
ポジティブな結果を見つけるには、次のように、センチメント変数を(ネガティブ)から(ポジティブ)に変更します。
enrichments.namedEntities[canonicalname:Tesla AND sentiment.discrete:p]
エンティティの複数のバージョンをカバーするために、名前のセクションをORクエリに拡張することができます。
enrichments.namedEntities[canonicalName:Tesla OR name:“Tesla Motors“ AND sentiment.discrete:p]
センチメントのブーリアン変数は次の通りです。
p - ポジティブ
n - ニュートラル
v - ネガティブ
u - 評価なし
重要事項
同じ文の中で2つ以上のエンティティが異なるセンチメントで言及されている場合、文のセンチメントは過半数の結合されたセンチメントに基づいて割り当てられます。
例:Coca-Colaが一番好き、Pepsiは好きではない。
この文はネガティブというよりはポジティブなものなので、この文の中で検出されたエンティティはすべてポジティブなセンチメントを受け取ります。
なお、Xのように名前が書き出されるのではなく、@handleでブランドが言及されているソーシャルチャネルでは、エンティティ検索はまだ利用できません。
常に改善
今後も定期的に自然言語処理モデルと最新の深層学習モデルに言語を追加していくことで、正確なセンチメント検出を継続的に改善し、必要に応じて言語を再学習していきます。
💡ヒント
さらに詳しく知りたいですか?チャットサポートでお問い合わせいただくか、 Customer Community(英語) をご覧ください。
MeltwaterのカスタマーサポートチームとCommunityの専門家がご質問にお答えします。