メインコンテンツにスキップ

エクスプロア:検索パフォーマンスとベストプラクティス

Cheyenne V. avatar
対応者:Cheyenne V.
今週アップデートされました

検索パフォーマンスは、エクスプロアニュースレターモニター分析エクスポートAPIなど、Meltwaterプラットフォーム全体の主要な機能の速度と安定性に直接影響します。非効率的なブーリアン検索または過度に複雑なブーリアン検索は、エラーを引き起こしたり、応答時間を大幅に遅くしたりする可能性があります。

効率的な検索クエリの作成におけるベストプラクティスにしたがうことで、インサイトやレポートツールに迅速かつ安定してアクセスできるようになります。

この記事では次の内容について説明します:


検索を最適化する方法

赤で強調されている問題は特に有害で、検索パフォーマンスを著しく低下させます。

一般的に、これらの問題が同時に発生するほど、ネガティブな影響は大きくなります。

検索パフォーマンスに悪影響

悪い例

修正

良い例

巨大なブーリアン

数千のキーワードや多数の大きなNEAR、数百のワイルドカードを含む大規模なクエリがある場合、クエリは遅くなったりブロックされたりします。

この記事のすべてのヒントにしたがって、クエリをできるだけ小さくし、実行しやすくしてください

10文字以上の単語に対するワイルドカード

internatio* [10文字]

ワイルドカードの前に最大9文字使用します

internat* [8文字]

ワイルドカードの過剰使用

D*C*

よくない理由:検索システムは「D」または「C」で始まる任意の長さの単語を検索しますが、これは決して少ない単語数ではありません

DC OR "D.C."

ワイルドカードが多すぎ - 多くの場合、削除可能

ショップ*

ワイルドカードをできるだけ取り除き、異なるキーワードバージョンを書き出します

ショップ OR ショップス OR ショップした OR ショッピング

NEARが大きい

大統領NEAR/100トランプ

NEARを10以下に抑えます。ほとんどの場合、NEARが10を超える場合、「AND」を使用すると同じ結果が得られ、システムへの負荷が軽減されます

大統領NEAR/10トランプ

ワイルドカードとNEARの組み合わせ

ショップ* NEAR センター*

ワイルドカードをできるだけ取り除き、異なるキーワードバージョンを書き出します

(ショップ OR ショップス OR ショップした OR ショッピング) NEAT (センター OR センターズ)

長いNOTフィルターの除外

NOT 2.0 / 市場調査レポート、株式市場の更新情報、PRワイヤーの除外

ContentCategoryフィルターを使用します

contentCategory:("press_releases" OR "market_research_reports" OR "stock_market_news")

不要なワイルドカード

"example.com/*" OR "ABC:*"

「トークン化」により、テキストはスペースだけでなく、特殊文字でも分割されます。例えば、「example.com」を検索すると、「example.com/other」もヒットします→ / : ;などの特殊文字の後にはワイルドカードを追加する必要はありません。

"example.com/" OR "ABC:"

URL演算子

ワイルドカードやhttp(s)://を使わずにSITE:演算子を使用してください。

LINKオペレーター

ワイルドカードとhttp(s)://を使わずにCONTAINSLINK:演算子を使用します。

containslink:"www.meltwater.com/"

引用符内のフレーズが長い

「27,000社のグローバル顧客、6大陸に50のオフィス、2,300人の従業員を擁するMeltwaterは、影響力を持つグローバルブランドの業界パートナーです。」

  1. いくつかのキーワードとNEARで置き換えます

  2. PRワイヤーのシンジケーションを除外することが目的で、ボイラープレートから文を選んだ場合は、PRワイヤーのContentCategory除外を確認することをお勧めします

  1. Meltwater NEAR "業界パートナー" NEAR "グローバルブランド"

  2. contentCategory: "press_releases"

組み合わせる必要のないキーワードをNEARまたはANDで組み合わせる(例:異なる言語への翻訳)

(ビーチ OR شاطئ OR 海滩 OR plaža OR pláž OR strand OR plage OR παραλία OR spiaggia)

NEAR/10

(volleyball OR الكرة الطائرة OR 排球 OR odbojka OR volejba OR volleybal OR volley-ball OR βόλεϊ OR pallavolo)

関連性のあるキーワードのみを組み合わせます。例えば、英語は英語、アラビア語はアラビア語、中国語は中国語など

→ 検索が処理する必要のあるキーワードの組み合わせが大幅に減少します

beach NEAR/10 volleyball OR شاطئ NEAR/10 الكرة الطائرة OR

海滩 NEAR/10 排球 OR

plaža NEAR/10 odbojka OR

pláž NEAR/10 volejbal OR

strand NEAR/10 volleybal OR plage NEAR/10 volley-ball OR παραλία NEAR/10 βόλεϊ OR spiaggia NEAR/10 pallavolo

キーワードが繰り返されている

  1. wine OR vino OR wein OR víno OR vino OR vino

  2. Disney OR "Walt Disney" OR "Walt Disney Company"

重複したキーワードを削除してください。特にワイルドカードが付いている場合は削除してください

  1. wine OR vino OR wein OR víno

  2. Disney


カスタムカテゴリーとかけ合わせ検索の使用

カスタムカテゴリーとかけ合わせ検索を使用する際は、次の点にご注意ください:

  • ブーリアンが単純化するのではなく、複雑化します。

  • 複数のサブ検索にフィルターを複製すると、パフォーマンスが低下します。

修正例:

  • 10のビジネスユニット(BU)検索は同じ3つの除外を使用します。

  • これらはすべて1つの検索に統合されます → 合計30件のフィルターが処理されます。

  • 解決策:最終的なかけ合わせ検索で、除外を1度だけ適用します(ニュースレターやダッシュボードなど、他の場所で個別に使用されている場合を除く)。


ヒントとコツ

Meltwaterで検索を構築する際には、特定のブール構造と演算子がシステムのパフォーマンスにどのように影響を与えるかを理解することが重要です。以下に、一部の検索手法で処理が遅くなる理由と、代わりに何をすればよいかを説明します。

ワイルドカード

  • ワイルドカードとは?ワイルドカードは、単語の複数のバリエーションを一致させるために使われるアスタリスク記号*です。例えば、ショップ*はショップ、ショップス、ショッピング、ショッピングしたなどを返します。

  • 問題ワイルドカードを多用したり、10文字以上の長い語根の後にワイルドカードを置いたりすると、検索が遅くなります。それは、システムが膨大な数の単語のバリエーションを確認しなければならないからです。

  • 代わりに:短い語根(最大9文字)を使用し、可能な場合は特定のキーワードのバリエーションを書き出してください。

NEAR演算子は慎重に使用する必要があります

  • NEARとはNEARは近くに出現する単語を見つける方法です。例:大統領 NEAR/10 トランプは、このふたつの単語が互いに10語以内にある記事を見つけます。

  • 問題点NEAR/100 のような大きな距離は、より多くの処理能力を必要とし、無関係な結果が多く返される可能性があります。多くの場合、ANDを使用するだけで、同様の結果をより速く得ることができます。

  • 代わり:NEARの距離を10以下にするか、近さが重要でなければANDを使用します。

ワイルドカードとNEARの組み合わせを避けます

  • 理由ワイルドカードとNEARはどちらも、それ自体でリソースを多く消費します。これらを組み合わせると(例:ショップ* NEAR センター*)、システムはさらに多くの組み合わせを計算する必要があり、処理速度が大幅に低下します。

  • 修正:ワイルドカードを削除して、いくつかの可能性のある用語を書き出します。例:(ショップ OR ショップス) NEAR (センター OR センターズ)

特殊文字は単語を分割します

  • これが起こる理由検索エンジンはテキストを「トークン化」し、スペースだけでなく句読点(/、:、.など)でも単語を分割します。

  • 重要な理由:「example.com/*」を検索した場合、不要なワイルドカードをしています。システムはすでに「example.com」が「example.com/page」や「example.com:8080」などを含んでいることを認識しています。

  • 修正:「example.com/」「ABC:」を*なしで検索します。

長い引用句の使用

  • 定型文や会社の宣伝文のような長いテキストブロックを引用すると、システムは文構造に正確に一致しようとしますが、効果はほとんどなく、処理が遅くなることがあります。

  • 修正:NEARと一緒にいくつかの重要な用語を使用します。例:文全体をコピーするのではなく、Meltwater NEAR 「業界パートナー」とする

繰り返し使用されるキーワードは冗長です

  • クエリに同じ単語を複数回追加すると(特にワイルドカードを使用する場合)、不要な負荷がかかります。

  • 修正:重複を削除します。例:ワイン OR ワイン OR ワイン でははく、ワインとだけ書きます。


💡ヒント

さらに詳しく知りたいですか?チャットサポートでお問い合わせいただくか、 Customer Community(英語) をご覧ください。

MeltwaterのカスタマーサポートチームとCommunityの専門家がご質問にお答えします。


こちらの回答で解決しましたか?