本文将介绍:
情感分析概览
情感分析定义为对某个情况或事件的看法或态度,即观点。
情感分析通过分析正文来确定其观点。然后,相关观点会被标记为更“正面”或更“负面”。这称为“极性”。
然后系统根据总极性指数确定总体情感分析为正面、负面或中性。如果某个情况或事件兼具正负面,但更为正面,则极性指数会将其列为正面。
Meltwater如何判断情感分析
我们的情感分析模型利用Transformer技术,这是一种世界一流的深度学习
架构。在自然语言处理领域,基于Transformer的情感分析模型的准确率最高。
我们的最新模型包含专门用于确保高精度的功能:
注意力机制——通过关注文本中最重要和最相关的字词来理解相关内容。
例如,在“我点击了鼠标关闭窗口”这样的句子中,特别注意“点击”一词将有助于模型理解此处的“鼠标”指的是电脑配件而不是动物,而窗口指的是类似于电脑上的浏览器窗口,而不是住宅的窗口。
从人类的角度来思考注意力。当我们听到某人讲话或阅读一段文字时,我们会下意识地集中注意力,回想那些对我们理解和领会相关内容最关键的字词。
基于句子的嵌入——我们的新模型改编自Google构建的预训练开源模型 (BERT)。旧模型将字词表示为向量,而BERT会将整个句子表示为向量。这意味着我们的模型能够更好地处理具有多种含义的字词。例如,鼠标。以下是其他示例:
Meltwater中的情感分析
情感分析体现的是给定文章或提及的整体情感调性。可以利用它来分析每个结果,并将相关消息的情感调性整合为正面、负面、中性或未评分。这些情感调性根据自然语言处理算法(NLP)进行划分,有助于为结果提供背景信息,以及有关搜索、品牌或相关主题的整体情感调性概览。
我们可以检测242种语言,并为218种语言和方言提供完整的情感分析。
以下是几个Meltwater情感分析应用示例。
正面。在这个示例中,一位用户表示十分喜爱一项Coca-Cola推广活动。
负面。该用户表示不喜欢某个Coca-Cola产品的口味。
中性。该用户只是简单地陈述了某个Coca-Cola收藏品的相关事实,并未表明任何情感。
现在让我们探讨一个棘手的问题。NLP和情感分析非常准确,但并不完美。俚语、讽刺、推论和潜台词都会改变你相较于其他人的认知情感分析方式。两个人甚至会看到同一则消息,却对情感分析有不同的看法!以下是一个很好的示例:
该用户提到他们喜欢Pepsi,这对于Pepsi而言属於正面情感。
他们还提到相较于Pepsi,他们更喜欢Coca-Cola。这对Coca-Cola而言属於正面情感,对Pepsi而言则属于负面情感。但是他们说他们也喜欢Pepsi,那么这对Pepsi而言是否仍然属於正面情感?
该用户提到了Pepsi和Coca-Cola,但没有提到RC Cola。这对RC Cola而言是属于负面、正面还是中性情感?
我们使用这个示例来凸显即使使用NLP,在确定情感时,背景信息仍然很重要,因为它与结果中的总体目标相关。有时候你可能不认同指定的情感分析,这没关系!请阅读下一节,了解如何在Meltwater中替代情感分析。
更改情感正负面性
可以利用“覆盖情感分析”指定或更改文档或提及的情感分析评估。
点击当前情感分析
从下拉菜单中指定正面、中性、负面或未评分
如果文档中有重复文章,则会出现一个弹出窗口,询问“是否应用于所有文档?”。可以选择将情感分析应用于所有重复项,或仅应用于某项选定结果。
在你设定新的情感正负面性等级后,情感正负面性标识将被填充。
*重要事项:
在帐户级别进行情感更改,并且小部件和Excel导出会反映这些更改。
再次点击情感分析图标并选择“重置”,即可重置情感分析更改。
无法查看团队中哪个人更改了情感分析。
批量覆盖情感分析
可以通过批量选择替代内容浏览中的情感分析,而不是逐个替代每项结果。
在内容浏览中选择文档(每次最多可以选择500个文档)
点击内容浏览工具栏中的表情符(笑脸)
选择要将所有文档更改为的情感分析,或将情感分析重置回其原始情感分析
注意事项:由于无法同时更改超过500项结果,因此如果选择超过500个文档,或者勾选内容浏览顶端的“全选”框,然后点击“全选所有结果”,则情感分析表情符将消失。
情感分析报告
经典信息中心
经典信息中心有两种分析工具有助于了解一组文章的整体情感调性,分别名为“情感分析“和“情感分析指数”。
情感分析——用于查看获指定正面、负面或中性情感调性指数的文档数量。它有助于为文章提供背景信息,以及有关搜索、品牌或相关主题的整体情感调性概览。该图可以下列图表类型显示:圆环图(如下图所示)、线型图、实心条形图或饼图。
情感分析指数——正面文章百分比减去负面文章百分比,“中性”文章则省略不计。
相较于前一段时间的情感分析——该指标概述了搜索结果的情感分析。具体计算方式是从包含正面情感分析的结果中减去包含负面情感分析的结果,然后将其与包含情感分析评分的总计文档进行比较。公式:([正面文档数量] - [负面文档数量])/([包含情感分析评分的文档数量])x 100
专家提示如果您的文章中有一半是正面的,而另一半是负面的,则期望得分为“ 0”。如果一切都是积极的,则预期得分为“ +100”。
信息中心模板
可在“画布布局”、“幻灯片布局”、“品牌报告模板”、“基准报告模板”、“推广活动报告模板”、“报道报告模板”和“免费媒体参照”信息中心中找到下列情感分析分析工具。
平均情感分析——显示了所选输入中提及的平均情感调性。情感分析推导自我们的自然语言处理算法。
情感分析明细——显示了所选输入中提及的情感分析细分。情感分析推导自我们的自然语言处理算法。归类为“未评分”的提及没有足够的文本来进行情感分析。受YouTube政策所限,此可视化效果不会包含其数据。
情感分析趋势——显示了所选输入中提及的情感分析细分随时间变化的趋势。“未评分”提及没有足够的文本来分析情感。受YouTube政策所限,此可视化效果不会包含其数据。
按信息源类型划分的情感分析——显示了所选输入中提及的情感分析细分,按信息源类型划分。“未评分”提及没有足够的文本来分析情感。受YouTube政策所限,此可视化效果不会包含其数据。
平均情感分析趋势——显示了一段时间内每项选定输入中提及的平均情感调性。受YouTube政策所限,此可视化效果不会包含其数据。
按情感分析划分的热门关键字——显示了所选输入的提及中最常出的关键字和短语,按提及的情感分析进行细分。归类为“未评分”的提及没有足够的文本来进行情感分析。受YouTube政策所限,此可视化效果不会包含其数据。
按情感分析划分的热门刊物——显示了提及量最多的新闻刊物,按提及的情感分析进行细分。归类为“未评分”的提及没有足够的文本来进行情感分析。受YouTube政策所限,此可视化效果不会包含其数据。
按情感分析划分的热门地点——按作者的地点划分的提及量分布情况,另外再按情感分析划分。受YouTube政策所限,此可视化效果不会包含其数据。
平均情感分析——显示了所选输入中提及的平均情感调性。情感分析推导自我们的自然语言处理算法。
实体级情感分析搜索
现在可以按实体级情感分析进行搜索!
使用新的布尔搜索技术运算符表示精细的情感分析,你将能够检索其中有负面或正面句子提及特定实体(例如品牌、竞争对手或产品)的文章和帖子,而文档的整体情感分析可能有所不同。
例如,此查询将返回Tesla被标识为实体并出现在负面句子中的所有文档:
enrichments.namedEntities[canonicalName:Tesla AND sentiment.discrete:v]
若要查找正面结果,请将情感分析变量从v(负面)改为p(正面) ,如下所示:
enrichments.namedEntities[canonicalname:Tesla AND sentiment.discrete:p]
若要涵盖相关实体的多个版本,可以将“名称”部分扩展为OR查询:
enrichments.namedEntities[canonicalName:Tesla OR name:“Tesla Motors“ AND sentiment.discrete:p]
情感分析布尔搜索技术变量包括
p — 正面
n — 中性
v — 负面
u — 未评分
*重要事项:
如果在同一句子中提及两个或多个实体,且其情感分析各不相同,则将根据主要组合情感分析指定句子的情感分析。
例如:Coca Cola最好喝,我不喜欢Pepsi。
这句话的正面情感大于负面情感,所以这句话中所有检测到的实体都会获得正面情感分析。
实体搜索暂不适用于提及品牌为@帐号,而不是写出名称(例如Twitter)的社交媒体渠道。
不断改进
我们会继续定期向NLP和现代深度学习模型中添加更多语言,以便继续改进准确的情感分析检测,并在需要时重新训练语言。
💡 提示
需要更多帮助?请随时通过在线聊天与我们联系,或查看我们的“客户社区”。
寻找答案并向Meltwater支持和社区专家处获取帮助。