跳转到主要内容
Explore中的数据源

查看“探索”如何获取数据,如何对不同的信息源进行爬网,以及每个信息源的使用限制

Cheyenne V. avatar
作者:Cheyenne V.
更新于今天

Explore实时分析数十亿个结果,并且每周7天、每天24小时收集新内容。本文包含有关Meltwater信息源以及人口统计数据的信息,例如国家/地区和语言。

本文将介绍:


查找订阅中包含的信息源

信息源因套餐而异。若要查找订阅中包含的信息源,请按照以下步骤操作:

  1. 点击左侧导航栏中的“Explore”(探索)。

  2. 前往搜索选项栏,然后选择“Keyword Search”(关键字搜索)或“Advanced Search”(高级搜索)。

  3. 点击“Source type”(信息源类型)下拉列表。

此下拉列表会列出订阅中包含的所有信息源。


Meltwater提供的不同信息源类型

下表列出了Meltwater提供的每种信息源类型。如果在“探索”中看不到下列信息源类型,请联系客户经理,详细了解如果通过支付额外费用添加信息源类型。

X(原Twitter)

X是一种在线社交网络和微型博客服务,使用户能够发送和阅读最多280个字符的文本帖子,称为“帖子”。

Meltwater可以访问完整的X流水式数据托管服务,为用户提供最近15个月的X历史内容。

博客

博客是在网络上发表的个人日志,由离散条目或“帖子”组成,通常按时间顺序倒列。它通常以单个话题为主题,由个人或小组撰写。与静态网站不同的是,大多数博客允许读者通过博客发表评论或互相交流。超过2900万个独特的社交媒体博客每天会发布超过150万个博客。我们将社交媒体博客定义为所有博客,但新闻博客除外。新闻博客是与新闻网站(例如http://www.mercurynews.com/blogs)相关的博客。Meltwater以与我们抓取新闻文档相同的方式抓取这些博客,但我们将它们作为新闻搜索中的单独信息源类型提供。

用户可以在“探索”中看到15个月的博客历史内容。

论坛

论坛(有时称为留言板)是在线讨论网站,人们可以在其中以发布消息的形式进行对话。一个论坛可以同时进行多项单独的讨论,每项讨论都称为一个主题。通常,论坛具有基本主题或政治、体育、技术、时尚等主题。系统每天会导入大约520万个论坛帖子,令你有机会浏览更加针对自己感兴趣话题的内容。

用户可以在“探索”中看到15个月的论坛历史内容。

Reddit

Reddit是一个社交共享网站,提供社交新闻聚合、网络内容评分和讨论等服务。注册成员向网站提交链接、文本帖子和图像等内容,然后由其他成员投赞成或反对票。每天大约有600万个Reddit帖子被提取到“探索”中。

用户可以在“探索”中看到15个月的Reddit历史内容。

产品评价

用户可以在产品评论网站为产品评级。他们可能是专用产品比较网站,或亚马逊等大型电子商务企业网站的评论内容。

可以通过监测产品评论,利用每天获取的超过86.5万条评论来评估用户满意度,并藉此深入了解你的产品和竞争对手。

用户可以在“探索”中看到15个月的评论历史内容。

新闻

新闻是来自《纽约时报》、BBC、CNN、当地报纸以及在线期刊等新闻信息源的受版权保护内容。在电视网络网站上发布的内容也被归类为新闻。Meltwater每天都会通过新闻信息源抓取超过300万篇传统媒体文章。

用户可以在“探索”中看到10年的新闻内容。

评论

在许多网站(主要是新闻和博客)上,用户可以在页面底部留下评论。通过监测这些评论,你将能够凭藉每天从我们系统中大约220万条评论中即时筛选出来的相关信息,深入了解你的品牌。

用户可以在“探索”中看到15个月的历史评论。

方案征询书

方案征询书又称为RFP或“招标”,是一种商业文件,通常通过招标程序,由有意采购商品或服务的机构或公司向潜在供应商宣布项目,并征求方案。

Facebook

用户可以创建包含照片、个人兴趣列表、联系信息和其他个人信息的个人资料。用户可以通过私人或公共消息和聊天功能与朋友和其他用户进行通信。他们还可以创建和加入兴趣小组和“类似页面”,其中一些由相关组织作为广告手段进行维护。此外还有个人页面和粉丝页面。Meltwater只会收集粉丝页面的信息。

可以在验证Facebook帐户后获取Facebook结果,然后识别并添加想要在Meltwater中收集帖子和评论的特定Facebook页面。

添加页面后,用户将看到450 天的Facebook历史内容,即连续15个月的内容。

YouTube

YouTube是一个视频共享网站,创建于2005年2月。用户可以在YouTube中上传、查看和分享视频。 YouTube托管各种用户生成的视频内容,包括电影片段、电视片段和音乐视频,以及视频博客、简短原创视频和教育视频等业余内容。“探索”直接从YouTube的API中提取内容,并搜索视频标题、说明和标签。

用户可以在“探索”中看到30天的YouTube历史数据。视频和评论都将在30天后隐藏。

Instagram

Instagram是一项在线移动照片共享、视频共享和社交网络服务,使用户能够拍摄照片和视频,并在应用上以及通过Facebook、X、Tumblr和Flickr等其他各种社交网络平台公开或私下分享。

在使用Instagram业务令牌设置井号标签或竞争对手搜索后,即可获取Instagram结果。搜索结果包括帖子、视频、短片、评论和回复。

从连接点开始,所有Instagram数据都将被提取至“探索”。

Pinterest

Pinterest是一项图像共享和社交媒体服务,旨在通过图像以及较小规模的动画GIF和视频,以钉板形式保存和发掘互联网信息。

我们会通过涵盖(每月4.75亿名活跃用户中的)150万名Pinterest用户发布或保存的所有内容的样本集来监测Pinterest。监测关键字将与图像附带的文本匹配,例如内容的标题和说明。其中不包含图像中的任何文本或图像识别。

详细了解Pinterest监测

Twitch

Twitch是一项视频直播服务,专注于视频游戏直播,包括电子竞技比赛的广播。此外,它还提供音乐广播、创意内容以及最近的“现实生活”直播。

我们会通过活跃Twitch用户的样本内容来监测Twitch。一旦直播结束,片段保存到Twitch用户页面后,便可以搜索片段/帖子。监测关键字将与已保存流媒体的标题和说明相匹配。

详细了解Twitch监测

KakaoTalk

KakaoTalk是“探索”中自己的信息源,可以轻松地定位、筛选和直接进行分析。

KakaoTalk——每天2000个帖子——KakaoTalk(或 KaTalk)是一款韩国通讯应用,于2010年推出。截至2022年,每月活跃用户约为5300万,其功能与LINE类似。

LINE Voom

LINE Voom是“探索”中自己的信息源,可以轻松地定位、筛选和直接进行分析。

LINE Voom——每天5000个帖子——LINE Voom的功能与Instagram类似,可在LINE主应用中使用。LINE Voom前身为LINE Timeline,于2021年推出,可以发布包含文本、图像、视频、表情图片等内容的帖子。主应用LINE则于2011年在日本推出,在日本、台湾和泰国广受欢迎,每月活跃用户超过2.3亿。

广播

这些搜索结果包括广播和电视片段。打开相关片段时,你能够观看或聆听原创内容、阅读文字记录、查看节目相关信息等等!

播客

我们的热门播客来自美国最大的播客收听目录。每天都会添加和转录成千上万的新集,以供搜索和发现。

目前可以访问大约2.5万个播客,并且播客的数量正在不断增长(90%在美国,10%为国际播客)。其中还包括英语、法语、西班牙语、德语和意大利语等16种语言和方言。

中文社交媒体监测

注意事项:如果当前订阅不包含上述列表中的某个信息源,请联系Meltwater客户经理,了解有关添加信息源的更多信息。


💡 提示

需要更多帮助?请随时通过在线聊天与我们联系,或查看我们的“客户社区”。

寻找答案并向Meltwater支持和社区专家处获取帮助。


这是否解答了您的问题?