让我们以讨论的电话诈骗相关话题为例,考虑一下品牌分析系统如何帮助解决监测公众情绪的日常任务。
创建主题
品牌分析系统中对社交媒体和大众媒体的监控和分析始于创建主题。
主题 是一个工作环境,用于聚合消息、收集消息统计信息并生成自动报告。主题是根据搜索查询针对特定监控对象创建的。
搜索查询由关键词、否定词以及指定操作的特殊运算 电话号码收集 符组成。例如,如果我们只查找所有提及电话诈骗者的内容,那么在关键词中我们会这样写:
“电话诈骗者”~0
此运算符称为“词间距离搜索”。将所需短语放在引号中,~(波浪号)后表示短语各部分之间的最大单词数。0 表示不存在这样的单词。1 表示短语可以用另一个单词分隔,例如,包含短语“电话银行诈骗者”的消息也会被收集到主题中。
由于我们的主题范围更广,我们将主要使用按距离分组的关键字。该运算符如下所示:
( )/N( ),其中,相交和组成短语的单词将在括号中注明,N 为它们之间的最大单词数。
作为研究的一部分,我们交叉检查了
“call”动作的所有拼写变体,因为用户可能会输入错误或只是写错,以及欺诈和欺骗的各种同义词和变体:
(打电话,打电话,电话,他们打电话……)/7(诈骗者,骗子,骗子……)
我们排除了所有提及“奥特佩特耶·莫申尼基”乐 在值得信赖的经纪人处赢得足球投注的秘诀 队的信息,以免收集到演唱会公告或纪念品销售主题(这些主题中也会提及电话号码),以及任何与销售和订单相关的信息。销售领域总有骗子,但我们对他们不感兴趣,但这些信息会占用品牌分析的部分流量。
搜索词和否定词是一个动态设置,可以在初始收集后,在主题工作过程中进行补充。某些用户行为模式只能在大型数据集上识别。因此,如果您无法立即收集到理想的否定词集,这很正常。
在创建和编辑主题时,设置来源、过滤、指定收集渠道和调性对象也很重要。
频道 是评论网站、地图、市场、社交网络、应用商店等上的品牌或公司页面,设置后可用于接收来自该主题的选定页面的消息流,无论它们是否提及搜索查询的关键字。
清除主题中不必要的消息
即使是最高质量的关键字和过滤器设置也无法排除一定数量的与监控主题无关的消息。
作者报告有助于识别和分析种子用户。该报告显 最新群发短信 示有关消息作者及其人口统计特征、受众规模和参与度的信息。它将有助于识别品牌目标群体、影响者和仇恨者。
通过分析发布消息数量最多的作者,我们能够找到并立即删除与欺诈主题间接相关的消息。
例如,为了更新数据阵列,删除了数十条处理诈骗电话的兼职工作广告。尽管关键词完全匹配,但这些信息并不能反映公众情绪。
为了明确监测结果,我们使用了“作者”报告。该报告分析了社交媒体中发布消息最频繁的作者,并分析了他们的出版物。之后,我们将该作者及其发布的所有消息从主题中删除。
此外,还可以通过在摘要报告中按主题进行筛选来删除不必要的消息。例如,关于动物和电影主题的消息与研究对象关联性最低。经过内容分析后,所有包含这些主题的消息均被删除。
主题是消息文本所涉及的内容:一系列事件、现象、问题、概念等。品牌分析会自动识别各类主题中的 50 多个消息主题。
按作者和主题进行过滤有助于自动化主题工作并留下最相关的内容以供分析。