体验家XMPlus-全旅程客户体验管理
体验家XMPlus
对于机器学习,有两种主要方法:监督分类和聚类。
为了设置监督分类,分析师手动检查一组评论样本,并为每个评论分配主题。然后使用这个带注释的数据集来训练分类器。一旦使用此样本注释数据训练了分类器,它就可以根据所学内容自动标记新评论。虽然与创建规则相比,注释数据集的劳动强度可能较低,但分类器仅在主题少于 10 个时才能成功工作。
顾名思义,聚类将相似的评论聚集在一起。高频率提及特定单词的评论聚集在一起。这适用于新闻,具有相同名称和地点的频繁出现的文章最有可能讨论相似的新闻主题。然而,客户的声音更加多样化。与新闻的僵化结构和词汇相比,客户反馈中有更多的表达方式。
情绪分析将短语标记为具有积极或消极情绪。 “销售助理真的很好”将被标记为积极的。它使用与主题分析类似的技术:基于规则/字典和机器学习。
基于字典的情感分析非常容易设置。这类似于从字典中提取所有单词,并为每个单词分配正面或负面情绪。然而,单词的情感会根据上下文而变化。您通常会认为脏话传达负面情绪,但在游戏社区中,例如,事情就更模糊了。积极的词经常被用来讽刺,而消极的词在放入上下文时实际上具有积极的情绪。
为了考虑上下文,有监督的机器学习技术提供了一种更好的方式来分配情绪。与为主题分析描述的监督分类类似,用于情感分析的监督机器学习涉及为您感兴趣的上下文(例如,来自特定游戏社区的评论)抽取一组样本子句,并手动为每个子句分配一个正面或负面情绪。从这个带注释的数据集中,该算法可以根据从评论样本中学到的内容为新的子句分配情感。
将基于规则的主题分析以及监督分类和聚类相结合,以确保我们捕获尽可能多的反馈并且分类的评论是准确的。对于情感分析,利用了监督机器学习的灵活性。由于主题和情绪因行业而异,因此构建行业和特定于上下文的文本分析方法,以便捕获具有准确情绪的业务相关主题。
扫码关注体验家公众号,随时随地获取体验家观点
免费订阅
提交信息,我们将定期为您推送更多您喜欢的内容
我们将定期为您推送更多精彩内容
Copyright © 2023 XMPlus 瀚一数据科技(深圳)有限公司 粤ICP备18114013号-2 粤公网安备44030502005360号