科技名词
观点挖掘
opinion mining
定义:利用信息检索和自然语言处理技术判定文档中观点或者倾向的一种挖掘任务。
学科:计算机科学技术_数据库_数据库新技术
相关名词:数据挖掘 文本挖掘 情感分析
【延伸阅读】
观点挖掘是人工智能领域一项至关重要的技术,其目标是让计算机在语义理解的基础上,从文本中获取有价值的评价信息和观点。广义的观点挖掘也称情感分类、情感分析或文本意见挖掘等。观点挖掘是多学科的综合性研究,涉及文本挖掘、信息抽取、信息检索、机器学习、自然语言处理、概率论、统计分析、本体、可视化技术等方面。按照处理文本的粒度不同,可以分为词语、句子和篇章三个级别的研究;按照处理文本的类别不同,可以分为基于产品评论和基于新闻评论的观点挖掘。
通常认为,观点由主题(Topic)、发出者(Holder)、断言(Claim)和情感(Sentiment)组成,观点挖掘就是要通过计算机系统,找到文本中的这四种要素,并分析出它们之间的相互联系。其任务包括观点提取、极性分析和观点总结。观点提取是从海量数据中抽取与主题相关的内容,并对数据进行过滤;极性分析首先判断内容的主观性,再分析其中表达主观意见的极性,如积极、消极或中性等;观点总结最终将分析结果统计汇总并可视化。观点挖掘的过程主要分为4步,即主题抽取、观点持有者识别、陈述选择和情感分析。主题抽取指识别主题术语和指派领域相关的本体概念;观点持有者识别用于确定观点表述的作者和谈话者;陈述选择主要确定观点表述的范围和过滤客观性表述;情感分析(又称极性判断)决定意见陈述的语义倾向。
观点挖掘具有广泛的应用价值,可用于民意调查、热点跟踪、舆情分析、政策文本分析、市场监测、电子商务分析、个性化推荐等方面。例如,采用观点挖掘系统对互联网上关于竞品企业评论信息进行分析,可以快速地了解竞品企业对手在公众心目中的评价情况,同时将本企业的评论信息与竞争对手的进行对比,直观清晰地展示彼此的优势和劣势,借助各种图表和文字形成观点摘要,为决策者制定竞争策略提供参考依据。