NLP CH8 属性级情感分析复习
1. 任务定义与形式化
属性级情感分类的目标是:
- 对文本中的目标实体(entity)及其属性(aspect)进行情感分析。
- 其形式化定义为五元组
(e, a, s, h, t)
:- e:被评价的目标实体。
- a:目标实体中的某个属性。
- s:对实体属性的情感倾向(正、负、中立或打分)。
- h:观点持有者。
- t:发表观点的时间。
- 属性抽取(Aspect Extraction,AE):从文本中识别出所有属性。
- 属性级情感分类(Aspect-Level Sentiment Classification, ALSC):判断每个属性的情感倾向。
此外,还有扩展任务:
- 观点抽取(Opinion Extraction,OE):从文本中提取与属性相关的观点词。
- 三元组联合抽取:同时完成AE、OE和情感分类。
- 属性-观点联合抽取(Pair Extraction):抽取成对的属性和观点词。
2. 方法
在属性级情感分类中,以下方法被提到:
(1) 属性抽取(AE)
- Seq2Seq模型:采用GRU门控单元,结合位置感知的注意力机制。
- 序列标注方法:使用BIO标注体系对属性进行标注。
(2) 属性级情感分类(ALSC)
- 基于注意力的LSTM(ATAE-LSTM):
- 在句子中针对不同属性动态调整注意力的关注点。
- 属性信息可以拼接到LSTM的输入层或隐层中。
- TC-LSTM模型:结合上下文和属性信息进行分类。
(3) 属性导向的观点抽取(AOE)
- 使用Encoder-Decoder框架。
- 结合内向LSTM和外向LSTM,获取目标和上下文的全局信息。
(4) 属性抽取+情感分类(AESC)
- Pipeline模型:通过先抽取后分类的框架实现,基于BERT的双向编码器。
- 预测属性的开始位置和结束位置后,直接对属性进行情感分类。
(5) 属性观点联合抽取(Pair Extraction)
- SpanMIT模型:基于多任务学习,结合BERT/BiLSTM对可能的跨度进行枚举和监督,提取属性-观点对。
(6) 三元组联合抽取
- 基于BERT的Span模型:在一个框架中处理所有ABSA子任务(AE、OE和情感分类),通过检测句子中各个组件的位置和类别来完成任务。
- 统一生成框架(Unified Generative Framework):基于BART模型,将所有ABSA任务统一为概率计算问题。
(7) 基于大模型的方法
- Counterfactual数据增强:生成反事实样本(例如将“Never bad”与“positive”虚假关联打破)来提升模型鲁棒性。
- Instruction Tuning:通过检索示例和语言模型推理相结合进行任务优化。
3. 总结与未来方向
属性级情感分类的未来研究方向包括:
- 复杂属性的多元组抽取。
- 联合学习(同时抽取和分类)。
- 引入外部知识(语义、词典、常识等)。
- 表示学习(基于Transformer、图神经网络GNN等)。
这些方法和技术的目标是提升情感分析的精度与鲁棒性,同时应对更复杂的情感分析场景。