SemEval-2022 Task 10: Structured Sentiment Analysis

2022年情感识别任务Task10:SemEval-2022 Task 10: Structured Sentiment Analysis

任务描述

Structured Sentiment Analysis主要是从文本中抽取结构化的情感图(Structured sentiment graph)。 即,从文本中抽取所有的观点元组$O=O_1,…,O_n$,每个观点$O_i$为一个四元组$(h,t,e,p)$

其中$h$为holder,$p$为polarity,$t$为target,$e$为sentiment expression, holder通过sentiment expression对target表达polarity。

multi_sent_graph

单语言预测

在相同的语言上训练和预测结构化情感图,需上传7个预测文本

跨语言预测

探索模型在跨语言上的繁华能力。在多语言上进行训练,在 MultiBooked、Datasets (Catalan and Basque)OpeNER Spanish 数据集上进行测试。

数据集

数据集 描述 训练集句子数
$NoReC_{Fine}$ 挪威语: 多领域的专业评论数据 8634
$MultiB_{EU}$ 巴斯克語: 酒店评论数据 1064
$MultiB_{CA}$ 加泰罗尼亚语:酒店评论数据 1174
$MPQA$ 英语: 新闻语料 4500
$DS_{Unis}$ 英语:网课和电子商务评论语料 2253
$OpeNER_es$ 西班牙语: 1439
$OpeNER_en$ 英语: 1745

评估方法

Sentiment Graph F1

对元组级别(holder, target, expression, polarity)的记录进行对比,在polarity一致的情况下,在holder/target/expression三种元素上,利用预测元素和真实元素的字符重叠情况作为对应元素的准确情况,并取三个元素准确情况的平均值作为元组的准确情况。
$$
tp_{holder} = \frac{intersect(holder_{predict}, holder_{true})}{holder_{predict}}
$$
$$
tp_{target} = \frac{intersect(target_{predict}, target_{true})}{target_{predict}}
$$
$$
tp_{expression} = \frac{intersect(expression_{predict}, expression_{true})}{expression_{predict}}
$$
$$
tp = \frac{tp_{holder} + tp_{target} + tp_{expression}}{3}
$$

准确率$P$: 所有预测准确的元素占预测元素的比例

召回率$R$:所有预测准确的元素占真实元素的比例

Sentiment Graph F1:
$$
F_1 = \frac{2\times P \times R}{P + R}
$$

Baseline

方法 darmstadt_unis mpqa multibooked_ca multibooked_eu norec opener_en opener_es
Pipeline sequence labeling + relation classification 0.072 0.011 0.289 0.405 0.201 0.254
graph_parser 0 0 0.038 0.065 0.011 0.098 0.068

Pipeline Sequence labeling + relation classification

任务分成两部分: 元素抽取(holder/target/expression) 、情感极性分类

  • 元素抽取:训练三个BiLSTM模型进行 holder、target、expression的抽取
  • 情感极性分类:BiLSTM + max pooling获取三个表示向量,将三个向量拼接后接一个线性分类器进行polarity预测。
    • 全文向量表示
    • holder或者target的向量表示
    • expression的向量表示

Graph Parser

看做是一个双词依存图的预测任务( a bilexical dependency graph prediction task)。

bilexical

模型paper