【论文精读】TACRED Revisited: A Thorough Evaluation of the TACRED Relation Extraction Task
这篇文章是ACL2020上的文章,来德国研究中心的Christoph Alt。文章主要研究的是Tacred的数据集合中的Dev和Test集的标注错误,并且做了标注错误类型的分组,做了对比试验验证这些不同的错误原因对四个对比模型的影响,得出了 per:loc 和 same nertag&positive两个group的样例容易被分类错误的结论,并且认为将instance难度考虑到评估过程是有必要的。这篇文章看到当前在Tacred上的SOTA模型仍然还有30%错误率,于是提出了问题,