GECToR–Grammatical Error Correction: Tag, Not Rewrite翻译摘要1.介绍2.数据集3.字符级转换4.模型结构5.迭代序列标记方法A.附录
摘要在本文中,我们提出了仅使用Transformer编码器的简单有效的GEC序列标注器。我们的系统在综合数据上进行了预训练,然后分两个阶段进行了微调:首先是错误的语料库,其次是有错误和无错误的平行语料库的组合。我们设计了自定义的字符级别转换,以将输入字符映射到纠正后的目标。我们最好的单模型以及联合模型GEC标注器分别在CoNLL-2014测试集上F0.5达到65.3和66.5,在BEA-2019上F0.5达到72.4和73.6。模型的推理速度是基于Transformer的seq2seq GEC系