整体公式如下:
总结:
门控机制引入,类比于lstm/gru, 进行e_i 和 e_mask的融合,门控机制通过sigmoid(gru) 进行计算, 同时 ce(fc(gru))可以计算是否coef的判别
纠错和预测作为multi-task
创新点: 门控机制的类比,是参差网络的一种类似的结构,更多的信息处理, 对e_mask和e_i进行门控融合;业务层面引入e_mask作为对coef错误的替代;
bert-encoder和bert-embedding拆开,bert-embedding引入融合门控信息后的embedding
最后
以上就是调皮柠檬最近收集整理的关于soft-masked-bert的全部内容,更多相关soft-masked-bert内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复