我是靠谱客的博主 俊秀草丛,最近开发中收集的这篇文章主要介绍Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification阅读笔记Att-BLSTM,觉得挺不错的,现在分享给大家,希望可以做个参考。
概述
Att-BLSTM
Model
模型主要包括五部分:
- Input layer
- Embedding layer
- Lstm layer
- Attention layer
- Output layer
Word Embedding
没啥好说的…
Bidirectional Network
Bi-LSTM结构, 最后输出
Attention
Attention部分, 先对LSTM输出做非线性激活, 然后计算attention权重.
最终的句表示:
Classifying
损失函数: 加上L2正则的交叉熵
实验
数据集: SemEval-2010
参数设置:
word embedding: 分别尝试了50, 100
optimizer: AdaDelta
learning rate: 1.0
batch size: 10
dropout: 0.3, 0.3, 0.5
评价指标: macro-F1score
最后
以上就是俊秀草丛为你收集整理的Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification阅读笔记Att-BLSTM的全部内容,希望文章能够帮你解决Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification阅读笔记Att-BLSTM所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复