《Python深度学习》6.1文本数据处理
深度学习用于文本和序列可以做很多工作,比如识别文章的主题或书的作者;两个文档或两支股票行情的相关程度(是不是可以做主任想做的简答题的判断);翻译; 情感分析,推文或者影评的正面或者负面评论 ; 时间序列预测,如天气,股票预测,本章不都将主要讲红色部分两个主题。处理文本数据主要有两种方式one-hot和token embedding。深度学习不会接受原始文本作为输入,他只能处理数值张量,文本向量化是指将文本转换为数值张量的过程。具体的做法就不在说了,这边想说一下一些感悟。token embeddi