《Python深度学习》6.1文本数据处理

280 阅读 0 评论 185 点赞

我是靠谱客的博主机灵帽子，这篇文章主要介绍《Python深度学习》6.1文本数据处理，现在分享给大家，希望可以做个参考。

深度学习用于文本和序列可以做很多工作，比如识别文章的主题或书的作者；两个文档或两支股票行情的相关程度（是不是可以做主任想做的简答题的判断）；翻译；情感分析，推文或者影评的正面或者负面评论；时间序列预测，如天气，股票预测，本章不都将主要讲红色部分两个主题。

处理文本数据主要有两种方式one-hot和token embedding。深度学习不会接受原始文本作为输入，他只能处理数值张量，文本向量化是指将文本转换为数值张量的过程。

具体的做法就不在说了，这边想说一下一些感悟。token embedding是将单词构建成向量，单词之间的关系映射为向量之间的关系，整个embedding层的变量就是这些向量的值，通过反向传播，不断的修正这些值，也就是解这些参数。embedding层的三个参数，并没有严格意义的矩阵的形式，其实就是三个参数，后面两个是由矩阵意义的，但是如果把max_words想成一维就会有问题。

maxlen=100书上说是取得前100个words但是我看的都是从后往前数了100个，第一个是舍弃的。

问题是在列表中，使用array作为索引和适应列表作为索引，这个不同我只知道不同，没有搞清楚为什么不同。

最后

以上就是机灵帽子最近收集整理的关于《Python深度学习》6.1文本数据处理的全部内容，更多相关《Python深度学习》6内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(185)

本文分类：深度学习
浏览次数：280 次浏览
发布日期：2024-08-08 13:05:02

相关文章

机器学习-文本处理基础知识文本转换分词工具:jieba

机器学习-文本处理基础知识文本转换分词工具:jieba

文本数据处理(自然语言处理基础)

文本数据处理(自然语言处理基础)

处理文本数据的一些思路

自然语言处理（NLP）基础部分（一）

自然语言处理（NLP）基础部分（一）

《Python深度学习》6.1文本数据处理

《Python深度学习》6.1文本数据处理

那些你不知道数据文本处理的方法前言一、excel的分列技术二、VS code文本编辑技术

那些你不知道数据文本处理的方法前言一、excel的分列技术二、VS code文本编辑技术

Python机器学习从入门到高级：快速处理文本（含代码）Python机器学习：文本处理????1. 清洗文本????2. 解析并清洗HTML????3. 移除标点????4. 文本分词

Python机器学习从入门到高级：快速处理文本（含代码）Python机器学习：文本处理????1. 清洗文本????2. 解析并清洗HTML????3. 移除标点????4. 文本分词

自然语言处理学习路线图

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部