etl清洗框架 python_EXCEL数据太“脏”无从下手?何须用python,ETL一分钟搞定
我们日常在处理数据的过程中,总是会遇到各种千奇百怪的数据源,不是这里有重复值,就是那里的数据有缺失,这些“脏数据”不得不花费我们大量的时间去进行清理,让人十分苦恼。造成这些“脏数据”的原因有两个,一是系统默认的数据字段不规范,在导出时经常带有一些不标准的字符,二是人为录入错误,因为在数据的生成过程中,往往会受到人为的干预,比如重复录入、数据类型不一致等等。这些“脏”数据不仅没有价值,还会“污染”其...