pandas学习之数据加载即探索性数据分析
数据分析的一个重要包就是pandas。这里通过使用机器学习来做kaggle上的一个任务来学习pandas的使用,以及数据分析常用的一些编程方法与技巧。首先导入pandas包和numpy包,这里因为我使用了anaconda环境所以没有必要再进行pip安装了。然后再来讲解一下csv文件格式。从编码压缩方式来看,csv首先也是一种文本文档,而扩展名“csv”的意思就是这个文本文档里面记录的是以逗号或者其它符号分割的数据。所以打开csv文件当然可以使用python自带的输入输出流+管道读取(最简陋),也