概述
由于pandas在进行数据拼接时主要是按照索引进行的,所以当出现NaN值时首先要检查自己的索引有无错误。其中索引出错的原因大致有以下几点:
对于无索引数据,首行不具有索引值,在利用默认方式进行读取时,会导致数据串位。解决办法——读取时对read函数中的header参数进行设置(对于没有表头的数据集文件,header默认为0,即将第一行数据作为列索引)
data=pd.read_csv("path",header=None)
对于有索引数据,首先要明确concat是按行还是按列进行(concat中参数axis=1为横向拼接,axis=0为纵向拼接)
- 对于横向拼接(按纵向索引拼接,行对齐)解决办法——重置索引,利用reset_index(drop=True)
data=data.reset_index(drop=True)
- 对于纵向拼接(按横向索引拼接,列对齐)解决办法——忽略索引,重置
data.concat([s1,s2], axis=0, ignore_index=True)
最后
以上就是落后大雁为你收集整理的pandas concat数据出现NaN值的全部内容,希望文章能够帮你解决pandas concat数据出现NaN值所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复