我是靠谱客的博主 鳗鱼皮带,这篇文章主要介绍pythpython-dataframe数据预处理(一)之txt数据集文件分割,现在分享给大家,希望可以做个参考。

复制代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
''' fun: 一个txt文件a有x行,y列。一行代表一个样本,第1-(y-1)代表特征,第y列代表样本的类别(即标签例如有c1/c2/c3三个类别), 此代码依据样本的标签列,将a.txt分割成 c1.txt、 c2.txt、 c3.txt。 ''' # -*- coding: utf-8 -*- import pandas as pd import numpy as np feature_size = 45 col_index = [] for i in range(feature_size): col_index.append('f%d'%i) col_index.append('class') #列索引 data = pd.read_csv(r'./Tr11_end.csv',names=col_index) rows = len(data ) #求出一共多少行 cols = data.columns.size # print("源文件共有 %d 行"%rows) # print("源文件共有 %d 列"%cols) classes = data['class'].unique() #数据共有几个类别 for c in classes: name = 'data' + c data_seg = data[ data['class']==c ] data_seg.to_csv(r'./segm'+"//" +name+".csv",index=False) #index=false控制输出文件中不自动添加列序号 #data.columns = col_index #重新为列索引赋值 #print (data.columns) #列索引名称 # print (data.index) #行索引名称 #print(data[cols-1][:10])

最后

以上就是鳗鱼皮带最近收集整理的关于pythpython-dataframe数据预处理(一)之txt数据集文件分割的全部内容,更多相关pythpython-dataframe数据预处理(一)之txt数据集文件分割内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(99)

评论列表共有 0 条评论

立即
投稿
返回
顶部