应用pandas中的read_csv模块直接将数据读掏出来。(引荐进修:Python视频教程)
data = pd.read_csv('/home/nw/Desktop/dataset/iris.txt',header = None)
上面的代码,read_csv中前面的是数据集寄存的途径,背面的header很主要,常常认为少了header,数据的总量减小了1,由于少掉的那一行数据变成了DataFrame内里的列索引。
另有一种是比较传统的要领,直接用open翻开文件,把文件内里的信息先掏出来,不论掏出来是什么模样的,先掏出来再说,想要作什么处置惩罚直接对掏出的变量做处置惩罚即可。
f= open('/home/nw/Desktop/dataset/iris.txt','rb') dataset = pickle.load(f) #这类要领适用于本身存取本身的数据,有时刻在读取他人的数据的时刻是不可的,由于他人存数据的体式格局不一定是用pickle.dump的方 ##式存数据的。 f = open('/home/nw/Desktop/dataset/iris.txt') ''' 注重这里的open背面最好不要加上其他的读取体式格局,不需要‘rb’之类的读取体式格局。由于在后续的数据处置惩罚中能够还需要将二进制的数 据转换成本身想要的个数。 ''' lines = f.readlines() ''' 如今lines中已包含了一切的数据信息,我们想要获得的数据格式都能够基于lines做处置惩罚。如我读出的iris数据格式是一个列表的形 式,运用len(lines)获得列表中元素的个数是151,打印出lines,能够看到lines中每一个元素都是一个字符串,而且每一个字符串背面都 有'\n'的换行字符,末了一行是空行,所以末了一行是过剩,而且要去掉每行中的'\n' ''' arr = [] for i in range(len(lines)): if lines[i] != '\n': arr.append(lines[i]) for i in range(len(arr)): arr[i] = arr[i].strip('\n')#将每行的'\n'脱去
更多Python相干技术文章,请接见Python教程栏目举行进修!
以上就是python怎样读取数据的细致内容,更多请关注ki4网别的相干文章!