- 按行讀取txt,csv等文件,數據最后一個字段是分類類別
fo=open('filename.格式')
lines=fo.readlines()
numberOfLines=len(lines)
datas=np.zeros((numberOfLines,n)#n為字段個數-1
index=0
labels=[]#儲存分類字段
for line in lines:
line=line.strip()#去掉行尾空格
oneline=line.split('分隔符')
datas[index,:]=oneline[0:n]
labels.append(oneline[-1])
index+=1
- 使用Scipy讀取數據
import scipy as sp
data=sp.genfromtxt("文件名.格式",delimiter="分隔符")
- 使用pandas讀取csv
import pandas as pd
csvframe=pd.read_csv('文件名.csv')
(1)文件內不包含header的讀取
csvframe=pd.read_csv('mycsv_02.csv', header=None)
(2)用names指定header的讀取
pd.read_csv('mycsv_02.csv', names=['字段名1','字段名2','字段名3'])
- 讀取文件夾內所有文件
import os
data=[open(os.path.join('文件夾路徑',f)).read() for f in os.listdir('文件夾路徑')]
5.以字典形式讀取json文件
import json
path='路徑.txt'
records=[json.loads(line) for line in open(path)]