寫在前面:幫助一位朋友解決一個自動化相關問題,記錄下來,希望能幫助到正在遇到此類問題的你提供思路,需求描述:
將左側 txt 文本數據自動生成 excel表格。txt規律是空行分隔的每組數據,左邊一列是 key ,也就是 excel 的標題 ,右邊是值。所以這里重點就是根據對應的key寫入對應的值。如果大家有什么好想法,歡迎留言,一起交流學習 ~
原始 txt 數據 VS 結果 excel 數據
實現思路:
①將txt數據劃分成兩列,整理數據格式【規范成只有key 和 value】
②將txt按照空值上下劃分數據,對每組數據寫入excel里的一行中
一、讀取原始 txt 數據
import pandas as pd
import numpy as np
txt_data = pd.read_table('test.txt')
txt_data
二、數據處理:一列數據變兩列
def process(df):
title = df.str.split()[0][0]
content = df.str.split()[0][-1]
if content == 'disable':
title = '是否啟用'
if title == 'exit':
title = np.nan
content = np.nan
return title,content
txt_data[['title','con']] = txt_data.apply(process,axis=1,result_type='expand')
txt_data[['title','con']].head(20)
三、按照title值為nan為條件,切分數據,通過找開始和結束索引將每組數據分塊,將每組數據寫入excel
lis = txt_data[txt_data['title'].isnull()==True].index.tolist()
lis.insert(0,-1)
for i, each in enumerate(range(1,len(lis))):
end=each
start=i
start_v = lis[start]+1
end_v = lis[end]
print(start_v,end_v)
data_write_excel(start_v,end_v)
print('寫入成功!')
四、根據指定【行索引,列索引】位置寫入每組數據,并自動匹配標題
# 結果表的標題模板
ds = pd.read_excel('res.xlsx')
ds.index = ds['rule']
def data_write_excel(start_v,end_v):
df = txt_data[['title','con']][start_v:end_v]
inx = df['con'][start_v]
print(inx)
li = []
for i,j in df.T.items():
z = 1
if j['title'] in li:
z += 1
li.append(j['title'])
ds.loc[inx,j['title']+'_'+str(z)]=j['con']
else:
li.append(j['title'])
ds.loc[inx,j['title']]=j['con']
ds.to_excel('res.xlsx')
五、實現效果
完 ~ 如果覺得對你有幫助歡迎點贊 ~