Pandas 读取 Excel 或者 csv 文件:
import pandas as pd
pd.read_excel(r'filepath', sheet_name='sheet1')
pd.read_csv(r'filepath')
DataFrame 拼接:
df1.append(df2)
DataFrame 筛选:
df.loc[df['A'] == 1],多条件 df.loc[(df['A'] == 1) & (df['B'] == 2)]
DataFrame 分组:
df.groupby(by=['A','B','C'])
DataFrame 删除列:
df.drop(labels=['A', 'B'], axis=1)
DataFrame 去重:
df.drop_duplicates(subset=['A','B','C','D'])
从 DataFrame 的头部或者尾部截取数据输出:
df.head()
df.tail(3)
不要在 for 循环中 append 数据,效率非常低
Pandas 的数据不能直接修改,添加属性需要复制一份:
import copy
new_frame_data = copy.copy(old_frame_data)
new_frame_data.attr = value
发表回复