Pandas – 之美

Pandas 读取 Excel 或者 csv 文件：

import pandas as pd

pd.read_excel(r'filepath', sheet_name='sheet1')
pd.read_csv(r'filepath')

DataFrame 拼接：

df1.append(df2)

DataFrame 筛选：

df.loc[df['A'] == 1]，多条件 df.loc[(df['A'] == 1) & (df['B'] == 2)]

DataFrame 分组：

df.groupby(by=['A','B','C'])

DataFrame 删除列：

df.drop(labels=['A', 'B'], axis=1)

DataFrame 去重：

df.drop_duplicates(subset=['A','B','C','D'])

从 DataFrame 的头部或者尾部截取数据输出：

df.head()
df.tail(3)

不要在 for 循环中 append 数据，效率非常低

Pandas 的数据不能直接修改，添加属性需要复制一份：

import copy

new_frame_data = copy.copy(old_frame_data)
new_frame_data.attr = value

标签： Pandas