Pandas DataFrame 常用操作

Pandas 读取 Excel 或者 csv 文件:

import pandas as pd

pd.read_excel(r'filepath', sheet_name='sheet1')
pd.read_csv(r'filepath')

DataFrame 拼接:

df1.append(df2)

DataFrame 筛选:

df.loc[df['A'] == 1],多条件 df.loc[(df['A'] == 1) & (df['B'] == 2)]

DataFrame 分组:

df.groupby(by=['A','B','C'])

DataFrame 删除列:

df.drop(labels=['A', 'B'], axis=1)

DataFrame 去重:

df.drop_duplicates(subset=['A','B','C','D'])

从 DataFrame 的头部或者尾部截取数据输出:

df.head()
df.tail(3)

不要在 for 循环中 append 数据,效率非常低

Pandas 的数据不能直接修改,添加属性需要复制一份:

import copy

new_frame_data = copy.copy(old_frame_data)
new_frame_data.attr = value

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注