标签: Pandas

  • Pandas DataFrame 常用操作

    Pandas DataFrame 常用操作

    Pandas 读取 Excel 或者 csv 文件:

    import pandas as pd
    
    pd.read_excel(r'filepath', sheet_name='sheet1')
    pd.read_csv(r'filepath')

    DataFrame 拼接:

    df1.append(df2)

    DataFrame 筛选:

    df.loc[df['A'] == 1],多条件 df.loc[(df['A'] == 1) & (df['B'] == 2)]

    DataFrame 分组:

    df.groupby(by=['A','B','C'])

    DataFrame 删除列:

    df.drop(labels=['A', 'B'], axis=1)

    DataFrame 去重:

    df.drop_duplicates(subset=['A','B','C','D'])

    从 DataFrame 的头部或者尾部截取数据输出:

    df.head()
    df.tail(3)

    不要在 for 循环中 append 数据,效率非常低

    Pandas 的数据不能直接修改,添加属性需要复制一份:

    import copy
    
    new_frame_data = copy.copy(old_frame_data)
    new_frame_data.attr = value