【Python_Pandas】reset_index函数解析

文章目录

  • 【Python_Pandas】reset_index函数解析
    • 1. 介绍
    • 2. 示例
      • 2.1 参数drop
      • 2.2 参数inplace
      • 2.3 参数level
      • 2.4 参数col_level
      • 2.5 参数col_fill
    • 参考

1. 介绍

pandas.DataFrame.reset_index

reset_index(level=None, drop=False, inplace=False, col_level=0, col_fill='')

1)函数作用:

  • 重置索引或其level。
    • 重置数据帧的索引,并使用默认索引。如果数据帧具有多重索引,则此方法可以删除一个或多个level。

2)参数:

  • drop: 重新设置索引后是否将原索引作为新的一列并入DataFrame,默认为False
  • inplace: 是否在原DataFrame上改动,默认为False
  • level: 如果索引(index)有多个列,仅从索引中删除level指定的列,默认删除所有列
  • col_level: 如果列名(columns)有多个级别,决定被删除的索引将插入哪个级别,默认插入第一级
  • col_fill: 如果列名(columns)有多个级别,决定其他级别如何命名

3)返回

  • DataFrame or None。具有新索引的数据帧,如果inplace=True,则无索引。

2. 示例

2.1 参数drop

  • False:表示重新设置索引后,将原索引作为新的一列并入DataFrame,
  • True:表示删除原索引
import pandas as pdimport numpy as npdf = pd.DataFrame([('bird', 389.0), ('bird', 24.0), ('mammal', 80.5), ('mammal', np.nan)],index=['falcon', 'parrot', 'lion', 'monkey'], columns=('class', 'max_speed'))print(df)print('\n')df1 = df.reset_index()print(df1)print('\n')df2 = df.reset_index(drop=True)print(df2)
  • 输出:

2.2 参数inplace

  • True表示:在原DataFrame上修改,返回为None
  • False:将修改后的DataFrame作为新的对象返回
import pandas as pdimport numpy as npdf = pd.DataFrame([('bird', 389.0), ('bird', 24.0), ('mammal', 80.5), ('mammal', np.nan)],index=['falcon', 'parrot', 'lion', 'monkey'], columns=('class', 'max_speed'))print(df)print('\n')df1 = df.reset_index()print(df1)print('\n')df2 = df.reset_index(inplace=True)print(df2)print('\n')print(df)
  • 输出:

2.3 参数level

如果索引有多个列,仅从索引中删除由level指定的列,默认删除所有列。

  • 输入整数时表示将index的names中下标为level的索引删除;
  • 输入为字符串时表示将名字为level的索引删除
import pandas as pdimport numpy as npindex = pd.MultiIndex.from_tuples([('bird', 'falcon'), ('bird', 'parrot'), ('mammal', 'lion'), ('mammal', 'monkey')], names=['class', 'name'])columns = pd.MultiIndex.from_tuples([('speed', 'max'), ('species', 'type')])df = pd.DataFrame([(389.0, 'fly'), ( 24.0, 'fly'), ( 80.5, 'run'), (np.nan, 'jump')], index=index, columns=columns)print(df)print('\n')df0 = df.reset_index()print(df0)print('\n')df1 = df.reset_index(level=1)print(df1)print('\n')df2 = df.reset_index(level='name')print(df2)
  • 输出:

2.4 参数col_level

如果列名(columns)有多个级别,决定被删除的索引将插入哪个级别,默认插入第一级(col_level=0)

import pandas as pdimport numpy as npindex = pd.MultiIndex.from_tuples([('bird', 'falcon'), ('bird', 'parrot'), ('mammal', 'lion'), ('mammal', 'monkey')], names=['class', 'name'])columns = pd.MultiIndex.from_tuples([('speed', 'max'), ('species', 'type')])df = pd.DataFrame([(389.0, 'fly'), ( 24.0, 'fly'), ( 80.5, 'run'), (np.nan, 'jump')], index=index, columns=columns)print(df)print('\n')df1 = df.reset_index(level=0, col_level=0)print(df1)print('\n')df2 = df.reset_index(level=0, col_level=1)print(df2)print('\n')
  • 输出:

2.5 参数col_fill

重置索引时被删除的索引只能插入一个级别,

  • 如果列名(columns)有多个级别,那么这个列的列名的其他级别如何命名就由col_fill决定,默认不做填充,
  • 如果传入None则用被删除的索引的名字填充
import pandas as pdimport numpy as npindex = pd.MultiIndex.from_tuples([('bird', 'falcon'), ('bird', 'parrot'), ('mammal', 'lion'), ('mammal', 'monkey')], names=['class', 'name'])columns = pd.MultiIndex.from_tuples([('speed', 'max'), ('species', 'type')])df = pd.DataFrame([(389.0, 'fly'), ( 24.0, 'fly'), ( 80.5, 'run'), (np.nan, 'jump')], index=index, columns=columns)print(df)print('\n')df0 = df.reset_index(level=0, col_level=0)print(df0)print('\n')df1 = df.reset_index(level=0, col_level=0, col_fill=None)print(df1)print('\n')df2 = df.reset_index(level=0, col_level=1, col_fill='species')print(df2)print('\n')df3 = df.reset_index(level=0, col_level=0, col_fill='genus')print(df3)print('\n')
  • 输出:

参考

【1】https://blog.csdn.net/weixin_43298886/article/details/108090189