目录
1.多重索引概述2.多重索引的基本操作2.1 选择和切片多重索引2.2 交换层级与重设索引3.多重索引的高级操作3.1 多重索引的分组聚合3.2 多索引切片操作3.3 多重索引的排序4.多重索引的实际应用场景大家好,在数据分析中,处理复杂的多维数据是常见的需求。Python的Pandas库提供了强大的多重索引(MultiIndex)功能,能够灵活地管理和分析多层级的数据结构。本文将介绍Pandas中的多重索引,探讨如何创建、操作和重设多重索引,并通过具体的示例代码展示其在实际应用中的强大功能。
1.多重索引概述
多重索引是一种层次化的索引方式,它允许在DataFrame或Series中使用多个级别的索引。通过多重索引,我们可以更清晰地表达数据的层级关系,使得处理复杂数据集变得更加直观和高效。
可以通过多列数据创建多重索引,从而将DataFrame组织成具有层次结构的形式。
import pandas as pd# 创建一个包含多个级别的DataFramedata = {'城市': ['北京', '北京', '上海', '上海', '广州', '广州'], '年份': [2020, 2021, 2020, 2021, 2020, 2021], '人口': [2154, 2160, 2424, 2430, 1530, 1540], 'GDP': [36102, 37200, 38155, 39400, 25000, 26000]}df = pd.DataFrame(data)# 设置多重索引df.set_index(['城市', '年份'], inplace=True)print(df)
运行