1. 首页
  2. 编程语言
  3. Python
  4. Pandas数据索引:结构与操作

Pandas数据索引:结构与操作

上传者: 2024-07-01 20:39:42上传 IPYNB文件 46.86KB 热度 8次

Pandas 数据索引:结构与操作

深入探讨 Pandas 中 Series 和 DataFrame 两种数据结构的索引机制,并结合实际案例阐述索引的基本操作,包括索引的创建、访问、切片、筛选等,以帮助读者掌握使用索引高效提取数据的技巧。

数据结构与索引

Pandas 提供 Series 和 DataFrame 两种主要数据结构,两者都拥有索引来管理数据:

  • Series: 一维带标签数组,其索引可以是整数、字符串等多种类型。
  • DataFrame: 二维表格数据,包含行索引和列索引,类似于数据库中的表结构。

索引操作

  1. 索引创建: 可以使用自定义索引创建 Series 和 DataFrame,或在读取数据时指定索引列。

```python

import pandas as pd

# 自定义索引创建 Series

data = {'a': 1, 'b': 2, 'c': 3}

s = pd.Series(data, index=['c', 'a', 'b'])

# 使用现有列作为索引创建 DataFrame

df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})

df = df.set_index('A')

```

  1. 索引访问: 可以使用索引标签或位置获取对应数据。

```python

# 获取 Series 中标签为 'a' 的数据

s['a']

# 获取 DataFrame 中索引值为 2 的行数据

df.iloc[2]

```

  1. 索引切片: 可以使用切片语法选取特定范围的数据。

```python

# 获取 Series 中标签 'a' 到 'b' 的数据

s['a':'b']

# 获取 DataFrame 中索引值为 1 到 2 的行数据

df.iloc[1:3]

```

  1. 索引筛选: 可以使用布尔条件筛选满足特定条件的数据。

```python

# 获取 Series 中值大于 2 的数据

s[s > 2]

# 获取 DataFrame 中 A 列值大于 1 的行数据

df[df['A'] > 1]

```

总结

熟练掌握 Pandas 的数据索引机制和操作方法,是进行高效数据分析和处理的关键。通过灵活运用索引,可以快速定位、提取和操作数据,显著提升数据分析效率。

用户评论