当前位置：首页 > article >正文

df.set_index(‘name‘).groupby(‘team‘).apply(first_3, ‘Q1‘)

article 2025/1/6 19:46:59

df.set_index('name').groupby('team').apply(first_3, 'Q1')中的first_3是你自己定义的一个函数，目的是从每个团队的DataFrame中找出Q1成绩最高的前三个成员。这个函数的工作原理是根据某一列（比如Q1成绩）排序，并返回排序后的前三个记录。

我会通过一个具体的数值例子来详细解释这个函数的作用和使用方式。

假设我们有以下DataFrame：

import pandas as pd

# 构造一个示例DataFrame
data = {
    'name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve', 'Frank'],
    'team': ['A', 'A', 'B', 'B', 'A', 'B'],
    'Q1': [90, 80, 85, 92, 95, 88]
}
df = pd.DataFrame(data)
print(df)

输出：

      name team  Q1
0    Alice    A  90
1      Bob    A  80
2  Charlie    B  85
3    David    B  92
4      Eve    A  95
5    Frank    B  88

我们希望找出每个团队在Q1成绩最高的前三个成员，使用你定义的first_3函数。first_3函数的功能是，接收一个DataFrame df_和一个列名c，并返回在该列上排名前3的记录。

`first_3`函数：

def first_3(df_, c):
    return df_.nlargest(3, c)

nlargest(3, c)：表示根据列c（比如Q1）中的值，返回前3个最大的记录。

调用过程：

我们将按团队'team'对DataFrame进行分组，并在每个组中调用first_3函数，找出Q1成绩最高的前三名。

# 调用函数
result = df.set_index('name').groupby('team').apply(first_3, 'Q1')
print(result)

结果：

            team  Q1
name                 
Eve          A  95
Alice        A  90
Bob          A  80
David        B  92
Frank        B  88
Charlie      B  85

解释：

在团队A中，first_3(df_, 'Q1')会选出Q1成绩最高的前三个成员，排序结果为：
- Eve (95), Alice (90), Bob (80)
在团队B中，first_3(df_, 'Q1')会选出Q1成绩最高的前三个成员，排序结果为：
- David (92), Frank (88), Charlie (85)