如何结合其他函数使用Python的fillna

   2024-09-30 3170
核心提示:fillna() 是一个用于填充缺失值(NaN)的函数,通常在 Pandas DataFrame 或 Series 中使用首先,我们需要导入所需的库并创建一个

fillna() 是一个用于填充缺失值(NaN)的函数,通常在 Pandas DataFrame 或 Series 中使用

首先,我们需要导入所需的库并创建一个包含缺失值的示例 DataFrame:

import pandas as pdimport numpy as npdata = {'A': [1, 2, np.nan], 'B': [4, np.nan, 6], 'C': [7, 8, 9]}df = pd.DataFrame(data)print("原始 DataFrame:")print(df)

这将输出以下 DataFrame:

原始 DataFrame:     A    B  C0  1.0  4.0  71  2.0  NaN  82  NaN  6.0  9

现在,让我们使用 fillna() 函数填充缺失值。有多种方法可以实现这一点:

使用特定值填充:
filled_df = df.fillna(value=0)print("使用特定值填充后的 DataFrame:")print(filled_df)

这将输出以下 DataFrame:

使用特定值填充后的 DataFrame:     A    B  C0  1.0  4.0  71  2.0  0.0  82  0.0  6.0  9
使用前一个值填充:
filled_df = df.fillna(method='ffill')print("使用前一个值填充后的 DataFrame:")print(filled_df)

这将输出以下 DataFrame:

使用前一个值填充后的 DataFrame:     A    B  C0  1.0  4.0  71  2.0  4.0  82  2.0  6.0  9
使用后一个值填充:
filled_df = df.fillna(method='bfill')print("使用后一个值填充后的 DataFrame:")print(filled_df)

这将输出以下 DataFrame:

使用后一个值填充后的 DataFrame:     A    B  C0  1.0  4.0  71  2.0  6.0  82  1.0  6.0  9
使用平均值、中位数或众数等统计方法填充:
filled_df = df.fillna(df.mean())print("使用平均值填充后的 DataFrame:")print(filled_df)filled_df = df.fillna(df.median())print("使用中位数填充后的 DataFrame:")print(filled_df)filled_df = df.apply(lambda x: x.fillna(x.mode().iloc[0]))print("使用众数填充后的 DataFrame:")print(filled_df)

这些示例展示了如何结合其他函数使用 fillna() 来填充 DataFrame 中的缺失值。您可以根据需求选择适当的填充方法。

 
举报打赏
 
更多>同类网点查询
推荐图文
推荐网点查询
点击排行

网站首页  |  关于我们  |  联系方式网站留言    |  赣ICP备2021007278号