Pandas中怎么进行数据离散化

   2024-10-18 6280
核心提示:Pandas中可以使用cut函数进行数据离散化,将连续数据分成不同的区间。下面是一个例子:import pandas as pd# 创建一个包含连续数

Pandas中可以使用cut函数进行数据离散化,将连续数据分成不同的区间。下面是一个例子:

import pandas as pd# 创建一个包含连续数据的Seriesdata = pd.Series([1, 5, 10, 15, 20, 25, 30])# 使用cut函数将数据离散化成3个区间bins = [0, 10, 20, 30]labels = ['low', 'medium', 'high']discretized_data = pd.cut(data, bins, labels=labels)print(discretized_data)

输出结果如下:

0       low1       low2    medium3    medium4    medium5      high6      highdtype: categoryCategories (3, object): ['low' < 'medium' < 'high']

在上面的例子中,我们将数据分成了3个区间:0-10为低(low)、10-20为中等(medium)、20-30为高(high)。

 
举报打赏
 
更多>同类维修大全
推荐图文
推荐维修大全
点击排行

网站首页  |  关于我们  |  联系方式网站留言    |  赣ICP备2021007278号