Python groupby 和 rank 函数排序错误:count 变量缺失
在使用 groupby 对数据进行分组排序时,遇到 count 变量不存在的错误。
错误分析
rank 函数用于对数据进行排名,需要指定排序依据的列名。错误提示表明 ok 数据中缺少名为 count 的列。
立即学习“Python免费学习笔记(深入)”;
解决方案
确认 ok 数据中确实没有 count 列后,可采用如下方法解决:
在对 ok 数据应用 groupby 和 rank 之前,需要先创建 count 列。 创建方法取决于 count 列的含义,例如,如果 count 代表每个 DISTRICT 的记录数,则可以使用如下代码:
ok['count'] = ok.groupby('DISTRICT')['DISTRICT'].transform('count')ok['rank'] = ok.groupby('DISTRICT')['count'].transform(lambda x: x.rank(method='first', ascending=False).astype(int))
登录后复制
这段代码首先使用 groupby(‘DISTRICT’)[‘DISTRICT’].transform(‘count’) 计算每个 DISTRICT 的记录数,并将结果存储在新的 count 列中。然后,使用 groupby(‘DISTRICT’)[‘count’].transform(…) 对每个 DISTRICT 内的 count 值进行排名,method=’first’ 保证相同值排名一致,ascending=False 表示降序排列,astype(int) 将排名转换为整数。
如果 count 列的含义不同,需要根据实际情况修改创建 count 列的代码。 确保在使用 rank 函数前,count 列已正确创建并包含有效数据。 这样就能避免 “count 变量不存在” 的错误。
以上就是Python groupby与rank排序时报错:count变量不存在怎么办?的详细内容,更多请关注【创想鸟】其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。
发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/2168415.html