问题内容
我在 pandas 数据框中有以下数据:
65贝德227d202
我想对三列(第一、第二、第三)执行一些简单的分析(例如 sum、groupby),但这三列的数据类型是对象(或字符串)。
所以我使用了以下代码进行数据转换:
65贝德227d217
但是,由于美元符号的原因,转换可能不起作用。有什么建议吗?
正确答案
pandas 有 3 个 .replace 方法:pandas.series.replace栏目pandas.series.str.replace a> 对于一列pandas.dataframe.replace 对于多个列,并且无需使用 .applyregex=false 是默认设置,因此设置 regex=truedf[df.columns[1:]] 选择最后三列。在 python 3.11.4、pandas 2.1.0 中测试
- # replace values only in selected columnsdf[df.columns[1:]] = df[df.columns[1:]].replace('[$,]', '', regex=True).astype(float)# replace values in all columnsdf = df.replace('[$,]', '', regex=True).astype(float)
登录后复制清理货币列的其他模式:'[^.0-9]’:删除除小数点外的所有非数字'[^.0-9-]’:删除除小数点和负号之外的所有非数字’d’:删除所有非数字,包括小数点和负号,因此适用于仅正 int 列
以上就是如何将带有 $ 和 , 的货币列转换为数字的详细内容,更多请关注【创想鸟】其它相关文章!
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。