博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python pandas replace函数
阅读量:6677 次
发布时间:2019-06-25

本文共 660 字,大约阅读时间需要 2 分钟。

在处理数据的时候,很多时候会遇到批量替换的情况,如果一个一个去修改效率过低,也容易出错。replace()是很好的方法。

1.基本结构:

df.replace(to_replace, value) 前面是需要替换的值,后面是替换后的值。

这样会搜索整个DataFrame, 并将所有符合条件的元素全部替换。

进行上述操作之后,其实原DataFrame是并没有改变的。改变的只是一个复制品。

 

2. 如果需要改变原数据,需要添加常用参数 inplace=True

这个参数在一般情况没多大用处,但是如果只替换部分区域时,inplace参数就有用了。

在上面这个操作中,‘合计’这一列中的0,并没有被替换。只有‘金额’这一列的0被替换,而且,替换后的结果不需要我们再和原数据进行合并操作,直接体现在原数据中。

 

只对某一列特定的值进行替换:

result['prediction'].replace([0,1,2,3,4,5,6,7,8],[870,870,880,898,1300,13117,13298,13690,13691],inplace=True)

 

BTW: 在pyspark 中的 replace() 函数

result.na.replace([0,1,2,3,4,5,6,7,8], [870,878,880,898,1300,13117,13298,13690,13691], 'prediction')

https://www.cnblogs.com/nshuai/articles/5762343.html

你可能感兴趣的文章
《条目二十九:对于逐个字符的输入请考虑istreambuf_iterator》
查看>>
Python的优点与功能
查看>>
sed实例精解--例说sed完整版
查看>>
apache安装mod_ssl.so 出现 undefined symbol: ssl_cmd_SSLPassPhraseDialog错误解决
查看>>
概念,
查看>>
招财铃,负责模块,
查看>>
三个文件,
查看>>
webpack的总结
查看>>
hibernate 一级缓存和二级缓存
查看>>
HDU1576 A/B,模拟元
查看>>
javac不是内部或外部命令
查看>>
easuyi datatox 选择年月
查看>>
C++中使用多线程
查看>>
mvc SelectList selected失效的解决方法
查看>>
JAVA 设计模式 中介者模式
查看>>
caffe环境配置2
查看>>
我的软件工程课目标
查看>>
var a={n:1}; var b=a; a.x=a={n:2}; console.log(a.x); console.log(b.x);
查看>>
【HDOJ】3016 Man Down
查看>>
window.open打开新页面,并将本页数据用过url传递到打开的页面;需要两个页面;...
查看>>