并不是我们写完的每一个代码块,或者是字符串都是全部直接可以拿去用的,因为很多的代码块的整合,总是会碰到,链接处的删除或者整改,还有些重复性的内容也需要去查找出来,然后在进行处理,这样的一系列流程就是语言中的数据表的清洗,清洗是非常重要的,要求去除累赘,这样对整个代码的贴合也有巨大的作用。
常见的数据表清晰内容如下:
删除空值的行
df.dropna(how='any')
填充空值
df.fillna(value=0)
对 NA 进行填充
df['column_name'].fillna(df['column_name'].mean())
清除字符空格
df['column_name']=df['column_name'].map(str.strip)
更改数据格式
df['column_name'].astype('int')
以上就是常见的数据表清理内容了,大家如果在完成代码后,觉得运行速度或者担心有不需要用到的代码内容,就可以使用以上这些方式实现了哦~好啦,更多学习内容,尽在。