簡介: 本文介紹如何找到和移除重復行。
- duplicated()方法
- 查看列是否重復
dataframe.colname.duplicated()
- 查看整行是否重復
dataframe.duplicated()
- 查看subset是否重復
dataframe.duplicated(subset = [])
- drop_duplicats()方法
用于丟棄重復項
dataframe.drop_duplicats()
- 參數keep
keep可以為first和last,表示是選擇最前一項還是最后一項保留。
dataframe.duplicated(keep = "first")
dataframe.duplicated(keep = "last")
也可以設置布爾類型,當設為False時候,重復項將都被顯示。
dataframe.duplicated(keep = "False")
附上小哥哥的視頻鏈接Data analysis in Python with pandas
Youtube ??
嗶哩嗶哩 ??
本系列文章列表
pandas使用技巧總覽