日々ブログ

当サイトは、アフィリエイトプログラムにより商品をご紹介しています

【プログラミング】Dataframeの欠損値の取り扱い

NaNの数を削除

sumメソッドにおいて、Trueが1として扱われることを利用

df.isnull().sum()

NaNの値を抽出

 条件式でTrueの箇所だけを指定することで抽出する。 DataframeはNaNに対する様々なメソッドはあるがひとまずこれさえあればどうにかできる気がする(無責任)。 メソッド名も分かりやすいし。

df[df.isnull()]

NaNの値の置き換え抽出

 1行で書けるだけで、結局上の方法の抽出を使えば応用できそうだが。 とりあえず、中央値に置き換えて動かしたいときに。

df.fillna(df.median())

まとめ

pandas ってDataFrameとSeriesで少しお作法が異なるので動かない場合があるかもしれません。