Missing Data

import numpy as np
import pandas as pd

df = pd.DataFrame({'A':[1,2,np.nan],
                  'B':[5,np.nan,np.nan],
                  'C':[1,2,3]})
'''
	  A	  B	C
0	1.0	5.0	1
1	2.0	NaN	2
2	NaN	NaN	3
'''

df.dropna()   # axis=0 , 결측값이 있는 행 제거 
'''
	A	B	C
0	1.0	5.0	1
'''

df.dropna(axis=1) # 결측값이 있는 열 제거 
'''
	C
0	1
1	2
2	3
'''
df.dropna(thresh=2)  # NAN 아닌 값이 2 개 이상있는 행만 유지합니다.
'''
	A	B	C
0	1.0	5.0	1
1	2.0	NaN	2
'''

df.fillna(value='FILL VALUE') # 결측값을 특정값(FILL VALUE)으로 채우기 
'''
		A		B	C
0		1		5	1
1		2	FILL VALUE	2
2	FILL VALUE	FILL VALUE	3
'''

df['A'].fillna(value=df['A'].mean())
'''
0    1.0
1    2.0
2    1.5
Name: A, dtype: float64
'''

 

 

Great Job!

'Python > Numpy & Pandas' 카테고리의 다른 글

05-Merging, Joining, and Concatenating  (0) 2020.12.01
04-Groupby  (0) 2020.12.01
02-DataFrames  (0) 2020.11.30
01-Introduction to Pandas, and Series  (0) 2020.11.30
03-Numpy Operations  (0) 2020.11.30
블로그 이미지

hjc_

୧( “̮ )୨

,