Missing Data
import numpy as np
import pandas as pd
df = pd.DataFrame({'A':[1,2,np.nan],
'B':[5,np.nan,np.nan],
'C':[1,2,3]})
'''
A B C
0 1.0 5.0 1
1 2.0 NaN 2
2 NaN NaN 3
'''
df.dropna() # axis=0 , 결측값이 있는 행 제거
'''
A B C
0 1.0 5.0 1
'''
df.dropna(axis=1) # 결측값이 있는 열 제거
'''
C
0 1
1 2
2 3
'''
df.dropna(thresh=2) # NAN 아닌 값이 2 개 이상있는 행만 유지합니다.
'''
A B C
0 1.0 5.0 1
1 2.0 NaN 2
'''
df.fillna(value='FILL VALUE') # 결측값을 특정값(FILL VALUE)으로 채우기
'''
A B C
0 1 5 1
1 2 FILL VALUE 2
2 FILL VALUE FILL VALUE 3
'''
df['A'].fillna(value=df['A'].mean())
'''
0 1.0
1 2.0
2 1.5
Name: A, dtype: float64
'''
Great Job!
'Python > Numpy & Pandas' 카테고리의 다른 글
05-Merging, Joining, and Concatenating (0) | 2020.12.01 |
---|---|
04-Groupby (0) | 2020.12.01 |
02-DataFrames (0) | 2020.11.30 |
01-Introduction to Pandas, and Series (0) | 2020.11.30 |
03-Numpy Operations (0) | 2020.11.30 |