Series
pandas에 대해 배울 첫 번째 주요 데이터 유형은 Series 데이터 유형입니다.
Pandas를 가져 와서 Series 개체를 살펴 보겠습니다.
시리즈는 NumPy 배열과 매우 유사합니다 (사실 NumPy 배열 객체 위에 구축 됨).
NumPy 배열과 Series의 차이점은 Series는 축 레이블을 가질 수 있다는 것입니다.
즉, 번호 위치가 아닌 레이블로 인덱싱 할 수 있습니다.
또한 숫자 데이터를 보유 할 필요가 없으며 임의의 Python 객체를 보유 할 수 있습니다.
import numpy as np
import pandas as pd
Creating a Series
You can convert a list,numpy array, or dictionary to a Series:
labels = ['a','b','c']
my_list = [10,20,30]
arr = np.array([10,20,30])
d = {'a':10,'b':20,'c':30}
pd.Series(data=my_list)
pd.Series(arr) # NumPy Arrays
'''
두 가지 모두 결과는 아래와 같다.
0 10
1 20
2 30
dtype: int64
'''
pd.Series(data=my_list,index=labels)
pd.Series(my_list,labels)
pd.Series(arr,labels) # NumPy Arrays
pd.Series(d) # Dictionary
'''
네 가지 모두 결과는 아래와 같다.
a 10
b 20
c 30
dtype: int64
'''
Using an Index
Series 사용의 핵심은 인덱스를 이해하는 것입니다.
Pandas는 정보의 빠른 조회를 허용하여 이러한 인덱스 이름 또는 숫자를 사용합니다.
ser1 = pd.Series([1,2,3,4],index = ['USA', 'Germany','USSR', 'Japan'])
'''
USA 1
Germany 2
USSR 3
Japan 4
dtype: int64
'''
ser2 = pd.Series([1,2,5,4],index = ['USA', 'Germany','Italy', 'Japan'])
'''
USA 1
Germany 2
Italy 5
Japan 4
dtype: int64
'''
ser1 + ser2
'''
Germany 4.0
Italy NaN
Japan 8.0
USA 2.0
USSR NaN
dtype: float64
'''
'Python > Numpy & Pandas' 카테고리의 다른 글
03-Missing Data (0) | 2020.12.01 |
---|---|
02-DataFrames (0) | 2020.11.30 |
03-Numpy Operations (0) | 2020.11.30 |
02-NumPy Indexing and Selection (0) | 2020.11.30 |
01-NumPy Arrays (0) | 2020.11.30 |