Series

pandas에 대해 배울 첫 번째 주요 데이터 유형은 Series 데이터 유형입니다. 

Pandas를 가져 와서 Series 개체를 살펴 보겠습니다.

시리즈는 NumPy 배열과 매우 유사합니다 (사실 NumPy 배열 객체 위에 구축 됨). 

NumPy 배열과 Series의 차이점은 Series는 축 레이블을 가질 수 있다는 것입니다.

즉, 번호 위치가 아닌 레이블로 인덱싱 할 수 있습니다. 

또한 숫자 데이터를 보유 할 필요가 없으며 임의의 Python 객체를 보유 할 수 있습니다.

 

import numpy as np
import pandas as pd

 

Creating a Series

You can convert a list,numpy array, or dictionary to a Series:

labels = ['a','b','c']
my_list = [10,20,30]
arr = np.array([10,20,30])
d = {'a':10,'b':20,'c':30}

pd.Series(data=my_list)
pd.Series(arr) # NumPy Arrays
'''
두 가지 모두 결과는 아래와 같다.
0    10
1    20
2    30
dtype: int64
'''

pd.Series(data=my_list,index=labels)
pd.Series(my_list,labels)
pd.Series(arr,labels) # NumPy Arrays
pd.Series(d) # Dictionary
'''
네 가지 모두 결과는 아래와 같다.
a    10
b    20
c    30
dtype: int64
'''

 

Using an Index

Series 사용의 핵심은 인덱스를 이해하는 것입니다. 

Pandas는 정보의 빠른 조회를 허용하여 이러한 인덱스 이름 또는 숫자를 사용합니다.

ser1 = pd.Series([1,2,3,4],index = ['USA', 'Germany','USSR', 'Japan'])  
'''
USA        1
Germany    2
USSR       3
Japan      4
dtype: int64
'''

ser2 = pd.Series([1,2,5,4],index = ['USA', 'Germany','Italy', 'Japan']) 
'''
USA        1
Germany    2
Italy      5
Japan      4
dtype: int64
'''

ser1 + ser2
'''
Germany    4.0
Italy      NaN
Japan      8.0
USA        2.0
USSR       NaN
dtype: float64
'''

 

 

 

'Python > Numpy & Pandas' 카테고리의 다른 글

03-Missing Data  (0) 2020.12.01
02-DataFrames  (0) 2020.11.30
03-Numpy Operations  (0) 2020.11.30
02-NumPy Indexing and Selection  (0) 2020.11.30
01-NumPy Arrays  (0) 2020.11.30
블로그 이미지

hjc_

୧( “̮ )୨

,