시리즈는 index와 value가 일대일 대응을 하는 1차원 배열 형태의 자료구조이다. {k, ,v}형태로 짝을 이루는 딕셔너리와 비슷하다.
딕셔너리와 비슷하기 때문에 딕셔너리를 시리즈로 변환하는 방법을 많이 사용한다.
pandas.Series(딕셔너리)
import pandas as pd
dict_data = {"a": 1, "b": 2, "c": 3}
sr = pd.Series(dict_data)
print(type(sr))
print()
print(sr)
<class 'pandas.core.series.Series'>
a 1
b 2
c 3
dtype: int64
인덱스는 두 가지 종류가 있다.
Series클래스의 Attribute를 이용해서 index배열과 value배열을 따로 뽑아낼 수 있다.
sr.index sr.values
List를 Series로 변환할 경우 key가 존재하지 않으므로 default로 Interger position이 생긴다.
import pandas as pd
list_data = ['200614', 3.14, "ABC", 100, True]
sr = pd.Series(list_data)
print(sr)
0 200614
1 3.14
2 ABC
3 100
4 True
dtype: object
index는 RangeIndex라는 객체로 저장된다.
import pandas as pd
list_data = ['200614', 3.14, "ABC", 100, True]
sr = pd.Series(list_data)
idx = sr.index
val = sr.values
print(idx)
print(val)