시리즈
- 시리즈를 생성하는 클래스 :
pd.Series([], index=[])
- 리스트를 시리즈로 변환하기
### 리스트를 시리즈로 변환하기
# - 리스트의 index번호는 시리즈의 index값으로 사용됨
# - 리스트의 value값은 그대로 값으로 사용됨
list_data = ["Dog", "Cat", "Tiger"]
pd.Series(list_data)
- 딕셔너리를 시리즈로 변환하기
### 딕셔너리를 시리즈로 변환하기
# - 딕셔너리의 key값은 시리즈의 index값으로 사용됨
# - 딕셔너리의 value값은 그대로 값으로 사용됨
dict_data = {"a" : 1, "b" : 2, "c" : 3}
pd.Series(dict_data)
- 튜플을 시리즈로 변환하기
### 튜플을 시리즈로 변환하기
# - 시리즈의 index값은 튜플의 길이만큼 자동 생성
# - 튜플의 value값은 그대로 값으로 사용됨
tup_data = ("홍길동", "40", "남자")
pd.Series(tup_data)
데이터프레임
- 데이터프레임으로 만들 수 있는 딕셔너리 형태 :
dict_data = {"" : [], "" : []}
- 데이터프레임을 생성하는 클래스 :
pd.DataFrame()
- 데이터프레임에서 사용하는 인덱스 구조
- 눈에 보이는 인덱스 번호와 메모리가 내부적으로 관리하는 인덱스 번호로 구분
- 인덱스값 : 눈에 보이는 인덱스 번호
- 인덱스번호 : 메모리가 내부적으로 관리하는 인덱스 번호
- 리스트를 데이터프레임으로 변환하기
### 리스트를 데이터프레임으로 변환하기
# - 리스트의 안쪽 대괄호의 갯수는 행을 의미함
# - 안쪽 리스트 각각의 데이터의 갯수는 열을 의미함
list_data = [["Dog", 7], ["Cat", 8], ["Tiger", 3], ["Lion", 4], ["Monkey", 9]] # 5행 2열
# - 리스트로 데이터프레임을 만들 때는 컬럼명을 지정해야함
# - 지정하지 않으면 자동으로 인덱스값이 컬럼명으로 만들어짐
pd.DataFrame(list_data, columns=["동물", "나이"])
- 딕셔너리를 데이터프레임으로 변환하기
### 딕셔너리를 데이터프레임으로 만들기
# - 딕셔너리의 key값은 컬럼명으로 사용되며
# - 딕셔너리의 value값은 시리즈로 변환되어 data로 사용
# - 딕셔너리의 value값들의 개수는 동일해야 함
dict_data = {"동물" : ["Dog", "Cat", "Tiger", "Lion", "Monkey"],
"나이" : [7, 6, 9, 2, 4]}
pd.DataFrame(dict_data)
- 비어있는 데이터프레임에 데이터 추가
- 컬럼명이 존재하는 경우, 데이터를 추가할 때는
concat()
으로 행 추가 - 컬럼명이 존재하지 않을 경우, 직접 컬럼 생성해서 사용
- 단, 다른 컬럼의 행이 존재하는 경우 그 행 갯수만큼 자동으로 공간이 만들어짐
- 컬럼명이 존재하는 경우, 데이터를 추가할 때는