날짜 타입 변환하기
pd.to_datetime()
: 날짜 타입으로 형 변환하기
### 날짜 타입으로 형 변환하기
new_dates = pd.to_datetime(dates)
new_dates
날짜 데이터 추출하기
to_period()
: 날짜 타입의 데이터 중에 년월일 데이터 추출- freq = "D" : 년월일까지 추출
- freq = "M" : 년월까지 추출
- freq = "Y" : 년도까지 추출
# 년월일 추출
dates.to_period(freq = "D")
# 년월 추출
dates.to_period(freq = "M")
# 년도 추출
dates.to_period(freq = "Y")
dt.속성
: 날짜에서 하나만 추출하기- 속성 : date, year, month, day, time, hour, minute, second 등
# 날짜 타입에서 년도만 추출하기
df["NewDate"].dt.year
# 문자열 타입에서 년도만 추출하기
df["Date"].str[:4]
# 날짜 타입에서 년월 추출하기 - to_period() 함수 사용
df["NewDate"].dt.to_period(freq="M")
astype("timedelta64[m]")
: 시간 타입에서 분 단위로 환산하는 기능
# 체류시간(분) = 하차시각(분) - 승차시각(분)
df_bus["체류시간"] = (df_bus["하차시각"] - df_bus["승차시각"]).astype("timedelta64[m]").astype(int)
df_bus.info()
날짜 데이터 생성하기
pd.date_range()
: 날짜 데이터 생성하기- start : 기간의 시작값
- end : 기간의 끝값 (None을 사용하면 해당 년도의 마지막 월일)
- periods : 생성할 기간의 갯수
- freq : 시간 간격 설정. 앞에 숫자를 쓰면 숫자 간격만큼 증가 ("2Y", "2D 2H 2MIN 2S” 등)
- tz : time-zone (국가 시간대). 없으면 년월일만 나옴
# 날짜 인덱스 값 생성하기
timestamp_df = pd.date_range(start = "2020-01-01",
end = None,
periods=6,
freq="Y",
tz="Asia/Seoul")
인덱스를 날짜로 변환하기
set_index(컬럼명)
: index를 날짜 타입의 컬럼으로 정의plot()
: 시계열 데이터로 그래프 그리기
# index를 날짜 타입의 컬럼으로 정의
df.set_index("Date", inplace=True)
# 시계열 그래프
df.plot()