ALL

시리즈 시리즈를 생성하는 클래스 : pd.Series([], index=[]) 리스트를 시리즈로 변환하기 ### 리스트를 시리즈로 변환하기 # - 리스트의 index번호는 시리즈의 index값으로 사용됨 # - 리스트의 value값은 그대로 값으로 사용됨 list_data = ["Dog", "Cat", "Tiger"] pd.Series(list_data) 딕셔너리를 시리즈로 변환하기 ### 딕셔너리를 시리즈로 변환하기 # - 딕셔너리의 key값은 시리즈의 index값으로 사용됨 # - 딕셔너리의 value값은 그대로 값으로 사용됨 dict_data = {"a" : 1, "b" : 2, "c" : 3} pd.Series(dict_data) 튜플을 시리즈로 변환하기 ### 튜플을 시리즈로 변환하기 # - 시..
데이터 통합하기 - 행 단위 통합하기 pd.concat() : axis=0으로 데이터프레임끼리 행 단위 통합하기 ignore_index=True : 데이터를 행으로 추가할 때 인덱스 번호를 순차적으로 증가시킴 # 행 단위 데이터 통합하기 pd.concat([sample_1, sample_2], ignore_index=True) - 열 단위 통합하기 pd.merge() : 두 데이터프레임을 각 데이터에 존재하는 고유값을 기준으로 병합 left : 왼쪽 메모리 영역 데이터 right : 오른쪽 메모리 영역 데이터 how : 어떻게 합칠 것인지 결정 inner : 같은 것에 대해서만 outer : 왼쪽, 오른쪽 데이터 모두에 대해서 (같은 값이 없으면 NaN) left : 왼쪽 데이터 모두에 대해서 (같은 값..
데이터 접근하기 loc : 인덱스 값으로 접근하는 방식(눈에 보이는 값 사용) iloc : 인덱스 번호로 접근하는 방식(메모리 위치 사용) iat : 특정 위치 값 1개만 조회 ### 행 데이터 추출하기 # 특정 행 지정해서 추출 (없는 인덱스 값 지정하면 오류) tips.loc[[1, 2, 3, 4, 5, 6]] # 범위를 지정해서 추출 (인덱스 값이 없어도 오류 없음) tips.loc[1:6] ### 행렬 데이터 추출 # [행, 열] 콤마로 행과 열 지정해서 추출 # loc는 컬럼명을 써줘야함 tips.loc[0:3, ["tip", "sex"]] # 대괄호 2개로 접근해서 추출 # iloc는 컬럼 인덱스 번호를 써줘야함 tips.iloc[[0,1,2,3,4], [0,1,2]] # 전체 행에 대한 전체..
데이터 조회하기 - 행 단위 데이터 조회 head() : 데이터 상위 5개만 출력. 괄호 안에 숫자를 넣으면 원하는 개수만큼 출력 tail() : 데이터 하위 5개만 출력. 괄호 안에 숫자를 넣으면 원하는 개수만큼 출력 - 열 단위 데이터 조회 Series 타입 : 열만 들어있는 데이터 타입. 튜플과 유사 DataFrame 타입 : 행렬이 들어있는 데이터 타입 # Series 타입 : 열만 들어있는 데이터 타입. 튜플과 유사 type(sample["국적코드"]) # DataFrame 타입 : 행렬이 들어있는 데이터 타입 type(sample[["국적코드"]]) # 열을 두 개 이상 출력하려면 대괄호 두 개 필요 sample[["국적코드", "성별"]] - 조건에 맞는 데이터 조회 조건 연산자를 사용하여 ..
데이터 불러오기 ./ : 현재 경로 위치 ../ : 현재 경로 위치에서 한단계 내려가기 - os import os : 운영체제에서 제공하는 기능을 사용할 수 있게 해주는 라이브러리 os.getcwd() : 현재 위치 확인하기 os.listdir() : 해당 위치에 있는 모든 폴더 및 파일 리스트로 읽어들이기 - pandas import pandas as pd : 행렬 데이터를 처리하기 위한 함수가 들어있는 라이브러리 pd.read_excel() : excel 파일 데이터프레임으로 읽어들이기 header : 열 인덱스가 있는 행 번호 지정 skipfooter : 가장 밑에서부터 제외하고자 하는 행의 갯수 입력 usecols : 읽어들일 열의 범위. "A:E"와 같이 지정 가능 sheet_name : 시트가..
Pandas import pandas as pd 행렬 데이터 처리 라이브러리 Matplotlib.pyplot import matplotlib.pyplot as plt 기본 시각화 라이브러리 Seaborn import seaborn as sns 고급 시각화 라이브러리, 데이터셋 제공 Numpy import numpy as np 수치 데이터 처리 라이브러리, 배열 형태 Json import json json 파일 처리 라이브러리
· Python
변수 값을 담을 수 있는 메모리 공간의 이름을 뜻한다. 변수는 객체의 주소를 기억하고, 해당 주소의 메모리 공간을 찾아가 값을 가져온다. 변수에 값을 담을 때는 할당 연산자 '='을 사용한다. 선언 : 변수 생성시 초기값 없이 만드는 것 정의 : 선언된 변수에 값을 넣는 것 전역변수 : 블록 밖에서 생성된 변수 지역변수 : 블록 안에서 생성된 변수 변수 타입 int(정수형) , float(실수형) , str(문자형) , bool(부울형) 변수명 생성 규칙 문자, 숫자, 언더바의 조합으로 변수명을 만들 수 있음 단, 숫자가 맨 앞에 올 수 없고, 변수명 중간에는 공백이 들어갈 수 없음 키워드(예약어, 프로그램 라이브러리 이름)는 변수명으로 사용하지 않음 변수에 담는 값의 의미를 알 수 있도록 직관적으로 이..
· Python
마크다운 사용법 # 내용 : 크기 조정 **내용** : 진하게 *내용* : 기울임꼴 >내용 : 인용구 $수식$ : 수식입력 에디터 사용법 a : 현재 셀의 앞에 셀 추가 b : 현재 셀의 뒤에 셀 추가 m : 마크다운으로 변경 y : 코드셀로 변경 c : 셀 복사 v : 셀 붙여넣기 d + d : 셀 삭제 i + i : 실행중지 shift + m : 셀 합치기 ctrl + shift + - : (커서가 있는 곳에서) 셀 나누기 shift + ↑, ↓ : 여러 셀 선택 ctrl + / : 주석 설정/해제 ctrl + [ : 내어쓰기 ctrl + ] : 들어쓰기 # : 주석 “”” “”” : 문단 형태의 주석 주피터 노트북 실행 방법 Ctrl + Enter : 이동 없이 실행만 하고 싶을 때 Shift + ..
· Python
버전 확인하기 파이썬 버전 확인 : python —version 아나콘다 버전 확인 : conda —version 가상환경 가상환경 설치 위치 : base 가상환경 위치에서 진행 디렉토리 위치 : 어디든 무관. 아나콘다가 알아서 생성 가상환경 생성하기 : conda create -n 가상환경이름 python=버전 가상환경 삭제하기 : conda env remove -n 삭제할 가상환경이름 가상환경 활성화시키기 : conda activate 가상환경이름 가상환경 비활성화시키기 : conda deactivate 가상환경 목록 확인하기 : conda env list 설치 명령어 (⚠️ 생성한 가상환경에서 진행하기) conda : 아나콘다 라이브러리 이용하여 설치. 최적화된 버전으로 설치됨 pip : 외부 라이..
윤시·̑.̮·̑
'분류 전체보기' 카테고리의 글 목록 (5 Page)