데이터 분석 시각화 total 정리
·
과거 기록들/Data Analysis
그래프 그리기 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns from sklearn.preprocessing import MinMaxScaler, StandardScaler import warnings warnings.filterwarnings( 'ignore' ) plt.plot([1, 0, 5, 2, 3]) plt.show() dict1 = {'v1' : [1, 2, 3, 4, 5], 'v2' : [8, 7, 6, 5, 4]} plt.plot('v1', 'v2', data = dict1) plt.show() # dictionary 형태로 그래프그리기 dict1 = {'x':[1,2,..
Pandas Base
·
과거 기록들/Data Analysis
타이타닉 데이터를 활용한 판다스 공부데이터는 (https://www.kaggle.com/c/titanic/data) 이곳에서 다운받을 수 있다 loc사용법, describe, sort_values, groupby 등등 다 외우기import numpy as npimport pandas as pddata = pd.read_csv('titanic.csv')딕셔너리, 데이터프레임 만들기dict = {'열인덱스' : [1, 2, 3, 4, 5], '열인덱스2' : [10, 20, 30, 40, 50]}dict# 결과값: {'열인덱스': [1, 2, 3, 4, 5], '열인덱스2': [10, 20, 30, 40, 50]}딕셔너리 --> 데이터프레임df_test = pd.DataFrame(dict)df_..
Pandas 기초
·
과거 기록들/Data Analysis
titanic.csv 다운로드 주소 : https://www.kaggle.com/c/titanic/dataimport numpy as npimport pandas as pddata = pd.read_csv('titanic.csv')# 딕셔너리 만들기dict = {'열인덱스' : [1, 2, 3, 4, 5], '열인덱스2' : [10, 20, 30, 40, 50]} df = pd.DataFrame(dict) # 데이터프레임으로 변환display(df)# 기본 명령어들print(df.head()) # 상위 5개print('-'*50)print(df.tail()) # 하위 5개print('-'*50)print(df.columns) # 칼럼명들 확인print('-'*50)print(df..
Numpy 기초
·
과거 기록들/Data Analysis
import numpy as np # (as = alias)# ex)a = [1, 2, 3, 4, 5, 6]np.array(a) # array로 변환print(a.ndim) # 차원 확인print(a.shape) # 행, 열 확인print(a.dtype) # 타입 확인 (int, float...)b = a.reshape(3, 2) # a를 3행 2열로 변환, -1 넣으면 넣은곳은 알아서 변환해줌a[0, 1] # 첫번째 행, 두번째 열 요소 조회 (파이썬은 인덱스가 0부터 시작)# 요소 접근법# 중요a[[0, 1]] # 1, 2행 조회 (2차원이기 때문에 앞의 2수가 행으로 들어감)a[:, [0, 1]] # 1, 2열 (:는 모든 행을 의미함)a[[0, 1], [0, 1]] # 1행 1열, 2행 2열a[0..