'Python' 카테고리의 글 목록 (3 Page)

개요 데이터를 분석하면서 NaN값을 깔끔하게 보여주는 데이터프레임을 생성하거나, plot 개수에 맞추어 자동으로 사이즈가 조절되며 시각화 시켜주는 코드 등의 필요성을 느꼈다. 로컬에 py파일로 저장해서 혼자 사용할 수도 있지만 이왕 만든 모듈을 배포하면 나와 같은 고통을 겪는 사람들에게 도움이 될 것 같아 모듈을 제작, 배포하게 되었다. 모듈 제작 py 데이터를 분석할 때 불편하다고 생각했던 요소를 전부 넣기로 결정하였다. 상관분석 관련 함수 --> corr.py, 시각화 관련 함수 --> plots.py, 그 외의 함수 --> useful.py 3분류로 나누어 파일을 생성하였다. 폴더명이 곧 import할 모듈의 이름이 된다 init 설정 ↓ 모듈 제작 그 외 setup.py, README.md... ..

append(x)데이터 x를 리스트 끝에 추가clear()리스트를 비운다.copy()리스트를 복사한다.count(x)데이터 x의 개수를 알아낸다.extend(M)리스트 M을 연결한다index(x)데이터 x의 위치를 알아낸다 (인덱스를 알려준다.insert(i, x)데이터 x를 지정한 위치 (인덱스 i)에 삽입한다.pop()리스트의 지정한 값 하나를 읽어내고 삭제한다.remove(x)리스트에서 데이터 x를 삭제한다.reverse()리스트의 순서를 역순으로 바꾼다.sort()리스트를 정렬한다.

def make_double_dictionary(target_data, column1, column2, column3): ''' target_data = 데이터프레임, columns1, //2, //3 = 컬럼명 (string으로 넣어주세요) 컬럼 1은 가장 밖의 키, 컬럼 2는 값으로 들어갈 이중 딕셔너리의 키, 컬럼3은 이중 딕셔너리의 값을 의미합니다 ex) {column1 : {column2 : column3}} 접근방법은 "변수명[컬럼명]"으로 가능합니다 ''' x = {} drop_dupl = target_data.drop_duplicates([column1], keep='first').reset_index(drop = True) drop_num = drop_dupl.loc[:, column1]..

티스토리툴바