본문 바로가기

반응형

분류 전체보기

(270)
[파이썬 캐글뽀개기] Matplotlib - 박스 플롯(BOX PLOT) [파이썬 캐글뽀개기] 박스 플롯(BOX PLOT) 범주형 데이터를 기준으로 수치형 데이터의 분포 파악에 적합 Outlier: 이상치 Max: 전체 데이터 중 최댓값 Upper Quartile(Q1): 제1사분위수. 전체 데이터의 25%지점 Median: 전체 데이터 중 50%에 해당하는 중앙값 Lower Quartile(Q3): 제3사분위수. 전체 데이터의 75%이내값 Min: 최솟값 IQR: InterQuartile Range의 약어. Q3 - Q1으로 계산.
[파이썬 캐글 뽀개기] Matplotlib 라이브러리 파이썬 시각화 이론편 Matplotlib 라이브러리 파이썬 데이터 시각화의 기본 뼈대 복잡하고 다루기 어려움 >>> seaborn 라이브러리 등장 matplotlib 그래프를 구현하는 방법 pyplot api matplotlib.pyplot 모듈의 함수들을 각각 불러와서 구현. 사용 편리 객체 지향 api matplotlib에 구현된 객체 지향 라이브러리를 직접 활용. 그래프의 각 구성요소 다양하게 제어하고 싶을 때. 사용하기 복잡 pyplot API + 객체 지향 API 실전에서 자주 사용 기존 객체지향API와 다르게 PLT클래스 활용 Seaborn 라이브러리 그림 그리기 easy 통계 결과를 간편하고 아름답게 파이썬 시각화 그래프의 기본 용어 Figure 전체 그래프 그림 Axes 그래프가 그려지는 ..
[파이썬 캐글뽀개기] 파이썬 시각화 이론편 파이썬 시각화 이론편 Matplotlib 라이브러리 파이썬 데이터 시각화의 기본 뼈대 복잡하고 다루기 어려움 >>> seaborn 라이브러리 등장 matplotlib 그래프를 구현하는 방법 pyplot api matplotlib.pyplot 모듈의 함수들을 각각 불러와서 구현. 사용 편리 객체 지향 api matplotlib에 구현된 객체 지향 라이브러리를 직접 활용. 그래프의 각 구성요소 다양하게 제어하고 싶을 때. Seaborn 라이브러리 그림 그리기 easy 통계 결과를 간편하고 아름답게 파이썬 시각화 그래프의 기본 용어 Figure 전체 그래프 그림 Axes 그래프가 그려지는 figure의 하위 섹션 title, x-label, y-label 등의 값 통제 하나의 figure은 여러개의 axes를..
[파이썬으로 캐글뽀개기] pandas와 데이터 전처리 Pandas 라이브러리 파이썬 데이터 처리에서 제일 많이 이용 데이터 전처리 DataFrame In [2]: import pandas as pd In [3]: lemonade = pd.read_csv('Lemonade2016.csv') lemonade.info() RangeIndex: 32 entries, 0 to 31 Data columns (total 7 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 Date 31 non-null object 1 Location 32 non-null object 2 Lemon 32 non-null int64 3 Orange 32 non-null int64 4 Temperature 3..
주피터 노트북 티스토리에 옮기는 법 주피터 노트북 티스토리에 옮기는 법 1. 주피터 파일을 .html 파일로 다운로드 2. 다운받은 html파일 열기 3. ctrl + u 그러면 이렇게 바뀐다. 4. ctrl+a, ctrl+c 로 전체 선택, 전체 복사 5. 티스토리 블로그를 html 모드로 변경 5. html 모드에 4에서 복사한 코드들을 붙여넣기한다. 그러면 주피터 노트북 내용이 복붙된 것을 확인할 수 있다.
[파이썬 캐글뽀개기] Numpy Numpy 고성능 수치 계산을 위해 제작된 파이썬 라이브러리 머신러닝, 딥러닝 알고리즘의 다차원 배열 계산에 효과적 대량 데이터 이용시 빠른 계산 가능 ★중요★ ndarray In [1]: import numpy as np In [2]: temp = np.array([1,2,3]) print(type(temp)) In [3]: data1 = [1,2,3] data1 Out[3]: [1, 2, 3] In [4]: data2 = [1,1,2,2,3,4] data2 Out[4]: [1, 1, 2, 2, 3, 4] In [6]: #shpae로 배열 크기 확인 my_array1 = np.array(data1) print(my_array1) print(my_array1.shape) [1 2 3] (3,) In [7..
[파이썬으로 캐글뽀개기] 튜플과 딕셔너리, 집합(set) 튜플(tuple) 한번 선언시 값을 변경할 수 없음 1개의 요소를 갖는 튜플은 끝에 , 붙여야 함 객체 선언시 괄호 생략 가능 tuple = (0) >>type: int tuple = (0,) >>type: tuple tuple = 0,1,2 print: (0,1,2) type: tuple 딕셔너리(dictionary) key:value형태 딕셔너리 내 key값만 모아서 dict_keys 객체 반환, a.keys() 딕셔너리 내 value만 추출, a.values() key:value를 투플로 만들어서 반환, a.items() dict_items([(key, value), (key,value)...]) key값에 대응하는 value 반환, a.get("key이름") 존재하지 않는 key이름 입력시 non..
[파이썬으로 캐글뽀개기] 데이터분석에 유용한 리스트 관련 메소드 리스트에 여러개의 요소 한번에 추가하기, extend() a = [1,2,3] a.extend([4,5,6]) a >> [1,2,3,4,5,6] 리스트 원하는 위치에 요소 삽입하기, insert() a = [1,2,3] a.insert(1,100) a >> [1,100,2,3] 슬라이싱을 이용해 리스트 중간에 요소 삽입하기 [시작:끝]이 동일하면 삽입 [시작:끝]이 다르면 해당 구간 잘라내고 덮어쓰기 a = [0,1,2,3] a[2:2] = [100,200] a >> [0,1,100,200,2,3] b = [0,1,2,3] b[1:2] = [100,200,300,400] b >>[0,100,200,300,400,2,3] c=[0,1,2,3] c[1:5] = [100] c >>[0,100] 리스트 요소 제..

반응형