본문 바로가기

반응형

분류 전체보기

(270)
깃헙 커밋 메시지 규칙 깃헙 커밋 메시지 규칙 맨날 내가 쓰고싶은대로 쓰는데 그만하고 잘 정리해서 지금부터 제대로 쓰자. 커밋 메시지 기본 규격 [적용범위(선택사항)]: [본문(선택사항)] [꼬리말(선택사항)] 커밋 메시지 타입 종류 fix 오류 수정 feat 새 기능 추가 BREAKING CHANGE 단절적 API 변경 출처 및 더 자세한 내용은... Conventional Commits 커밋 메세지에 사용자와 기계 모두가 이해할 수 있는 의미를 부여하기 위한 스펙 www.conventionalcommits.org
캐글 구글 코랩에서 사용하기 캐글 구글 colab에서 사용하기! kaggle competitions의 dataset을 kaggle API를 이용해 Colab에 다운로드 받고 바로 사용하는 방법! 0. kaggle 사이트에서 kaggle.json 파일 다운로드 하기 캐글 사이트의 Account 페이지로 이동, 아래쪽 API 항목에서 Create new API Token을 눌러주세요. kaggle.json 파일이 다운로드됩니다. 1. 코랩에 캐글api 설치하기 !pip install kaggle 2. kaggle.json 파일 불러오기 #kaggle.json 파일 불러오기 from google.colab import files uploaded = files.upload() for fn in uploaded.keys(): print('u..
[모두의 딥러닝] 선형 회귀와 로지스틱 회귀 선형 회귀(linear regression) 가장 훌륭한 예측선 긋기 단순 선형 회귀(simple linear regression): 하나의 x만으로 y값을 설명 가능 y = ax + b 다중 선형 회귀(multiple linear regression): y를 설명하기 위해 여러 x값이 필요 최소 제곱법(method of least square) a,b를 바로 구할 수 있다. a = (x편차) * (y편차)의 합 / x편차의 합의 제곱 b = y의 평균 - (x평균 * 기울기a) 이를 통해 x에 대한 일차식을 구하면 이 직선이 바로 오차가 가장 적고 좌표의 특성을 가장 잘 나타내는 예측 직선 코딩으로 최소 제곱법 구현하기 #ch3 최소제곱법 import numpy as np x = [2,4,6,8] y ..
[파이썬으로 캐글뽀개기] 캐글에서 사용되는 머신러닝 알고리즘 지도학습과 비지도 학습 지도학습(Supervised learning) train data에 target, label(레이블)이라는 정답이 포함됨 분류(Classification) 지도 학습에 속하는 기계 학습 모델: 선형 회귀(Linear Regression) 로지스틱 회귀 SVM(Support Vector Machine) 의사결정나무 랜덤 포레스트 k-NN(k-Nearest Neighbor) 신경망(Neural Network) 비지도학습 훈련 데이터에 target이나 label 정보 없음 따라서 훈련 데이터에 아무런 가이드라인이 없으므로 머신러닝 모델이 스스로 학습해야함 군집화: 전체 데이터를 몇개의 작은 군집으로 나누는 것 k-평균 계층 군집 분석(Hierarchical cluster Analysis..
[파이썬 캐글뽀개기] 상관관계 히트 맵 [파이썬 캐글뽀개기] 상관관계 히트 맵 상간관계 분석 두 개 이상 변수 간 상호 관련성 판단 상관 관계 분석의 종류: 피어슨, 스피어만, 켄달, 점이연, 이연 상관 계수 일반적인 상관관계 분석은 피어슨 상관관계 분석을 의미 R: 두 변수 간 선형적 관계의 강도 공분산(Covariance)과 상관 계수(Corelation) 수치형 변수 간 상관관계 나타내는 지표 공분산 X변수와 Y변수가 동시에 변하는 정도 X의 편차와 Y의 편차의 곱의 평균 *편차: 변량-평균 방향성만 가짐 결과값이 양수: 양의 선형 관계 결과값이 음수: 음의 선형 관계 표준화작업 필수: 공분산의 크기는 단위의 영향을 받아 일정한 값을 가질 수 없으므로 표준화작업을 통해 척도에 상관없이 계산 가능하도록 함 예를 들어 몸무게 단위 KG 사용..
01-1. 기본적 수학 개념 수의 체계 복소수: 실수부 + 허수부 실수: 허수부가 0 허수: 실수부, 허수부 둘다 0 아님 순허수: 실수부가 0 유리수: 실수 중 분수 형태로 표현 가능한 수 무리수: 분수로 표현할 수 없는 수 집합(set) 특정 조건을 만족하는 원소들의 모임 원소나열법(tabular form): {1,2,3,4} 조건제시법(set builder form): {2n | n=1,2,3,4} 모든 집합은 공집합을 부분집합으로 갖는다 사상(mapping) f:A → B로 표현 집합 A,B에 대해서 A의 각 원소가 B의 어떤 원소 하나에 대응될 때 이 관계를 A에서 B로의 사상이라고 함 A: 정의역(domain), 정의구역 B: 공역(codomain), 공변역 치역(range): 정의역 원소, 즉 A의 원소의 상을 모아둔 ..
데청캠 1일차 | 플랫폼 이론 1 빅데이터와 데이터의 차이점 volume, variety, velocity 까지 >> V3 Veracity, Value 까지 >> V5 DBMS + 의사결정 시스템 ==> DW(Data Warehouse) ETL Extraction: 하나 또는 그 이상의 데이터 원천에서 데이터 획득 Transformation: 데이터 정제, 형식 변환, 표준화, 통합, 다수 애플리케이션에 내장된 비즈니스 룰 Loading: 추출, 변형이 끝난 데이터를 특정 목표 시스템에 적재 종류: 일괄ETL, 실시간ETL
[파이썬 캐글뽀개기] Matplotlib - 히트 맵(Heat Map) [파이썬 캐글뽀개기] Matplotlib - 히트 맵(Heat Map) 다양한 강도, 색상으로 데이터 범위를 시각화 ex. 상관행렬의 히트맵 표시 matplotlib의 Imshow 함수 이용 #heat map import matplotlib.pyplot as plt import numpy as np import seaborn as sns flights = sns.load_dataset('flights') flights = flights.pivot("month","year","passengers") fig, ax = plt.subplots(figsize=(12,6)) im = ax.imshow(flights, cmap='YlGnBu') ax.set_xticklabels(flights.columns, rot..

반응형