분류 전체보기 (270) 썸네일형 리스트형 [27866 | Python] 문자와 문자열 [27866 | Python] 문자와 문자열 class 1+ 문제. 정답률도 69퍼센트로 매우 높다. 사실 안풀어도 아는 문제인데 걍 다 풀려고 풀기로함 파이썬과 다르게 인덱스가 1부터 시작한다! 이 점만 주의하면 될듯 try1: solved a = input() b = int(input()) print(a[b-1]) 피어슨 상관계수 피어슨 상관계수 -1 ~ 1 사이의 범위를 가짐 상관관계가 없으면 0, 상관관계가 강하면 1 또는 -1 데이터의 분포가 넓게 퍼지며 원에 가까워질수록 상관계수 값은 0에 가까워진다. 상관계수는 '기울기'를 이야기하는 것이 아니라 두 변수 간에 한 변수가 변함에 따라 다른 변수의 값이 어떻게 변하는지에 대한 '상호적인 관계의 정도'를 나타내는 것이기 때문에, 기울기가 급하든 완만하든 데이터의 분포가 직선에 가깝다면 상관계수는 항상 1 또는 -1에 가까워진다. 양 또는 음의 상관관계가 아닌 경우 상관계수는 0이다. 상관관계와 상관계수는 두 변수 간의 패턴을 나타내는 것이 아닌, 각 값의 증가 또는 감소에 대한 관계만을 나타내기 때문이다. 사이킷런을 활용한 추천 시스템 사이킷런을 활용한 추천 시스템 추천 시스템 사용자(user)에게 관련된 아이템(item)을 추천해 주는 것 영화 추천 시스템을 만든다고 생각해보자. 추천 시스템은 영화들을 아래 사진과 같이 좌표 평면에 배치하여 표현한다. 그리고 영화들 간 거리가 좁을수록 유사도가 높다고 판단하여 사용자가 예전에 봤던 영화와 유사한 영화를 추천한다. 신규 사용자에 대해서도 개인정보가 유사한 기존 사용자의 영화 데이터를 기반으로 영화를 추천한다. 이때 추천 시스템은 범주형 데이터를 다룬다. 범주형 데이터를 숫자 벡터로 변환한 뒤 유사도를 계산하여 유사도가 높은 제품을 추천한다. 는 사실을 알 수 있다. 코사인 유사도(cosine similarity) 유사도를 계산하는 가장 잘 알려진 방법 자연어 처리(Natural Lang.. 비지도학습(Unsupervised Learning) 비지도학습(Unsupervised Learning) 지도학습과 달리 training data로 정답(label)이 없는 데이터가 주어지는 학습방법 라벨링이 되어 있지 않은 데이터들 내에서 비슷한 특징이나 패턴을 가진 데이터들끼리 군집화한 후, 새로운 데이터가 어떤 군집에 속하는지를 추론한다. 군집화(클러스터링, clustering), 차원축소(dimensionality reduction) 등이 있다. 클러스터링(군집화) 명확한 분류 기준이 없는 상황에서 데이터들을 분석하여 가까운(또는 유사한) 것들끼리 묶어 주는 작업 개별적인 데이터들을 몇 개의 그룹으로 추상화하여 새로운 의미를 발견할 수 있다. 대표적으로 K-Means, DBSCAN 등이 있다. K-Means k 값이 주어져 있을 때, 주어진 데이터들.. 정보이론(Information Content) 정보이론(Information Content) 추상적인 '정보'라는 개념을 정량화하고 정보의 저장과 통신을 연구하는 분야 정보를 정량적으로 표현하기 위한 세 가지 조건 1. 일어날 가능성이 높은 사건은 정보량이 낮고, 반드시 일어나는 사건은 정보가 없는 것이나 마찬가지다. 2. 일어날 가능성이 낮은 사건은 정보량이 높다. 3. 두 개의 독립적인 사건이 있을 때 전체 정보량은 각각의 정보량을 더한 것과 같다. 이러한 조건에 따라 아래 예제를 살펴보자 어떤 사람이 주머니에서 공을 꺼내는 과정을 반복하는 실험을 한다. 1. 각각의 주머니에서 공을 꺼낼 때 얻을 수 있는 정보량: 왼쪽 > 오른쪽 2. 파란색 공 999개와 빨간색 공 1개가 들어있는 주머니가 있을 때, 공을 하나 꺼내고 다시 넣는 실험을 반복한다.. 선형 회귀와 로지스틱 회귀 선형 회귀와 로지스틱 회귀 회귀분석 전통적으로 많이 사용되던 분석 방법 관찰된 여러 데이터를 기반으로 각 연속형 변수 간의 관계를 모델링하고 이에 대한 적합도를 측정하는 분석 방법 독립변수(independent variable, 설명변수)와 종속변수(dependent variable, 반응변수) 사이의 상호 관련성을 규명 선형회귀, 로지스틱 회귀 등 선형 회귀 종속변수 Y와 한 개 이상의 독립변수 X와의 선형 상관관계를 모델링하는 회귀분석 기법 선형 회귀 분석에서는 독립 변수와 종속 변수 사이의 상관 관계를 분석하는 것이 목적이다. 그렇다면 두 변수 사이에 상관 관계가 있다면 인과 관계 또한 있다고 볼 수 있을까? 정답은 X로, 상관 관계가 높다고 해서 반드시 인과관계가 있는 것은 아니다. 사례 ) 아이.. Regularization(정칙화) Regularization 정칙화(Regularization) vs 정규화(Normalization) 정규화(Normalization) 데이터셋에 대해 모든 features가 동일한 범위를 갖도록 전처리하는 과정 z-score, min-max scaling 등이 있다. 피처 간 값의 범위 차이가 클 경우, 데이터의 분포가 feature값의 범위에 의해 왜곡되어 학습을 방해한다는 문제점이 있다. normalization은 모든 feature의 범위를 동일하게 하여 모델 학습을 돕는다. 정칙화(Regularization) 오버피팅(overfitting)을 해결하기 위한 방법 중의 하나 L1, L2 Regularization, Dropout, Batch normalization 등이 있다. overfittin.. 활성화 함수의 이해 활성화 함수의 이해 퍼셉트론 딥러닝 레이어의 노드 1개 우리가 알고 있는 딥러닝 모델은 사실 퍼셉트론들이 다양한 구조로 쌓인 것 각 퍼셉트론들의 입력값과 가중치가 곱해진 값들의 합이 activation function을 거쳐 출력됨 활성화 함수란? 노드에 입력으로 들어오는 값이 어떤 '임계치(threshold)'를 넘어가면 활성화(activated) 되고, 넘어가지 않으면 비활성화(deactivated) 되도록 하는 함수이다. 딥러닝 모델의 representation capacity 또는 expressivity를 향상시켜주기 위해 사용한다. 활성화 함수는 표현에 따라 분류할 수 있다. 선형 활성화 함수(Linear activation function) 비선형 활성화 함수(Non-linear activat.. 이전 1 ··· 8 9 10 11 12 13 14 ··· 34 다음