본문 바로가기

반응형

분류 전체보기

(264)
[2475, 2920, 10172 | python] 검증수, 음계, 개 🎉문제 총평 solved.ac에서 가장 기본적인 class1을 통과하기 위해 남은 마지막 3문제! [2475] 검증수 주어진 5개의 숫자들을 각각 제곱하고 합한 뒤 10으로 나눈 나머지를 출력한다. try1: runtime error! import numpy nums = map(int, input().split()) sqrt_nums = np.sqrt(nums) sum_sqrt = np.sum(sqrt_nums) print(sum_sqrt//10) numpy를 np로 정의하지 않음 nums가 리스트가 아니었다?! try2: 런타임 에러! 위에서 문제라고 생각한 부분들을 고쳤는데도 여전히 런타임 에러가 나왔다. import numpy as np nums = list(map(int, input().split..
클린코드(Clean Code) & 리팩토링(Refactoring) 시큐어코딩(Secure Coding) 클린코드(Clean Code) & 리팩토링(Refactoring) 시큐어코딩(Secure Coding) 클린코드 가독성이 높은 코드 코드를 작성하는 의도와 목적이 명확하며, 코드가 잘 읽히고, 정돈된 코드 네이밍 이 잘 되어 있고 오류, 중복 코드가 없음 의존성이 최소화되어있고, 클래스, 메소드가 한가지 일만 처리 코드를 읽으면서 짐작했던 기능을 각 루틴이 그대로 수행해야 함 클린코드를 만드는 규칙 1. 네이밍(Naming) 변수, 클래스, 메소드에 의도가 분명한 이름을 사용 2. 주석(comment) 코드를 읽는 사람이 코드를 잘 이해할 수 있도록 작성 코드 내용을 빠르게 유추할 수 있는 내용에는 주석을 달지 않는다. 3. 꾸미기(aesthetics) 규칙적인 들여쓰기와 줄바꿈 불규칙한 중복 코드를 제..
[27866 | Python] 문자와 문자열 [27866 | Python] 문자와 문자열 class 1+ 문제. 정답률도 69퍼센트로 매우 높다. 사실 안풀어도 아는 문제인데 걍 다 풀려고 풀기로함 파이썬과 다르게 인덱스가 1부터 시작한다! 이 점만 주의하면 될듯 try1: solved a = input() b = int(input()) print(a[b-1])
피어슨 상관계수 피어슨 상관계수 -1 ~ 1 사이의 범위를 가짐 상관관계가 없으면 0, 상관관계가 강하면 1 또는 -1 데이터의 분포가 넓게 퍼지며 원에 가까워질수록 상관계수 값은 0에 가까워진다. 상관계수는 '기울기'를 이야기하는 것이 아니라 두 변수 간에 한 변수가 변함에 따라 다른 변수의 값이 어떻게 변하는지에 대한 '상호적인 관계의 정도'를 나타내는 것이기 때문에, 기울기가 급하든 완만하든 데이터의 분포가 직선에 가깝다면 상관계수는 항상 1 또는 -1에 가까워진다. 양 또는 음의 상관관계가 아닌 경우 상관계수는 0이다. 상관관계와 상관계수는 두 변수 간의 패턴을 나타내는 것이 아닌, 각 값의 증가 또는 감소에 대한 관계만을 나타내기 때문이다.
사이킷런을 활용한 추천 시스템 사이킷런을 활용한 추천 시스템 추천 시스템 사용자(user)에게 관련된 아이템(item)을 추천해 주는 것 영화 추천 시스템을 만든다고 생각해보자. 추천 시스템은 영화들을 아래 사진과 같이 좌표 평면에 배치하여 표현한다. 그리고 영화들 간 거리가 좁을수록 유사도가 높다고 판단하여 사용자가 예전에 봤던 영화와 유사한 영화를 추천한다. 신규 사용자에 대해서도 개인정보가 유사한 기존 사용자의 영화 데이터를 기반으로 영화를 추천한다. 이때 추천 시스템은 범주형 데이터를 다룬다. 범주형 데이터를 숫자 벡터로 변환한 뒤 유사도를 계산하여 유사도가 높은 제품을 추천한다. 는 사실을 알 수 있다. 코사인 유사도(cosine similarity) 유사도를 계산하는 가장 잘 알려진 방법 자연어 처리(Natural Lang..
비지도학습(Unsupervised Learning) 비지도학습(Unsupervised Learning) 지도학습과 달리 training data로 정답(label)이 없는 데이터가 주어지는 학습방법 라벨링이 되어 있지 않은 데이터들 내에서 비슷한 특징이나 패턴을 가진 데이터들끼리 군집화한 후, 새로운 데이터가 어떤 군집에 속하는지를 추론한다. 군집화(클러스터링, clustering), 차원축소(dimensionality reduction) 등이 있다. 클러스터링(군집화) 명확한 분류 기준이 없는 상황에서 데이터들을 분석하여 가까운(또는 유사한) 것들끼리 묶어 주는 작업 개별적인 데이터들을 몇 개의 그룹으로 추상화하여 새로운 의미를 발견할 수 있다. 대표적으로 K-Means, DBSCAN 등이 있다. K-Means k 값이 주어져 있을 때, 주어진 데이터들..
정보이론(Information Content) 정보이론(Information Content) 추상적인 '정보'라는 개념을 정량화하고 정보의 저장과 통신을 연구하는 분야 정보를 정량적으로 표현하기 위한 세 가지 조건 1. 일어날 가능성이 높은 사건은 정보량이 낮고, 반드시 일어나는 사건은 정보가 없는 것이나 마찬가지다. 2. 일어날 가능성이 낮은 사건은 정보량이 높다. 3. 두 개의 독립적인 사건이 있을 때 전체 정보량은 각각의 정보량을 더한 것과 같다. 이러한 조건에 따라 아래 예제를 살펴보자 어떤 사람이 주머니에서 공을 꺼내는 과정을 반복하는 실험을 한다. 1. 각각의 주머니에서 공을 꺼낼 때 얻을 수 있는 정보량: 왼쪽 > 오른쪽 2. 파란색 공 999개와 빨간색 공 1개가 들어있는 주머니가 있을 때, 공을 하나 꺼내고 다시 넣는 실험을 반복한다..
선형 회귀와 로지스틱 회귀 선형 회귀와 로지스틱 회귀 회귀분석 전통적으로 많이 사용되던 분석 방법 관찰된 여러 데이터를 기반으로 각 연속형 변수 간의 관계를 모델링하고 이에 대한 적합도를 측정하는 분석 방법 독립변수(independent variable, 설명변수)와 종속변수(dependent variable, 반응변수) 사이의 상호 관련성을 규명 선형회귀, 로지스틱 회귀 등 선형 회귀 종속변수 Y와 한 개 이상의 독립변수 X와의 선형 상관관계를 모델링하는 회귀분석 기법 선형 회귀 분석에서는 독립 변수와 종속 변수 사이의 상관 관계를 분석하는 것이 목적이다. 그렇다면 두 변수 사이에 상관 관계가 있다면 인과 관계 또한 있다고 볼 수 있을까? 정답은 X로, 상관 관계가 높다고 해서 반드시 인과관계가 있는 것은 아니다. 사례 ) 아이..

반응형