전체 글 (282) 썸네일형 리스트형 파이썬 더 잘 알기 파이썬 더 잘 알기 부동소수점 vs 고정소수점 컴퓨터에서 소수는 2진법으로 정확히 표현할 수 없으므로 근사치로 저장된다. 소수를 저장하기 위한 방법은 2가지가 있다. 고정 소수점 정수를 표현하는 비트 수, 소수를 표현하는 비트 수를 미리 정해두고 해당 비트만큼 사용해 숫자 표현 ex: 정수 표현에 4byte(32bit), 부호 1bit, 소수는 15bit 사용하자 정수를 표현하는 비트를 늘리면 큰 숫자를 표할 수 있지만 정밀한 숫자표현 어렵 소수 표현 비트 늘리면 정밀하게 표현 가능하지만 큰 숫자는 표현이 어렵 부동 소수점 소수점의 위치를 고정하지 않고 그 위치를 나타내는 수를 따로 적는것. 유효숫자를 나타내는 가수와 소수점의 위치를 풀이하는 지수로 나누어 표현 IEEE754의 표현을 가장 널리 사용 예.. 운영체제와 리눅스 명령어 정리 운영체제와 리눅스 명령어 정리 운영체제란? - a program that manages a computer's hardware - 컴퓨터 시스템의 하드웨어적 자원, 소프트웨어적 자원을 효율적으로 운영 관리하여 사용자의 편의성을 증진시키는 시스템 소프트웨어 - 하드웨어 성능을 최적화하여 시스템의 생산성 증가 - 커널과 셀로 구성 콘솔, 터미널, 쉘의 차이점 콘솔 서버의 로컬 장치에서 직접 명령어를 작성할 수 있는 물리적인 입출력 장치 터미널 콘솔 + 원격제어 환경 서버의 로컬 또는 원격으로 접속할 수 있는 콘솔을 구현한 소프트웨어 cf. 터미널과 터미널 에뮬레이터 우리가 사용하는 CLI 창은 사실 엄밀히 말하면 터미널이 아닌 터미널 에뮬레이터임. 진짜 터미널은 PC가 등장하기 전 메인프레임 컴퓨터에 입출력.. [Boostcourse beyond ai] Optimization [Boostcourse beyond ai] Optimization Important concepts in optimization generalization 많은 경우 모델 제작시의 목적 Test error과 training error간의 차이 underfitting vs overfitting overfitting 학습 데이터에 대해서는 잘 작용하지만, 테스트 데이터에 대해서는 잘 작동 x underfitting network가 너무 간단하거나 학습데이터가 너무 적음 cross-validation 보통은 traindata와 validation data를 나눠서 학습 train data와 validation data를 얼마나 나누는 것이 좋을까? 데이터 분할시의 데이터 부족을 해결하기 위해 등장한 cross.. [boostcourse beyond ai] Nueral Network Neural Networks function approximators that stack affine transforamtions followed by nonlinear transformations. 예를 들어, 이미지라는 텐서가 주어졌을때 label이 나오는 모델이 있다고 할때, 우리가 찾고자 하는 nnt는 그것을 우리가 정의한 function으로 정의하는 function approximators이고, 행렬곱(affine transformation) 비선형 연산으로 함수를 수행. 가장 간단한 nn은 linear neural networks 역전파 우리의 목적은 loss함수를 최소화하는 것이다. 내 파라미터가 어느 방향으로 움직였을 때 loss function이 줄어드는지를 찾고 해당 방향으로 파라미터를.. [boostcourse beyond ai] 딥러닝의 역사 denny britz, "deep learining's most import ideas" 2012 AlexNet 224*224 이미지 분류 2012년도 이미지넷 대회에서 1등 고전적 머신러닝이 아닌 딥러닝을 이용해 최초로 우승 blackbox로만 여겨지던 딥러닝의 성능을 확인 2013 DQN Q러닝이라는 강화학습 방법론 사용 알파고 2014 Encoder / Decoder NMT(Nueral machine translation) 문제를 풀기 위함 단어의 연속이 주어졌을 때 이를 잘 표현해서 다른 언어로 해석할지 이후 기계어 번역의 트랜드 번역 2014 Adam Optimizer 많은 사람들이 딥러닝 사용할 때 지금도 adam을 optimizer로 많이 사용 결과가 잘나옴 일반적으로 딥러닝 모델을 만들 때.. [ICR] Probability Calibration Techniques Probability Calibration Techniques 이진 분류기의 출력을 조정하는 기술 분류기의 잘못된 예측 방지 특히 예측 확률의 임계값 기반 예측의 경우! probability calibaration techniques는 예측된 확률을 조정하여 실제 확률을 더 잘 반영하고 신뢰할 수 있는 예측 제공 종류 Platt Scaling Isotonic Regression Beta Calibration SplineCalib 과정 분류기가 예측한 확률과 실제 확률에 대해 그래프를 그려보자. 왼쪽 그래프의 x(predicted)를 확인해보면 0.2~0.8 사이의 값에서 분류기의 예측 확률이 잘 조정되어 있지 않음. 오른쪽 히스토그램을 살펴보면 대부분의 예측 확률값들은 0.1 이하이며 여기에 중점을 두어.. 분류 평가지표 분류 평가지표 Confusion Matrix : 모델의 예측값 (Prediction)과 실제값을 비교하기 위한 표. TP, TN: 실제값을 맞게 예측한 것 FP, FN: 실제값과 다르게 예측한 것 Accuracy (정확도) : (TP + TN) / (TP + TN + FP) 전체 데이터 중 모델이 바르게 분류한 비율 불균형한 데이터 (imbalanced data)에 사용하기엔 부적절 100명 중 1명의 암환자 100명 모두 암이 없다고 예측하면 정확도는 99%지만 실제 암환자에 대해서 예측하지 못함 Precision (정밀도): TP / (TP + FN) 실제 값이 Negative인 데이터를 Positive로 판단하면 안 될 때 사용할 수 있는 지표 예시: 스팸 메일 분류 Recall (재현율): TP .. MySQL csv 오류 | Unhandled exception: 'cp949' codec can't decode 해결법 MySQL csv 오류 | Unhandled exception: 'cp949' codec can't decode 해결법 MySQL에 csv 파일을 import 해야 하는데... 에러가 난다... 전에도 똑같은 오류를 겪었던 기억이 나... 한글의 경우 csv 파일이 cp949인 경우가 많은데 mySQL에선 지원 안해줘서 그렇다. cp949를 utf-8로 바꿔야 됨. 이거 관련해서 구글링하면 정보가 많이 나온다. 메모장을 이용해서 utf-8로 바꿔라 mysql 설정을 바꿔라 등등... 난 그냥 csv 파일을 json으로 바꿔서 해결했다. 여기서함 CSVJSON - CSVJSON JSON JSON stands for JavaScript Object Notation and has become the defac.. 이전 1 ··· 11 12 13 14 15 16 17 ··· 36 다음