시간에 따른 데이터 분류
시계열 데이터(time-series data)
횡단면 데이터(cross-section data): 동시간대에 서로 다른 객체에서 얻은 데이터
패널 데이터: 횡단면 데이터를 시간에 따라 나열한 데이터
모집단과 표본
데이터 수집에 대한 문제: 비용 등
>> 표본 추출 방법을 통해 극복
관심 대상인 모집단의 특성을 해당 모집단에서 추출한 표본을 이용해 추측(inference)
척도와 변수
데이터의 측정 척도(scale of measurement)에 따른 분류
척도 | 변수 | 정의 | 연산자 | 예시 | |
범주형 변수 |
명목(nominal) | 범주형(categorical) | distinct categories | =, != | 이름, 주민번호 등 |
순위(ordinal) | 질적(qualitative) | ordered categories | <.> | 만족도, 순위 | |
수치형 변수 |
등간(interval) | 수치형(numerical) | meaningful categories | +,- | 온도, 물가지수 |
비율(ratio) | 양적(numerical) | absolute zero | x,/ | 월소득, 연령 |
'AI Theory > key concept of AI' 카테고리의 다른 글
분류 평가지표 (0) | 2023.05.07 |
---|---|
데이터 퀼리티 높이기 (0) | 2022.12.01 |
깃헙 csv 파일 Colab/Kaggle/주피터에서 사용하는 법 (0) | 2022.09.09 |
[핸즈온 머신러닝] 머신러닝의 과정 (0) | 2022.08.20 |
[핸즈온 머신러닝] 머신러닝의 종류 (0) | 2022.08.16 |