본문 바로가기

AI Theory/key concept of AI

데이터분석기초

시간에 따른 데이터 분류

시계열 데이터(time-series data)

횡단면 데이터(cross-section data): 동시간대에 서로 다른 객체에서 얻은 데이터

패널 데이터: 횡단면 데이터를 시간에 따라 나열한 데이터

 

모집단과 표본

데이터 수집에 대한 문제: 비용 등

>> 표본 추출 방법을 통해 극복

 

관심 대상인 모집단의 특성을 해당 모집단에서 추출한 표본을 이용해 추측(inference)

사진참고

 

척도와 변수

데이터의 측정 척도(scale of measurement)에 따른 분류

  척도 변수 정의 연산자 예시
범주형
변수
명목(nominal) 범주형(categorical) distinct categories =, != 이름, 주민번호 등
순위(ordinal) 질적(qualitative) ordered categories <.> 만족도, 순위
수치형
변수
등간(interval) 수치형(numerical) meaningful categories +,- 온도, 물가지수
비율(ratio) 양적(numerical) absolute zero x,/ 월소득, 연령