데이터 연구 분야, 기술 통계 vs 추측 통계

기술 통계

이미 보유하고 있는 데이터에 대해 분석한다.
있는 그대로 요약, 정리, 시각화하여 데이터의 특성을 도출한다.

보유하고 있는 데이터의 모집단과 같이
데이터의 범위를 확장하여 추정하지 않고
가지고 있는 데이터에만 집중한다.

가지고 있는 데이터 그대로의 특성을 분석하므로
불확실성이나 오차와 같은 개념이 없다.


추측 통계

작은 표본을 가지고 전체의 특성을 유추한다.

전수 조사가 불가능할 때
데이터의 일부만 가지고 전체의 특성을 추정하므로
오차가 필연적으로 발생하고

- 확률
- 신뢰 구간
- 예측 모델의 개념이 추가된다.


예측 모델은
과거의 표본을 분석하여 수학적 패턴을 찾아낸다.

대표적인 통계적 모델은
회귀 분석 모델, 로지스틱 회귀, 시계열 분석 모델(ARIMA) 등이 있다.





머신러닝 모델 vs 통계적 모델

통계적 모델들은 수학적인 패턴이 존재하기 때문에
왜 그런 결과가 나왔는지 해석이 가능하다.


최신 머신러닝/딥러닝 모델은 결과에 대한 설명보다는
**"결과를 얼마나 잘 맞히는지(정확도)"**에 올인하기 때문에
속을 알 수 없는 복잡한 구조(블랙박스)인 경우가 많다.







댓글

이 블로그의 인기 게시물

실무진 면접 경험으로 정리하는 백엔드 (1) : 에듀 테크 기업 면접

노마드코더 개발자북클럽 Clean code 완주, 독후감

Blogger 커스터마이징 : CSS 수정 (sticky-header)