javascript
3. day7
life...
2022. 3. 5. 17:24
204~229 | 25 |
1.
변수의 분포등을 시각화하여 분석하는 방식
->탐색적 자료분석(EDA)
208-1
2.
모델 방법은 여러가지가 있으므로
모델링시 반드시 다양한 옵션의 줘서 모델링을 수행해야한다?
->
X 반드시가 아니라 충분한 시간이 있을 경우 다양한 옵션을 주는 것
-2
3.
모델링 성능 평가함에 있어 데이터마이닝에서 활용하는 평가기준인것과 아닌 것?
데이터 마이닝에서 평가기준인 것:
정확도,
리프트,
디텍트 레이트
데이터마이닝에서 평가되는 것이 아닌(시뮬레이션에서의 지표) 것?
쓰루풋,
average wait time,average queue length
time in system
-3
4.
데이터를 시각화 하는 것 만으로 이상점 식별이 잘 되는가?
->된다
box plot 상자그림을 그리면 이상치 식별이 쉽다.
-4
5.
대표적인 고급분석
데이터에 있는 패턴을 파악해 예측하는 분석으로 데이터가 크고
정보가 다양할수록 활용하기 유리한 분석:
->
데이터마이닝
6.
모집단의 특성인 모수에 관해 통계적으로 추론하는 통계
-> 추론통계
-8
7.
eda 4가지 주제:
저항성의 강조
자료변수의 재표현
그래프 통한 현시성
잔차계산
종속변수의 계산
-8
8.
공간적 차원과 관련된 속성들을 시각화 해
지도위에 관련 속성을 생성하고
크기,모양,선,굵기 등으로 구분하여 인사이트 얻는 분석법
-> 공간분석(spatial analysis)