javascript

3. day7

life... 2022. 3. 5. 17:24
204~229 25

 

1.

변수의 분포 시각화하여 분석하는 방식

 

->탐색적 자료분석(EDA)

208-1

 

2.

모델 방법은 여러가지가 있으므로

모델링시 반드시 다양한 옵션의 줘서 모델링을 수행해야한다?

 

->

X 반드시가 아니라 충분한 시간이 있을 경우 다양한 옵션을 주는

 

    -2

 

3.

모델링 성능 평가함에 있어 데이터마이닝에서 활용하는 평가기준인것과 아닌 ?

 

데이터 마이닝에서 평가기준인 :

 

정확도,

리프트,

디텍트 레이트

 

데이터마이닝에서 평가되는 것이 아닌(시뮬레이션에서의 지표) ?

 

쓰루풋,

average wait time,average queue length

time in system

    -3

 

4.

데이터를 시각화 하는 만으로 이상점 식별 되는가?

->된다

 

box plot 상자그림을 그리면 이상치 식별이 쉽다.

 

     -4

 

5.

대표적인 고급분석

데이터 있는 패턴 파악해 예측하는 분석으로 데이터가 크고

정보가 다양할수록 활용하기 유리한 분석:

->

 

데이터마이닝

 

6.

모집단의 특성인 모수에 관해 통계적으로 추론하는 통계

 

-> 추론통계

 

-8

 

7.

eda 4가지 주제:

 

저항성 강조

자료변수의 재표현

그래프 통한 현시성

잔차계산

 

종속변수의 계산

 

   -8

 

8.

공간적 차원 관련된 속성들을 시각화

지도위에 관련 속성을 생성하

크기,모양,,굵기 등으로 구분하여 인사이트 얻는 분석

 

-> 공간분석(spatial analysis)