weka 공부

8차 비지도학습

life... 2022. 2. 25. 09:43

 

비지도학습은

지도학습과 다르게 targetvariable 없다.

 

지도학습은 해답을 알고있다.

 

해답을 가장 정확도가 올라갈 있도록 해준 것이 지도학습이다.

 

비지도학습은 target변수가 없다.

 

정답을 모르는 상태이지만

어떤 규칙이 있음을 알아내는 과정이다.

 

비지도 학습의 예로서

 

-연관규칙(Association)

-군집분석(Clustering)

-knowledgeFlow(그래프로 구조를 그리는 방법)

 

 

*연관규칙(association rule)이란?

서로간의 아이템들간의 어떤 연관성이있는지를 보는것 이다.

 

어떤 상품들끼리 같이 구매가 되는 지를 보는 것으로 장바구니 분석 이라고도 불린다.

 

마케팅에서의 활용

-교차판매,묶음판매,상품진열 시에 많이 사용한다.

 

교차판매-a라는 상품을 b라는 상품을 추천

묶음판매-관련된 상품끼리 묵어서 상품판매(1+1)

상품진열-어떤상품기리 가까이 있어야 많이 파는지를 갖고 상품 진열

거래후 쿠폰 제공(순차 연관분석)-a라는 상품을 사면 나중에 b라는 상품을 이후에 사는거)

 

측정도구

 

지지도(support)-전체 상품중에 얼마나 팔리는 상품인가.

 

 

신뢰도(confidence)-a 상품을 샀을 b 상품을 확률

 

향상도(lift)-지지도와 신뢰도 간의 관계에서

그냥 두었을 때에 비해서 어떤상품들을 추천해주었을 확률

 

 

 

연관성 규칙 생성 과정

 

1단계 -지지도 support

-상품수가 적으면 전반적인 percent 올라가고 많으면 percent 내려간다.

-여기서 컷당하면 2단계로 없다.

a라는 상품이 얼마나 팔리는 상품인가를 보여준다.

2단계 -신뢰도 confidence

a 상품을 샀을 b 상품을 확률

a라는 상품을 산사람이 b라는 상품을 확률(P(B|A))

 

3단계 -향상도 lift

그냥 두었을 때에 비해서 어떤상품들을 추천해주었을 확률이 몇배높은가

Pr(B|A) A 샀을 B 확률

P(B)가만히 있을 알아서 물건이 팔리릴 확률

--> lift 1 넘어야 추천을 주었을 의미가 있다.

 

지지도는 신뢰도에 영향을 주고 

신뢰도는 향상도에 영향을 준다.

 

 

ex)

 

향상도 1.67이라는 것은

 

아무에게나 red라는 것을 때에비해

green 구매한사람들에게 red 확률이 1.67배이다 라는 의미이다.

 

 

 

 

Apriori알고리즘(어떤 상품이 많이 팔리는 상품인지 알려주는 알고리즘)

- 빈발 아이템 세트라는 개념이 있다.(많이 팔리는 상품을 묶어준다.)

  여기서 Apriori알고리즘을 사용한다.

 

 

 

'weka 공부' 카테고리의 다른 글

10차 KNOWLEDGE FLOW  (0) 2022.02.25
9차 군집분석  (0) 2022.02.25
7차 모델비교  (0) 2022.02.25
6차 다층신경망  (0) 2022.02.25
5차 SVM(SUPPORT VECTOR MACHINE)  (0) 2022.02.25