비지도학습은
지도학습과 다르게 targetvariable이 없다.
지도학습은 해답을 알고있다.
해답을 가장 잘 정확도가 올라갈 수 있도록 해준 것이 지도학습이다.
비지도학습은 target변수가 없다.
정답을 모르는 상태이지만
어떤 규칙이 있음을 알아내는 과정이다.
비지도 학습의 예로서
-연관규칙(Association)
-군집분석(Clustering)
-knowledgeFlow(그래프로 구조를 그리는 방법)
*연관규칙(association rule)이란?
서로간의 아이템들간의 어떤 연관성이있는지를 보는것 이다.
어떤 상품들끼리 같이 구매가 되는 지를 보는 것으로 장바구니 분석 이라고도 불린다.
마케팅에서의 활용
-교차판매,묶음판매,상품진열 시에 많이 사용한다.
교차판매-a라는 상품을 팔 때 b라는 상품을 추천
묶음판매-관련된 상품끼리 묵어서 상품판매(1+1)
상품진열-어떤상품기리 가까이 있어야 많이 파는지를 갖고 상품 진열
거래후 쿠폰 제공(순차 연관분석)-a라는 상품을 사면 나중에 b라는 상품을 이후에 사는거)
측정도구
지지도(support)-전체 상품중에 얼마나 팔리는 상품인가.
신뢰도(confidence)-a 상품을 샀을 때 b 상품을 살 확률
향상도(lift)-지지도와 신뢰도 간의 관계에서
그냥 두었을 때에 비해서 어떤상품들을 추천해주었을 때 팔 확률
연관성 규칙 생성 과정
1단계 -지지도 support
-상품수가 적으면 전반적인 percent가 올라가고 많으면 percent가 내려간다.
-여기서 컷당하면 2단계로 갈 수 없다.

a라는 상품이 얼마나 잘 팔리는 상품인가를 보여준다.
2단계 -신뢰도 confidence
a 상품을 샀을 때 b 상품을 살 확률

a라는 상품을 산사람이 b라는 상품을 살 확률(P(B|A))
3단계 -향상도 lift
그냥 두었을 때에 비해서 어떤상품들을 추천해주었을 때 팔 확률이 몇배높은가

Pr(B|A) A를 샀을 때 B를 살 확률
P(B)가만히 있을 때 알아서 물건이 팔리릴 확률
--> lift가 1이 넘어야 추천을 해 주었을 때 의미가 있다.
지지도는 신뢰도에 영향을 주고
신뢰도는 향상도에 영향을 준다.
ex)

향상도가 1.67이라는 것은
아무에게나 red라는 것을 팔 때에비해
green을 구매한사람들에게 red를 팔 확률이 1.67배이다 라는 의미이다.
Apriori알고리즘(어떤 상품이 많이 팔리는 상품인지 알려주는 알고리즘)
- 빈발 아이템 세트라는 개념이 있다.(많이 팔리는 상품을 묶어준다.)
여기서 Apriori알고리즘을 사용한다.
'weka 공부' 카테고리의 다른 글
10차 KNOWLEDGE FLOW (0) | 2022.02.25 |
---|---|
9차 군집분석 (0) | 2022.02.25 |
7차 모델비교 (0) | 2022.02.25 |
6차 다층신경망 (0) | 2022.02.25 |
5차 SVM(SUPPORT VECTOR MACHINE) (0) | 2022.02.25 |