군집 알고리즘
비지도 학습: 정답을 알려주지 않고 모델을 학습시키는 학습법이다. 답을 맞추기위해 공부하기보다 스스로 클래스로 구분해서 나누어 놓는다. 우리는 사과, 바나나, 키위를 알고있지만 이름을 알려주지않고 사진만 보여주고 학습시켰을 때 사과를 1, 바나나를 2, 키위를 3 클래스라고 구분해놓을 것이다.
fruit.shape 에서 npy의 모양이 (300, 100, 100)일 때 어떻게 해석하냐면 샘플의 개수가 300개 (100 x 100)높이 x 넓이 를 가진다.
흑백 사진에서 0~255 중에 0을 의미없게 본다 어차피 곱하면 0이니까 밝은 흰색 부분은 0에 가깝고 어두운 검은색 부분은 255에 가깝다.
그리고 처리할 때는 100 x 100의 npy를 10000개의 1차원 배열로 만들어버립니다.
클러스터링: 비슷한 샘플끼리 서로 모으는 행위 대표적인 비지도 학습 작업 중의 하나 이렇게 만들어진 하나의 그룹을 클러스터 라고 한다.
확인문제
1. 1
K-평균
K-평균 알고리즘의 작동방식은 다음과 같다.
1. 무작위로 K개의 클러스터 중심을 정합니다.
2. 각 샘플에서 가장 가까운 클러스터 중심을 찾아 해당 클러스터의 샘플로 지정합니다.
3. 클러스터에 속한 샘플의 평균값으로 클러스터 중심을 변경합니다.
4. 클러스터 중심에 변화가 없을 때 까지 2번으로 돌아가 반복합니다.
그리고 k-means는 비지도 학습이기 때문에 fit 할 때 target 데이터를 입력하지 않아도 된다.
알고리즘의 반복횟수는 n_iter속성에 저장됩니다.
적절한 클러스터 개수를 찾기 위한 대표적인 방법인 elbow를 사용하겠습니다.
클러스터에 속한 샘플 사이의 거리의 제곱합을 이너셔라고 부릅니다.
이너셔: 클러스터에 속한 샘플이 얼마나 가깝게 모여있는지
클러스터 개수를 증가시키면서 이너셔를 그래프로 그리면 감소하는 속도가 꺾이는 지점이 있습니다.
그 때부터는 클러스터 개수를 늘려도 밀집된 정도가 개선되지 않습니다. 그 모양이 팔꿈치 같아서 엘보우라고 부른다.
꺾이는 지점을 찾는 것이 엘보우 방법이라고 부른다.
확인문제
1. 4
2. 1
'AI > AID' 카테고리의 다른 글
[혼공 머신] 혼자 공부하는 머신러닝 정리하기 - Chapter 07-2, 07-3 (0) | 2024.11.15 |
---|---|
[혼공 머신] 혼자 공부하는 머신러닝 정리하기 - Chapter 06-3, 07-1 (0) | 2024.11.12 |
[혼공 머신] 혼자 공부하는 머신러닝 정리하기 - Chapter 05 (1) | 2024.11.05 |
[혼공 머신] 혼자 공부하는 머신러닝 정리하기 - Chapter 04 (5) | 2024.10.29 |
[혼공 머신] 혼자 공부하는 머신러닝 정리하기 - Chapter 03 (7) | 2024.10.04 |