[혼공 머신] 혼자 공부하는 머신러닝 정리하기 - Chapter 06-3, 07-1
·
AI/AID
차원축소원본 데이터의 특성을 적은 수의 새로운 특성으로 변환하는 비지도 학습의 한 종류입니다.차원 축소는 저장 공간을 줄이고 시각화하기 쉽습니다. 주성분 분석차원 축소 알고리즘의 하나로 데이터에서 가장 분산이 큰 방향을 찾는 방법입니다.이런 방향을 주성분이라고 부릅니다. 원본 데이터를 주성분에 투영하여 새로운 특성을 만들 수 있습니다.일반적으로 주성분은 원본 데이터에 있는 특성 개수보다 작습니다. 확인문제:1. 2, 특성의 개수만큼 주성분 찾을 수 있다.2. 1, (1000, 100) 크기 데이터셋에서 10개의 주성분을 찾아 변환하면 샘플의 개수는 그대로이고 특성 개수만 100에서 10으로 바뀝니다. 즉, (1000, 100)3. 1, 주성분 분석은 가장 분산이 큰 방향부터 순서대로 찾습니다. 따라서 첫..
[혼공 머신] 혼자 공부하는 머신러닝 정리하기 - Chapter 06
·
AI/AID
군집 알고리즘비지도 학습: 정답을 알려주지 않고 모델을 학습시키는 학습법이다. 답을 맞추기위해 공부하기보다 스스로 클래스로 구분해서 나누어 놓는다. 우리는 사과, 바나나, 키위를 알고있지만 이름을 알려주지않고 사진만 보여주고 학습시켰을 때 사과를 1, 바나나를 2, 키위를 3 클래스라고 구분해놓을 것이다. fruit.shape 에서 npy의 모양이 (300, 100, 100)일 때 어떻게 해석하냐면 샘플의 개수가 300개 (100 x 100)높이 x 넓이 를 가진다. 흑백 사진에서 0~255 중에 0을 의미없게 본다 어차피 곱하면 0이니까 밝은 흰색 부분은 0에 가깝고 어두운 검은색 부분은 255에 가깝다. 그리고 처리할 때는 100 x 100의 npy를 10000개의 1차원 배열로 만들어버립니다. 클러..
[혼공 머신] 혼자 공부하는 머신러닝 정리하기 - Chapter 05
·
AI/AID
결정 트리결정 트리 모델은 모델을 설명하기 쉽다. =  스무고개와 같다. 노드는 트리의 핵심구성요소와 같다.트리는 다음과 같은 내용을 가진다. 왼쪽이 yes 오른쪽이 no이다. 지니 불순도지니 불순도는 노드에서 데이터를 분할할 기준을 정할 때 사용한다.0은 순수한 노드이고 0.5가 나오면 최악의 지니 불순도이다. 만약 100개의 샘플이 있고 그 노드의 두 클래스 비율이 정확히 1/2라면 지니 불순도는 0.5로 최악이다.1 - (0.5^2 + 0.5^2) = 0.5 원래 결정 트리 모델은 부모 노드와 자식 노드의 불순도의 차이가 가능한 크도록 트리를 성장시킨다. Information Gain부모 노드와 자식 노드의 불순도 차이 엔트로피엔트로피도 지니 불순도와 동일하게 결정트리의 불순도를 구하는데 사용된다...
[혼공 머신] 혼자 공부하는 머신러닝 정리하기 - Chapter 04
·
AI/AID
주요 키워드로지스틱 회귀다중 분류시그모이드 함수소프트맥스 함수04-1 로지스틱 회귀다중분류란타겟 데이터에 2개 이상의 클래스가 포함된 문제이다.예를 들어, 데이터(ex 사진, csv)를 보고 이게 어떤 클래스인지 - 사진 보고 고양이인지, 강아지인지, 소인지, 돼지인지 구분하는 하지만 구분하는 클래스 (동물의 수)가 2개 이상이면 다중분류라고 한다. 로지스틱 회귀란말은 회귀지만 정작 하는건 분류 모델이다.확률이라서 0~1사이의 값을 가진다. 이 때 사용하는 것이 시그모이드 함수(로지스틱 함수 or 로짓)이다.시그모이드 함수특정 값을 넣으면 이런 그래프를 그리게 된다. 결국 0~1사이값. 소프트맥스 함수란이진 분류 = 시그모이드다중 분류 = 소프트맥스다중 분류의 선형방정식에서 z값을 클래스의 개수만큼 가지..
컴공편입생 공부일기
'스터디' 태그의 글 목록 (2 Page)