컴공생의 공부일상

[혼공 머신] 혼자 공부하는 머신러닝 정리하기 - Chapter 07-2, 07-3

2024.11.15·

AI/AID

심층 신경망 (DNN, Deep Neural Network)input layer, hidden layer, output layer에서 activation function는 hidden layer에 붙어있다.activation function는 NN layer에 선형 방정식 값을 계산하는데 쓰이는 함수입니다. 예를 들어, 이진분류에는 시그모이드혹은 소프트 맥스, ReLU를 사용할 수 도 있는 것입니다. hidden layer에만 activation function를 적용하는 이유분류 문제는 클래스에 대한 확률을 출력하기위해 활성화 함수를 사용한다. 회귀는 어떠한 숫자라서 활성화 함수가 필요없다. 전 출력층의 방정식 값을 그대로 사용한다. = 선형계산을 적당하게 비선형으로 틀어주기위해 Sequencial(d..

Grind75 - 242. Valid Anagram 파이썬

2024.11.13·

알고리즘/LeetCode_Grind75

242. Valid Anagram EasyGiven two strings s and t, return true if t is an anagram of s, and false otherwise. Example 1:Input: s = "anagram", t = "nagaram"Output: trueExample 2:Input: s = "rat", t = "car"Output: false Constraints:1 4s and t consist of lowercase English letters. Follow up: What if the inputs contain Unicode characters? How would you adapt your solution to such a case? 나의 코드from col..

[혼공 머신] 혼자 공부하는 머신러닝 정리하기 - Chapter 06-3, 07-1

2024.11.12·

AI/AID

차원축소원본 데이터의 특성을 적은 수의 새로운 특성으로 변환하는 비지도 학습의 한 종류입니다.차원 축소는 저장 공간을 줄이고 시각화하기 쉽습니다. 주성분 분석차원 축소 알고리즘의 하나로 데이터에서 가장 분산이 큰 방향을 찾는 방법입니다.이런 방향을 주성분이라고 부릅니다. 원본 데이터를 주성분에 투영하여 새로운 특성을 만들 수 있습니다.일반적으로 주성분은 원본 데이터에 있는 특성 개수보다 작습니다. 확인문제:1. 2, 특성의 개수만큼 주성분 찾을 수 있다.2. 1, (1000, 100) 크기 데이터셋에서 10개의 주성분을 찾아 변환하면 샘플의 개수는 그대로이고 특성 개수만 100에서 10으로 바뀝니다. 즉, (1000, 100)3. 1, 주성분 분석은 가장 분산이 큰 방향부터 순서대로 찾습니다. 따라서 첫..

[Python] Colab에서 여러가지 한글 OCR 라이브러리 사용해보고 비교해보기 (24-11-07)

2024.11.07·

공부

OCR(광학 문자 인식)이란 무엇인가?광학 문자 인식(OCR)은 텍스트 이미지를 기계가 읽을 수 있는 텍스트 포맷으로 변환하는 과정입니다. 예를 들어 양식 또는 영수증을 스캔하는 경우 컴퓨터는 스캔본을 이미지 파일로 저장합니다. 이미지 파일에서는 텍스트 편집기를 사용하여 단어를 편집, 검색하거나 단어 수를 계산할 수 없습니다. 그러나 OCR을 사용하면 이미지를 텍스트 문서로 변환하여 내용을 텍스트 데이터로 저장할 수 있습니다. 여기저기 기술블로그에서 조각모음하여 하나로 모아보겠습니다~ 저의 의견과 코드는 소량 첨부 되었습니다.사용해 볼 여러 가지 라이브러리1. 테서랙트(tesseract)2. EasyOCR3. PaddleOCR4. pororo5. Google Vision ai 이런 것도 있다1. Aspo..

[혼공 머신] 혼자 공부하는 머신러닝 정리하기 - Chapter 06

2024.11.07·

AI/AID

군집 알고리즘비지도 학습: 정답을 알려주지 않고 모델을 학습시키는 학습법이다. 답을 맞추기위해 공부하기보다 스스로 클래스로 구분해서 나누어 놓는다. 우리는 사과, 바나나, 키위를 알고있지만 이름을 알려주지않고 사진만 보여주고 학습시켰을 때 사과를 1, 바나나를 2, 키위를 3 클래스라고 구분해놓을 것이다. fruit.shape 에서 npy의 모양이 (300, 100, 100)일 때 어떻게 해석하냐면 샘플의 개수가 300개 (100 x 100)높이 x 넓이 를 가진다. 흑백 사진에서 0~255 중에 0을 의미없게 본다 어차피 곱하면 0이니까 밝은 흰색 부분은 0에 가깝고 어두운 검은색 부분은 255에 가깝다. 그리고 처리할 때는 100 x 100의 npy를 10000개의 1차원 배열로 만들어버립니다. 클러..

[혼공 머신] 혼자 공부하는 머신러닝 정리하기 - Chapter 05

2024.11.05·

AI/AID

결정 트리결정 트리 모델은 모델을 설명하기 쉽다. = 스무고개와 같다. 노드는 트리의 핵심구성요소와 같다.트리는 다음과 같은 내용을 가진다. 왼쪽이 yes 오른쪽이 no이다. 지니 불순도지니 불순도는 노드에서 데이터를 분할할 기준을 정할 때 사용한다.0은 순수한 노드이고 0.5가 나오면 최악의 지니 불순도이다. 만약 100개의 샘플이 있고 그 노드의 두 클래스 비율이 정확히 1/2라면 지니 불순도는 0.5로 최악이다.1 - (0.5^2 + 0.5^2) = 0.5 원래 결정 트리 모델은 부모 노드와 자식 노드의 불순도의 차이가 가능한 크도록 트리를 성장시킨다. Information Gain부모 노드와 자식 노드의 불순도 차이 엔트로피엔트로피도 지니 불순도와 동일하게 결정트리의 불순도를 구하는데 사용된다...

티스토리툴바