[혼공 머신] 혼자 공부하는 머신러닝 정리하기 - Chapter 09
·
AI/AID
순환 신경망으로 IMDB 리뷰 분류하기말뭉치 (Corpus)정의: 말뭉치는 자연어 처리(NLP)에서 사용되는 텍스트 데이터의 집합을 의미합니다. 이는 특정 언어 또는 주제에 대한 데이터로 구성될 수 있으며, 다양한 형태의 문서, 대화, 기사 등을 포함할 수 있습니다.용도: 말뭉치는 주로 모델 훈련에 사용됩니다. 예를 들어, 언어 모델, 텍스트 분류기, 기계 번역 시스템 등을 훈련하기 위해 대량의 텍스트 데이터를 필요로 합니다.예시: 뉴스 기사 모음, 소설, 웹사이트의 텍스트, SNS 댓글 등이 말뭉치의 예가 될 수 있습니다. 토큰 (Token)정의: 토큰은 텍스트에서 공백, 구두점, 특수 문자 등을 기준으로 분리된 최소 단위의 문자열을 의미합니다. 일반적으로 단어, 구 또는 심지어 문자 단위로도 분리될 ..
[혼공 머신] 혼자 공부하는 머신러닝 정리하기 - Chapter 08-3, 09-1
·
AI/AID
합성곱 신경망의 시각화가중치 시각화합성곱 층의 가중치를 이미지로 출력하는 것을 말합니다. 합성곱 신경망은 주로 이미지를 다루기 때문에 가중치가 시각적인 패턴을 학습하는지 알아볼 수 있습니다. 특성 맵 시각화합성곱 층의 활성화 출력을 이미지로 그리는 것을 말합니다. 가중치 시각화와 비교하여 각 필터가 이미지의 ㅓ느 부분을 활성화 시키는지 확인할 수 있습니다. 함수형 API케라스에서 신경망 모델을 만드는 방법 중 하나입니다. Model 클래스에 모델의 입력과 출력을 지정합니다. 전형적으로 입력은 input() 함수를 사용하여 정의하고 출력은 마지막 층의 출력으로 정의합니다. 확인문제1. 22. 43. 2문제에서는 입력의 참조를 묻고 있으므로 출력값에 해당하는 2번이 정답이다. 순차 데이터와 순환 신경망순차 ..
[혼공 머신] 혼자 공부하는 머신러닝 정리하기 - Chapter 08-1, 08-2
·
AI/AID
08-1 합성곱 신경망의 구성 요소합성곱합성곱은 밀집층과 비선형 활성화 함수의 결합을 통해 입력과 가중치를 곱하고 절편을 더하는 선형 변환입니다. 그러나 밀집층과 달리 각 합성곱은 입력 전체가 아니라 일부만 사용하여 선형 변환을 수행합니다.합성곱 층의 필터는 밀집층의 뉴런에 해당합니다. 필터의 가중치와 절편은 중첩 커널이라고 부릅니다. 자주 사용되는 커널의 크기는 (3, 3) 또는 (5, 5)입니다. 커널의 깊이는 입력의 깊이와 같습니다.특성 맵특성 맵은 합성곱 층이나 풀링 층의 출력 배치를 의미합니다. 필터 하나가 하나의 특성 맵을 만듭니다. 합성곱 층에 5개의 필터를 적용하면 5개의 특성 맵이 만들어집니다.패딩패딩은 합성곱 층 입력 주위에 추가한 0으로 채워진 픽셀입니다. 패딩을 사용하지 않는 것을 ..
[혼공 머신] 혼자 공부하는 머신러닝 정리하기 - Chapter 06-3, 07-1
·
AI/AID
차원축소원본 데이터의 특성을 적은 수의 새로운 특성으로 변환하는 비지도 학습의 한 종류입니다.차원 축소는 저장 공간을 줄이고 시각화하기 쉽습니다. 주성분 분석차원 축소 알고리즘의 하나로 데이터에서 가장 분산이 큰 방향을 찾는 방법입니다.이런 방향을 주성분이라고 부릅니다. 원본 데이터를 주성분에 투영하여 새로운 특성을 만들 수 있습니다.일반적으로 주성분은 원본 데이터에 있는 특성 개수보다 작습니다. 확인문제:1. 2, 특성의 개수만큼 주성분 찾을 수 있다.2. 1, (1000, 100) 크기 데이터셋에서 10개의 주성분을 찾아 변환하면 샘플의 개수는 그대로이고 특성 개수만 100에서 10으로 바뀝니다. 즉, (1000, 100)3. 1, 주성분 분석은 가장 분산이 큰 방향부터 순서대로 찾습니다. 따라서 첫..
컴공편입생 공부일기
'Ai' 태그의 글 목록