-
[ML Study]ch08-3 합성곱 신경망의 시각화
본 포스팅 한빛미디어의 <혼자공부하는 머신러닝+딥러닝(박해선 저)>를 요약 정리했습니다. 1. 가중치 시각화 각 필터는 커널이라 부르는 가중치와 절편을 가지고 있는데 일반적으로 절편은 시각적으로 의미가 있지 않다. 가중치는 입력 이미지의 2차원 영역에 적용되어 어떤 특징을 크게 두드러지게 표현하는 역할을 한다. 2절에서 best-cnn-model.h5 파일을 생성하고 이어서 학습해야 하고, model.layers를 통해 층을 확인한다. Conv2D, MaxPooling2D, Conv2D, MaxPooling2D, Flatten, Dense, Dropout, Dense... Read More
-
[ML Study]ch08-2 합성곱 신경망을 사용한 이미지 분류
본 포스팅 한빛미디어의 <혼자공부하는 머신러닝+딥러닝(박해선 저)>를 요약 정리했습니다. 합성곱 신경망을 사용한 이미지 분류 패션 MNIST 데이터 불러오기 Conv2D 입력의 너비와 높이 방향의 합성곱 연산을 구현한 클래스이다. 첫번쨰 매개변수는 합성곱 필터의 개수이다. kernel_size 매개변수 필터의 커널 크기를 지정한다. 가로세로 크키가 같은 경우 정수 하나로, 다른 경우 정수의 튜플로 지정할 수 있다. 일반적으로 커널의 가로세로 ... Read More
-
[ML Study]ch08-1 인공 신경망
본 포스팅 한빛미디어의 <혼자공부하는 머신러닝+딥러닝(박해선 저)>를 요약 정리했습니다. 합성곱 합성곱(convolution)은 입력 데이터의 특징을 추출하기 위한 연산이다. 주로 이미지 데이터를 처리하는 데 사용되고 합성곱 연산을 통해 입력 이미지에서 패턴과 특징을 감지한다. 유용한 특성만 드러나게 하는 것과 유사 특성 입력 데이터 전체에 가중치를 곱하는 것이 아닌 일부 데이터에 가중치를 곱한다. 하나의 뉴런에 1개의 출력을 내므로 몇개의 데이터를 입력하던지 output은 뉴런의 개수만큼 출력된다. 위 영상과 같이 뉴런의 개수와 총 입력데이터의 ... Read More
-
[ML Study]ch07-3 신경망 모델 훈련
본 포스팅 한빛미디어의 <혼자공부하는 머신러닝+딥러닝(박해선 저)>를 요약 정리했습니다. 신경망 모델 훈련 손실 곡선 fit() 메서드로 모델을 훈련하면 훈련 과정이 상세하게 출력되어 에포크 횟수, 손실, 정확도 등을 확인할 수 있다. 그런데 아래와 같이 출력의 마지막에 다음과 같은 메시지가 출력되는 것을 확인했을 것이다. tensorflow.python.keras.callbacks.History at 0x7f11f82f5710 위 메시지는 fit()메서드의 실행 결과를 출력한 것이다. fit() 메서드는 History 클래스 객체를 반환한다. Histo... Read More
-
[ML Study]ch07-2 심층 신경망
본 포스팅 한빛미디어의 <혼자공부하는 머신러닝+딥러닝(박해선 저)>를 요약 정리했습니다. 1. 2개의 층 케라스 API를 사용해 MNIST 데이터셋을 불러온다. 1절과 같이 학습시키고 인공 신경망 모델에 층을 2개 추가한다. 입력층과 출력층 사이에 밀집층이 추가된 것으로 이 사이에 있는 모든 층을 은닉층이라 부른다. 은닉층 옆에 활성화 함수가 붙는데 이는 신경망 층의 선형 방정식의 계산 값에 적용하는 함수이다. 활성화 함수는 출력층에 적용하는 활성화 함수보다 비교적 자유롭다. 은닉층에서 선형적인 산술 계산만 수행한다면 수행 역할이 없는 셈이 되어 선형 계산을 적당하... Read More
-
[ML Study]ch07-1 인공 신경망
본 포스팅 한빛미디어의 <혼자공부하는 머신러닝+딥러닝(박해선 저)>를 요약 정리했습니다. 패션 MNIST 패션 MNIST는 기계 학습과 컴퓨터 비전 연구를 위해 사용되는 데이터셋 중 하나로 전통적인 손글씨 숫자 MNIST 데이터셋의 대안으로 개발되었다. 해당 데이터셋은 옷, 액세서리 등 다양한 패션 아이템의 이미지로 구성되어 있고 각 이미지는 28x28 픽셀의 흑백 이미지로 구성된다. 주로 이미지 분류 알고리즘을 개발하고 평가하는데 사용되고 딥러닝 라이브러리에서 데이터를 가져올 수 있다. 그리고 아래와 같이 패션 아이템을 나타내는 총 10개의 클래스가 있다. T... Read More
-
[ML Study]ch06-3 주성분 분석
본 포스팅 한빛미디어의 <혼자공부하는 머신러닝+딥러닝(박해선 저)>를 요약 정리했습니다. 차원 축소 차원 축소란 데이터가 가진 속성을 특성(Feature)라고 부르는데 이런 특성을 차원이라고 부른다. 차원 축소는 데이터를 가장 잘 나타내는 일부 특성을 선택하여 데이터 크기를 줄이고 지도 학습 모델의 성능을 향상시킬 수 있다. 주성분 분석 주성분 분석(Principal component Analysis, PCA)는 차원 축소 알고리즘으로 다차원 데이터의 차원을 축소하면서 데이터의 변동성을 최대한 보존하는 기법이다. 이를 통해 데이터를 더 낮은 차원으로 표현하면서 중요한 ... Read More
-
[ML Study]ch06-2 k 평균
본 포스팅 한빛미디어의 <혼자공부하는 머신러닝+딥러닝(박해선 저)>를 요약 정리했습니다. K 평균 K 평균 k-평균 알고리즘(K-means)은 주변 데이터를 K개의 클러스터로 묶어 평균값을 찾는 알고리즘이다. 여기서 K는 묶을 군집의 개수를 의미한다. k-평균 알고리즘이 찾은 평균값이 클러스터의 중심에 위치하기 때문에 클러스터 중심(cluster center) 또는 센트로이드(centroid)라고 부른다. k 평균 알고리즘 작동 순서는 다음과 같다. 무작위로 k개의 클러스터 중심을 정한다. ... Read More
-
[ML Study]ch06-1 군집 알고리즘
본 포스팅 한빛미디어의 <혼자공부하는 머신러닝+딥러닝(박해선 저)>를 요약 정리했습니다. 1. 비지도 학습 타깃이 없을 때 사용하는 머신러닝 알고리즘을 비지도 학습이라고 한다. 타깃(사진에 대한 정답)을 모르는 사진들을 종류별로 분류하려 한다. 이를 위해 사진의 픽셀값을 모두 평균내서 비슷한 과일을 모아보는 방법을 제안한다. 2. 과일 사진 데이터 준비하기 npy파일로 저장된 사과, 바나나, 파인애플을 담고 있는 흑백사진 데이터를 준비한다. npy파일을 다운로드 해야한다. [과일 데이터셋의 출처] https://www.kaggle.com/moltean/f... Read More
-
[ML Study]ch05-3 트리의 앙상블
본 포스팅 한빛미디어의 <혼자공부하는 머신러닝+딥러닝(박해선 저)>를 요약 정리했습니다. 1. 정형 데이터와 비정형 데이터 정형 데이터는 어떤 구조로 되어있다는 뜻이며, CSV나 데이터베이스, 엑셀 등에 저장하기 쉽다. 비정형 데이터는 텍스트 데이터, 디지털 카메라로 찍은 사진 등 데이터베이스나 엑셀로 표현하기 어려운 것들이다. 정형 데이터를 다루는데 가장 뛰어난 성과를 내는 알고리즘은 앙상블 학습(ensemble learning)이다. 2. 랜덤 포레스트 랜덤 포레스트(Random Forest)는 대표적인 앙상블 학습이다. 결정 트리를 랜덤하게 만들어 결정 트... Read More
-
[ML Study]ch05-2 교차 검증과 그리드 서치
본 포스팅 한빛미디어의 <혼자공부하는 머신러닝+딥러닝(박해선 저)>를 요약 정리했습니다. 검증 세트 테스트 세트를 사용하지 않고 과대적합인지 과소적합인지 판단하기 위해 훈련 세트를 나누어 검증하는 것을 말한다. 검증 세트를 몇 %만큼 나누어야 적당한가? -> 보통 20~30%를 나누지만 훈련 세트가 많으면 많을 수록 더 적게 나누어도 문제가 발생하지 않는다. 교차 검증 검증 세트를 만들게 된다면 훈련에 사용되는 데이터가 줄어들게 된다. 하지만 대부분 데이터를 많이 훈련하면 좋은 모델이 만들어진다. 그러므로 교차검증을 이용하여 이러한 문제를 해결한다. ... Read More
-
[ML Study]ch05-1 결정 트리
본 포스팅 한빛미디어의 <혼자공부하는 머신러닝+딥러닝(박해선 저)>를 요약 정리했습니다. 결정 트리 결정 트리 결정 트리(Decision Tree) 1. 결정 트리 모델은 분류와 회귀가 모두 가능한 지도 학습 모델이다. 2. 스무 고개 하듯이 예/아니오 와 같은 질문을 이어가며 학습을 진행한다. 3. 데이터를 잘 나눌 수 있는 질문을 찾는다면 계속 질문을 추가해서 분류 정확도를 높일 수 있다. 위의 그림과 같이 예/아니오 와 같은 질문을 이어가며 학습을 진행한다. 사이킷런에서는 DecisionTreeClassifier 클래스를 통해 결정 트... Read More
-
[ML Study]ch03-1 k-최근접 이웃 회귀
본 포스팅 한빛미디어의 <혼자공부하는 머신러닝+딥러닝(박해선 저)>를 요약 정리했습니다. 1. k-최근접 이웃 회귀 지도학습 알고리즘은 분류와 회귀(regression) 두 가지로 크게 나뉜다. 회귀란 클래스 중 하나로 분류하는 것이 아닌 임의의 어떤 숫자를 예측하는 것으로 정해진 클래스가 없고 임의의 수치를 출력하고, 두 변수 사이의 상관 관계를 분석하는 방법이다. k-최근접 이웃 분류 알고리즘은 예측하려는 샘플에 가장 가까운 샘플 k개 선택하고 이 샘플들의 클래스를 확인하여 다수 클래스를 새로운 샘플의 클래스로 예측하는 것이다. 마찬가지로 k-최근접 이웃 회... Read More
-
[ML Study]ch02-1 훈련 세트와 테스트 세트
본 포스팅 한빛미디어의 <혼자공부하는 머신러닝+딥러닝(박해선 저)>를 요약 정리했습니다. 머신러닝 알고리즘 머신러닝 알고리즘은 크게 세가지 분류로 지도 학습(Supervised Learning), 비지도 학습(Unsupervised Learning), 강화 학습(Reinforcement Learning)으로 나눠진다. 이 포스팅에서는 지도 학습과 비지도 학습에 대해서만 작성한다. 지도 학습 지도 학습은 간단하게 말하면 정답이 있는 학습 알고리즘이다. 답과 문제를 비교해가면서 알고리즘이 정답을 맞히는 것을 학습한다. 즉, [데이터 : 정답] 형태로 되어있는 데이터 세트를 ... Read More
-
[ML Study]ch01-2 코랩과 주피터 노트북
본 포스팅 한빛미디어의 <혼자공부하는 머신러닝+딥러닝(박해선 저)>를 요약 정리했습니다. 구글 코랩 구글 코랩(Colab)은 웹 브라우저에서 무료로 파이썬 프로그램을 테스트하고 저장할 수 있는 서비스이다. 즉, 클라우드 기반의 주피터 노트북 개발 환경이다. 또한 코랩은 웹 브라우저에서 텍스트와 프로그램 코드를 자유롭게 작성할 수 있는 온라인 에디터라고 할 수 있다. 코랩 파일을 노트북 혹은 코랩 노트북이라 부름 텍스트 셀 셀(cell)은 코랩에서 실행할 수 있는 최소 단위이다. 셀 안에 있는 내용을 한 번에 실행하고 그 결과를 노트북에 나타낸다. ... Read More
-
[ML Study]ch01-1 인공지능과 머신러닝, 딥러닝
본 포스팅 한빛미디어의 <혼자공부하는 머신러닝+딥러닝(박해선 저)>를 요약 정리했습니다. 인공지능과 머신러닝, 딥러닝 인공지능이란? 인공지능(artificial intelligence)은 사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템을 만드는 기술이다. 인공지능은 강인공지능과 약인공지능으로 나눌 수 있다. 머신러닝이란? 머신러닝(machine learning)은 규칙을 일일이 프로그래밍하지 않아도 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분야이다. 이는 통계학과 깊은 연관이 있으며 대표적인 오픈소스 통계 소프트웨어로 R이 있다. 컴... Read More
-
Markdown Guide2
이미지 경로 /assets/post/img-name.jpg /assets/Profile/user-name.jpg Read More
-
Markdown Guide
↑ Banner Markdown 설명 이 페이지는 markdown의 형식의 예제들을 적어놓은 설명서이다. 1. 글씨 크기 및 제목 제목 1 제목 2 제목 3 제목 4 제목 5 제목 6 2. 목록 ● 순서없는 목록(글머리 기호: *, +, - 지원) * 빨강 * 녹색 * 파랑 + 빨강 + 녹색 + 파랑 - 빨강 - 녹색 - 파랑 빨강 녹색 파랑 빨강 녹색 파랑 ... Read More
