일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 스파크
- YOLO
- 내일채움공제만기
- SeSAC
- SPARK
- Swift
- 내채공만기
- 앱생명주기
- 얼굴 비식별화
- python
- 비식별화
- roboflow
- 파이썬
- opencv
- Apache Spark
- 준지도학습
- iOS부트캠프
- face blur
- Apache Kafka
- IOS
- 아파치 카프카
- scenedelegate
- 카프카
- train data
- Yolo5
- caffemodel
- 아파치 스파크
- Yolo5 custom dataset
- Kafka
- yolov5
- Today
- Total
목록머신러닝, 딥러닝/기초 (3)
봉식이와 캔따개
※ '핸즈온 머신러닝' 을 읽으며 정리했습니다. 지도 학습(supervised learning) 지도 학습은 훈련 데이터에 레이블(정답)이 포함되어있다. 대표적인 지도 학습 작업 분류(classification) : 주어진 샘플을 클래스별로 구별 회귀(regression) : 예측변수(특성)을 사용해 타깃 수치를 예측 지도 학습 알고리즘 k-최근접 이웃 선형 회귀 로지스틱 회귀 서포트 벡터 머신 결정 트리와 랜덤 포레스트 신경망 비지도 학습(unsupervised learning) 비지도 학습의 훈련 데이터에는 레이블이 없다. 대표적인 비지도 학습 작업 군집(clustering) : 각 데이터의 유사성을 측정하여 비슷한 데이터끼리 군집 시각화 차원축소 : 데이터를 간소화 이상치 탐지 : 데이터셋에서 이상..
PCA는 차원 축소 방법 중 하나이다. 차원축소란? 많은 feature들로 구성된 다차원의 데이터 세트의 차원을 축소해 새로운 차원의 데이터 세트를 생성하는 것을 말한다. 차원이 증가할수록(feature가 증가할수록) 예측 신뢰도가 떨어지고 과적합이 발생히고 개별 feature간의 상관관계가 높을 가능성이 있다. 차원 축소를 하는 이유에는 여러가지가 있는데 첫번째는 시각화 (차원이 3차원이 넘어가면 시각화를 할 수 없기 때문에 시각화를 위해 차원 축소를 한다) 두번째는 노이즈 제거 세번째는 메모리 절약 네번째는 모델 성능 향상 등의 이유가 있다. → 정리 데이터에 feature가 많은 경우가 있는데 모든 feature가 결과에 중요한 영향을 끼치는 것은 아니다. 따라서 가장 중요한 feature 몇 개 ..
Train Data 모델을 학습시키기 위한 Data Train data를 이용해 각기 다른 모델을 서로 다른 epoch로 학습시킨다 (epoch : 전체 Data set에 대해 한 번 학습을 완료한 상태) 모델을 학습하는 데에는 Train data만 사용한다 Validation Data 학습이 이미 완료된 모델을 검증하기 위한 Data 모델을 학습시키지 않는다 학습시키지는 않지만 학습에 관여한다 Test Data 학습과 검증이 완료된 모델의 성능을 평가하기 위한 Data 학습에 전혀 관여하지 않고 최종 성능을 평가하기 위해 쓰인다 Validation Data의 역할 그림에서 우측으로 갈 수록 epoch를 늘려가면서 train data를 학습시키는 과정이다. 가운데 그림은 train data 뿐 아니라 일..