본문 바로가기
반응형

ML3

[ML] 회귀 (Regression)와 경사하강법 (Gradient descent) 회귀 (Regression) 회귀는 보통 연속적인 숫자, 예측값이 float 형태인 문제들을 해결하는 데 사용됩니다. 즉, 회귀는 출력 값에 연속성이 있습니다. train data를 가장 잘 나타낼 수 있는 선형(Linear) 모델을 생성 후 예측을 진행합니다. 아래에서 자세히 설명하겠습니다. 예시 : 공부에 투자한 시간(x)을 바탕으로 시험 점수(y)(0~100) 예측 모델(가설) H(x) = Wx + b H(x) : 우리가 가정한 가설(Hypothesis) W : 가중치 (Weight) b : 편향값 (bias) x(특성(Feature), 설명변수)가 하나인 경우를 단순 선형 회귀(Simple Linear Regression)이라 하고, x가 2개이상인 경우를 다중 선형 회귀(Multiple Line.. 2022. 2. 22.
[ML] 분류(Classification) 분류 지도학습의 한 종류로 target이 범주형(이산형) 레이블인 데이터를 다루는 학습입니다. 연속형인 레이블을 가진 데이터셋을 다루는 학습은 회귀라고 부릅니다. 다음 글에 설명해놓았습니다. 분류의 종류 이진 분류 다중 분류 다중 레이블 분류 다중 출력 분류 이진 분류 이진 분류기는 한 레이블만 구별하는 것입니다. 예를 들면, 5-감지기는 '5'와 '5아님' 두 클래스를 구분할 수 있는 이진 분류기입니다. 다중 분류 셋 이상의 클래스 구별합니다. 예를 들어, 언어라는 target이 있다면, 값에는 한국어, 영어, 프랑스어, 스페인어 등 여러 클래스가 존재할 것입니다. 일부 알고리즘(SGD 분류기, 랜덤 포레스트 분류기, 나이브 베이즈 분류기 등)은 여러 개의 클래스를 직접 처리할 수 있는 반면, 다른 알.. 2022. 2. 6.
[ML] 결정 트리 (Decision Tree) 결정 트리 (Decision Tree) 분류와 회귀 작업 그리고 다중 출력 작업도 가능한 다재다능한 머신러닝 알고리즘 분류 : 목표변수가 범주형인 경우 회귀 : 목표변수가 연속형인 경우 지도 학습 알고리즘에 해당 매우 복잡한 데이터셋도 학습할 수 있는 강력한 알고리즘 의사결정 나무 방식의 최대 장점은 데이터 전처리 불필요 → 특성의 스케일을 맞추거나 평균을 원점에 맞추는 작업 등이 필요하지 않음. 결정 트리 학습과 시각화, 예측 사이킷런(scikit-learn) - tree.DecisionTreeClassifier from sklearn.datasets import load_iris from sklearn import tree iris = load_iris() X, y = iris.data, iris.t.. 2022. 2. 1.
반응형