본문 바로가기
반응형

sklearn3

[ML] 분류(Classification) 분류 지도학습의 한 종류로 target이 범주형(이산형) 레이블인 데이터를 다루는 학습입니다. 연속형인 레이블을 가진 데이터셋을 다루는 학습은 회귀라고 부릅니다. 다음 글에 설명해놓았습니다. 분류의 종류 이진 분류 다중 분류 다중 레이블 분류 다중 출력 분류 이진 분류 이진 분류기는 한 레이블만 구별하는 것입니다. 예를 들면, 5-감지기는 '5'와 '5아님' 두 클래스를 구분할 수 있는 이진 분류기입니다. 다중 분류 셋 이상의 클래스 구별합니다. 예를 들어, 언어라는 target이 있다면, 값에는 한국어, 영어, 프랑스어, 스페인어 등 여러 클래스가 존재할 것입니다. 일부 알고리즘(SGD 분류기, 랜덤 포레스트 분류기, 나이브 베이즈 분류기 등)은 여러 개의 클래스를 직접 처리할 수 있는 반면, 다른 알.. 2022. 2. 6.
[DACON] 집값 예측 경진대회 DACON - 집값 예측 경진대회 2022.01.24 ~ 2022.02.04 동안 진행되었던 DACON 집값 예측 경진대회에 참가 후기입니다. Kaggle의 집 값 예측 데이터를 축소하여 가져온 듯합니다. 아래의 링크는 제가 작성한 코드를 DACON에 공유한 것입니다. 본 글에서는 데이터 분석 진행 과정을 요약해서 적어보려 합니다. 저번 펭귄 몸무게 예측 대회에 비해 결과가 좋지 않습니다. (public : 0.09942) 등수는 비밀입니다. 많이 아쉬운 결과라... 😐 정확히 어떤 부분에서 갈렸는지는 알 수 없지만 상위에 랭크되신 분들 코드를 참고해서 수정해봐야겠습니다. 해당 대회의 평가 산식은 'NMAE'였습니다. ▶ DACON 집값 예측 경진대회 - Code Share EDA&Feature Engi.. 2022. 2. 4.
[ML] 결정 트리 (Decision Tree) 결정 트리 (Decision Tree) 분류와 회귀 작업 그리고 다중 출력 작업도 가능한 다재다능한 머신러닝 알고리즘 분류 : 목표변수가 범주형인 경우 회귀 : 목표변수가 연속형인 경우 지도 학습 알고리즘에 해당 매우 복잡한 데이터셋도 학습할 수 있는 강력한 알고리즘 의사결정 나무 방식의 최대 장점은 데이터 전처리 불필요 → 특성의 스케일을 맞추거나 평균을 원점에 맞추는 작업 등이 필요하지 않음. 결정 트리 학습과 시각화, 예측 사이킷런(scikit-learn) - tree.DecisionTreeClassifier from sklearn.datasets import load_iris from sklearn import tree iris = load_iris() X, y = iris.data, iris.t.. 2022. 2. 1.
반응형