본문 바로가기
반응형

Data Analysis7

[Anaconda] 아나콘다 가상환경 생성, 삭제, 활성화, 비활성화 코드 Anaconda virtual environment anaconda virtual environment(가상환경) 생성 + python 설치 $ conda create -n env_name python anaconda virtual environment 리스트 확인 $ conda env list anaconda virtual environment 활성화 $ activate env_name anaconda virtual environment 비활성화 $ conda deactivate anaconda virtual environment 삭제 $ conda env remove -n env_name anaconda virtual environment 이름 변경 (기존 env 복사한 후 제거) conda crea.. 2022. 10. 5.
[DACON] 항공사 고객 만족도 예측 경진대회 DACON - 항공사 고객 만족도 예측 경진대회 2022.02.07 ~ 2022.02.18 동안 진행되었던 DACON 항공사 고객 만족도 예측 경진대회 참가 후기입니다. 본 글에서는 데이터 분석 진행 과정을 요약하여 적어보려 합니다. 아래의 링크는 제가 한 코드를 전부를 공유해놓은 주소입니다. 저는 종료가 하루 남은 현재 시점에 517명 중 19등의 점수를 받았습니다. (사진은 24등인데, 19등과 점수가 동일합니다 ㅎㅎ) 해당 대회의 평가 산식은 'Accuracy'였고, 저는 public : 0.938 점수를 받았습니다. 저도 다른 분들의 코드를 참고하여 점수를 좀 더 올리면서 흥미를 유발하려 했던 것 같습니다. 이 글을 보신 분들이 조금이라도 얻어가시는 게 있으시면 좋겠습니다. ▶DACON - Cod.. 2022. 2. 17.
[데이터 직무] 빅데이터와 관련된 다양한 직무 구분 (데이터 엔지니어, 데이터 사이언티스트 ...) 빅데이터 관련 직무 본 글은 데이터 마이닝 전문가 조성준 교수님의 '빅데이터 커리어 가이드북'을 기반으로 작성했습니다. 저는 데이터와 관련된 직업과 직무 명칭이 통일이 되어있지 않아 관련 정보를 찾을 때 많은 어려움을 겪었습니다. 그런 점에 있어, 데이터 관련 직무를 구분할 수 있으며, 그 직무의 필요한 지식에 대해 명확하게 알 수 있다면 준비를 함에 있어 방향성이 더욱 확실해지지 않을까 싶었습니다. 모든 곳에서 아직 이와 같이 직무 구분을 하고, 통용하여 사용하지는 않지만 경계가 애매한 데이터 관련 직무에 관해 구분을 하여 각 직무를 비교하여 준비한다면 도움이 많이 되지 않을까 싶습니다. 제가 참고한 도서의 저자이신 조성준 교수님은 이상적인 빅데이터팀의 업무 수행 방식을 고려하여 빅데이터 직무를 다음과.. 2022. 2. 8.
[DACON] 집값 예측 경진대회 DACON - 집값 예측 경진대회 2022.01.24 ~ 2022.02.04 동안 진행되었던 DACON 집값 예측 경진대회에 참가 후기입니다. Kaggle의 집 값 예측 데이터를 축소하여 가져온 듯합니다. 아래의 링크는 제가 작성한 코드를 DACON에 공유한 것입니다. 본 글에서는 데이터 분석 진행 과정을 요약해서 적어보려 합니다. 저번 펭귄 몸무게 예측 대회에 비해 결과가 좋지 않습니다. (public : 0.09942) 등수는 비밀입니다. 많이 아쉬운 결과라... 😐 정확히 어떤 부분에서 갈렸는지는 알 수 없지만 상위에 랭크되신 분들 코드를 참고해서 수정해봐야겠습니다. 해당 대회의 평가 산식은 'NMAE'였습니다. ▶ DACON 집값 예측 경진대회 - Code Share EDA&Feature Engi.. 2022. 2. 4.
[DACON] 펭귄 몸무게 예측 경진대회 DACON - Penguin Body Mass ▶ DACON - Penguin Codeshare 2021.12.27 ~ 2022.01.07에 진행된 DACON 펭귄 몸무게 예측 경진대회 참가 후기이다. 머신러닝 입문, 데이터 분석 연습용으로 만들어진 대회라 데이터의 크기가 그렇게 크지 않았다. 실제 데이터에 적용하면서 연습하려고 참가하였고, 개인적으로 이것저것 많이 시도해보려고했다. 대회가 끝나고 다른 분들이 다양한 코드를 공유해주셔서 참고해서 보안했지만 여기서는 내가 한 방식에 대해서 작성해보려한다. 아래에 참고하면 좋을 다른 분들의 코드를 공유해주신 링크들을 첨부해놓겠다. 이 대회는 평가지표로 RMSE를 사용했다. 결과적으로 나는 대회종료 후 RMSE : 272.31852 로 725명 중 12등으로 .. 2022. 1. 11.
[Kaggle] Titanic 필사 - 이유한님 Kaggle - Titanic 필사 Data Analysis의 전체적인 흐름에 대한 이해와 부분별로 어떤 코드로 구현했는지 배우기 위해 Machine Learning Study에서 진행했다. 다른 분들이 방법과 코드들에 대해서 많이 올려주셨으니 나는 Titanic을 해보면서 느낀 데이터 분석의 전체적인 흐름에 대해서 정리해보려고 한다. (느낀 점도) 필사하는 데 참고한 코드와 나의 작성 코드는 아래에 URL 붙여놓았다. Load Data, Import Library 분석하려는 데이터를 불러오고 필요한 라이브러리를 불러오고 설정을 하는 단계이다. 해당 단계에서는 전체적으로 데이터의 크기가 어떻게 되고 어떤 Feature들이 있고, type은 어떻게 되는지 간단하게 살펴보는 단계이기도 하다. EDA 개인적으.. 2022. 1. 9.
[연합동아리] BOAZ 데이터 분석 18기 - 지원, 면접, 합격 후기 BOAZ BOAZ는 대학(원)생으로 이루어진 빅데이터 연합동아리입니다. 데이터 분석, 데이터 엔지니어링, 데이터 시각화로 파트가 구분되어 진행됩니다. 지원 통계학과 출신으로 데이터 분석에 관심이 많았던 저는 다양한 학교, 학과의 열정 가득한 분들과 함께 공부하고 친해지면 서로 자극이 되며 활동 기간동안과 그 이후에도 많은 성장을 이룰 수 있을 것 같아 지원하게 되었습니다. 저는 BOAZ 18기 - 데이터 분석 파트에 지원하였습니다. 지원서는 기본적인 정보와 툴에 대한 경험, 프로젝트 경험 등에 대해 작성했고, 다음 세 가지에 대해 자세히 작성했습니다. 지원한 동기와 BOAZ 활동을 통해 얻고 싶은 것 (600자) 프로젝트 경험 소개 (700자) 열정을 가지고 끝까지 마무리했던 경험 (500자) 프로젝트 .. 2022. 1. 7.
반응형