데이터 분석

공부했으니 데이콘을 나가보자.

ignuy 2024. 8. 20.

https://dacon.io/competitions/official/236336/overview/description

 

제2회 신약개발 AI 경진대회 - DACON

분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다.

dacon.io

7월에 딥러닝을 활용한 바이오메디컬 AI 를 공부했었다. 두 분야 다 전공했던 사람으로서 공부에 크게 흥미를 느낄 수 있었고 이 학습 경험을 블로그에 올리며 공유했었다.

 

그러던 중 운이 좋게도 시기가 딱 맞게 데이콘에서 공부했던 분야로 경진대회를 열었다. 아무래도 공부했으니 써먹어보는 시간을 가지는 게 좋지 않을까? 고민하지 말고 바로 시작하자.
계산한 일정은 아래와 같다(8월 25일까지 자격증을 준비해야 해서 경진대회는 틈틈히 준비해야 한다).

 

공부 일정은 한달간 비공개로 블로그에 포스팅할 예정이다. 대회가 마감되면 데이콘 도전기에 대한 내용을 모두 볼 수 있으니 많은 기대를 부탁드린다.

일정 산출

1. 사전조사 및 기획 (8월 20일 - 8월 25일)

  • 대회 규칙 및 평가 기준 이해
  • IRAK 관련 논문 및 자료 조사
  • 선행 연구 및 기존 모델 분석
  • 데이터 세트와 문제 정의 이해

2. 데이터 준비 및 탐색적 데이터 분석 (8월 26일 - 9월 1일)

  • 데이터 수집 및 전처리
  • 결측치 및 이상치 처리
  • 탐색적 데이터 분석 (EDA) 수행
  • 데이터 가공 및 특징 공학 (Feature Engineering)

3. 모델 개발 및 성능 검증 (9월 2일 - 9월 10일)

  • 베이스라인 모델 개발
  • 모델 선택 및 하이퍼파라미터 튜닝
  • 모델 검증 및 성능 평가 (Cross-Validation 등)

4. 모델 개선 및 최적화 (9월 11일 - 9월 17일)

  • 모델 성능 개선 및 최적화
  • 특징 선택 및 차원 축소
  • Ensemble 모델 개발 (필요시)

5. 최종 검토 및 대회 제출 준비 (9월 18일 - 9월 21일)

  • 모델 최종 평가 및 선택
  • 결과물 정리 및 보고서 작성
  • 코드 정리 및 제출 파일 준비

6. 최종 제출 (9월 22일 - 9월 23일)

  • 최종 검토 및 수정
  • 대회 제출

댓글