1. 모델링 결과
- 3개의 모델(SVM, Logistic Regression, RandomFroest)의 성능이 비슷하여 어떤 모델이 가장 우수하다고 하기 어려움
- 프로젝트 목표에 가장 부합한 Logistic Regression 모델의 기능이 가장 적절
- Logistic Regression 모델 최정 선정
2. 샘플링 기법 결과
- 데이터의 수를 고려해볼 때 과적합 문제를 해결하기 위해서 샘플링 기법(Over, Under, Combine) 중 Over Sampling 방식이 적절
- Over Sampling(SMOTE, BSMOTE, ADASYN, SVMSMOTE) 방식들의 샘플링 성능은 비슷하나 precision(정밀도) 측면에서 SVMSMOTE 기법이 비교적 우수
- SVMSMOTE 기법을 최종 샘플링 방식 선정
3. 최종 모델 및 샘플링 기법 선정
- SVMSMOTE를 이용하여 과적합 문제를 해결하고 Logistic Regression 모델에 적용
4. Task 분담
(1) Task
- 지섭 → 데이터 시각화 작업 & 모델을 이용하여 실제 데이터 예측 및 결과 도출
- 종혁 → Git 정리 & 전체 코드 점검
- 현아 → 프로젝트 진행 코드 파일 정리 & 코드 리팩토리
- 지영 → PPT 참고자료 조사(작업이 일찍 끝나면 현아 Help)
- 도경 → PPT 기획 및 제작
- 재영 → PPT 기획 & 발표 준비 & Task 점검
(2) Task 기한