CUST_CLAIM(보험청구)
: 보험사기여부에 대해서 CNTT_FPINFO(보험계약&보험설계사)에 비해 상대적으로 높은 설명력과 유의미한 변수가 많음
CUST_CNTT_FPINFO(보험계약&보험설계사)
: 'TOTALPREM(납입총보험료)가 클수록 MAIN_INSR_AMT_SUM(주보험금합계)가 높다' 라는 유의미한 결과 외엔 보험사기를 예측하기엔 부족한 설명력과 미미한 영향력
InsuranceData(통합데이터)
: 간략히 설명하자면 보험청구, 보험계약&보험설계사 분석 결과를 합쳐놓은 결과
CUST_CNTT_FPINFO_DATA는 보험사기를 예측하기 어려우기 때문에 이 데이터는 사용하지 않는 것이 좋음
CUST_CLAIM_DATA와 InsuranceData 중에서 어떤 데이터를 사용할지 선택
참고 : InsuranceData는 CUST_CNTT_FPINFO_DATA에서 가장 유의미한 결과만 반영하기 때문에 가장 객관적일 수 있음
모든 데이터가 과적합(Overfitting) 문제(N값이 Y값에 비해 너무 많아서 생기는 문제)으로 인해 예측력이 매우 떨어짐
8월 17일 오전 10:00 ~ 11:00 Gather Town
: '데이터 분석에 대한 이슈'를 주제로 문제 해결 의견 공유 및 면담시 질문 사항 정리
8월 17일 오전 14:00 ~ 16:00 Gather Town
: 교수 면담 피드백 정리 & 일정 계획