<aside>
💡 CUST_CNTT_FPINFO_DATA를 이용한 데이터 분석
</aside>
1. 분석 방법 탐색
- CNTT_DATA와 FPINFO_DATA가 보험사기여부(SIU_CUST_YN)를 충분히 설명하는지 판단
- 보험사기여부(SIU_CUST_YN)를 예측하기 위해 데이터의 변수가 유의한지 판단
- 유의한 변수들을 상관분석의 상관계수를 통해 어떤 상관관계가 있는지 판단
- 분석에 필요한 모델 → Multi Regression & Random Forest
2. Multi Regression
CUST_CNTT_FPINFO_DATA 다중회귀분석결과
(1) 유의하지 않은 변수 제거 전
Multi_Regression.ipynb
(2) 유의하지 않은 변수 제거 후
Multi_Regression2.ipynb
3. Correlation Analysis
Correlation Analysis.ipynb
(1) 상관계수
피어슨 상관계수(-1 ≤ cor ≤ 1)