의사결정나무는 종속변수가 범주형 변수인지, 수치형 변수인지 에 따라 분류나무(classification trees)와 회귀나무(regression trees)로 구 분된다. 본 논문에서는 종속변수가 Fraud(보험금 부당 청구건)와 NonFraud(보험금 정당 청구건) 두 가지 값만을 가지는 범주형 변수이기때문에 분류나무(classification trees)를 사용한다. 보험 사기 적발 모형 생성 시 사용될 의사결정나무의 특징은 다음과 같다.
(1) 분류나 예측의 근거를 가시적으로 제공해 주기 때문에 모형의 이 해가 쉽다. 따라서 새로운 자료의 모형에 적합함을 통해 다양한 실무 분야에서 대중적으로 활용이 가능하다. (2) 비모수적 모형으로 선형성, 정규성, 등분산성 등의 가정이 필요 없기 때문에 데이터 선정이 용이하다. (3) 연속형이나 명목형 데이터 값들을 기록된 그대로 처리할 수 있고 데이터를 구성하는 속성의 수가 불필요하게 많을 경우에도 모형 구축시 분류에 영향을 미치지 않는 속성들을 자동으로 제외시 키기 때문에 데이터 전처리 단계에서 소요되는 시간과 노력을 단축할 수 있다. (4) 연속형 변수를 비연속적인 값으로 취급하기 때문에 정보의 손실 이 발생하고 연속형 데이터를 처리하는 능력이 신경망이나 다른 통계기법에 비해 떨어지며 결과적으로 예측력도 감소한다. (5) 하위 노드로 갈수록 표본이 작아지는 특성으로 모형 구축 시에 사용되는 표본의 크기에 민감하다. 따라서 정확한 모형을 구축하기 위해서는 서로 상이한 값을 갖는 데이터들을 충분히 확보해야 한다.