범핑을 이용한 변수선택

Title
범핑을 이용한 변수선택
Authors
이상원
Keywords
범핑을이용한변수선택
Issue Date
2011
Publisher
인하대학교
Abstract
정보기술의 발전과 방대한 데이터가 수집되어 변수의 개수가 증가함에 따라 데이터 마이닝에서 중요한 변수를 선택하는 방법을 이용하여 데이터의 양을 줄이는 방법이 중요해지고 있다. 변수 선택 방법에는 단계별 회귀모형과 의사결정나무 모형과 R-square, CP, Correlation, Adjust R-square값을 이용한 변수 선택방법이 있다. 본 논문에서는 비선형 모형에 적합한 의사결정나무 모형을 이용한 bumping 방법론을 이용한 변수 선택방법을 제시한다. 본 연구에서는 프리드만(1984), 장영재(2008), 기타 모형에 대하여 데이터를 형성하고 의사결정나무와 bumping 방법을 통해 노이즈 변수를 제거하고 모형변수가 선택됨을 시뮬레이션을 통해 확인한다. 또한, 독일 신용 데이터를 bumping을 이용하여 몇 개의 변수를 선택하고 선택된 변수를 이용하여 모형에 적합시켜 오분류율을 확인한 결과 선택된 변수만으로도 모든 변수를 이용하여 모형에 적합시켰을 때와 결과가 비슷함을 알 수 있다.
Description
1. 서론 1 2. 연구배경 2 2.1 상관분석 2 2.2 회귀분석 2 2.3 의사결정나무 3 2.4 bagging 4 2.5 bumping 6 3. 시뮬레이션을 통한 변수 선택 결과 비교 9 3.1 프리드만의 모형 9 3.2 장영재의 모형 13 3.3 기타 모형 16 4. 독일 신용 자료 분석 20 4.1 데이터 설명 20 4.2 주변수 선택 21 4.3 모형 적합 및 결과 비교 22 5. 결론 25 참고문헌 26
URI
http://dspace.inha.ac.kr/handle/10505/22936
Appears in Collections:
College of Natural Science(자연과학대학) > Statistics (통계학) > Theses(통계학 석박사 학위논문)
Files in This Item:
23992.pdfDownload

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse