그동안 배웠던 데이터 분석 실무를 적용하기 위하여 데이터 파일이 필요해서 '데이콘'이라는 사이트에서 데이터 정보를 다운받아 사용하였습니다. 기존 데이터 관련한 경진대회 사이트로, 다양한 대회를 진행하고 있었고 그 중 실제 적용할 수 있는 주제가 무엇일까 고민하다가 신용카드 사용이라는 구매와 관련된 내용을 주제로 다뤄보면 좋을 것 같아서 자료를 다운로드 받아 진행하였습니다. 데이콘: https://dacon.io/
데이터사이언티스트 AI 컴피티션
3만 AI팀이 협업하는 인공지능 플랫폼
dacon.io
신용카드 사용자 연체 예측 AI 경진대회 주제 : 신용카드 사용자 데이터를 보고 사용자의 대금 연체 정도를 예측하는 알고리즘 개발 개인정보 데이터를 활용해 신용점수 도출, 신용점수-> 향후 채무 불이행, 신용카드 대급 연체 가능성 예측https://dacon.io/competitions/official/235713/overview/description
신용카드 사용자 연체 예측 AI 경진대회
출처 : DACON - Data Science Competition
dacon.io
데이터 칼럼명
index
gender: 성별
car: 차량 소유 여부
reality: 부동산 소유 여부
child_num: 자녀 수
income_total: 연간 소득
income_type: 소득 분류 ['Commercial associate', 'Working', 'State servant', 'Pensioner', 'Student']
edu_type: 교육 수준 ['Higher education' ,'Secondary / secondary special', 'Incomplete higher', 'Lower secondary', 'Academic degree']
family_type: 결혼 여부['Married', 'Civil marriage', 'Separated', 'Single / not married', 'Widow']
house_type: 생활 방식['Municipal apartment', 'House / apartment', 'With parents', 'Co-op apartment', 'Rented apartment', 'Office apartment']
DAYS_BIRTH: 출생일 데이터 수집 당시 (0)부터 역으로 셈, 즉, -1은 데이터 수집일 하루 전에 태어났음을 의미
DAYS_EMPLOYED: 업무 시작일 데이터 수집 당시 (0)부터 역으로 셈, 즉, -1은 데이터 수집일 하루 전부터 일을 시작함을 의미 양수 값은 고용되지 않은 상태를 의미함
FLAG_MOBIL: 핸드폰 소유 여부
work_phone: 업무용 전화 소유 여부
phone: 전화 소유 여부
email: 이메일 소유 여부
occyp_type: 직업 유형
family_size: 가족 규모
begin_month: 신용카드 발급 월 데이터 수집 당시 (0)부터 역으로 셈, 즉, -1은 데이터 수집일 한 달 전에 신용카드를 발급함을 의미
credit: 사용자의 신용카드 대금 연체를 기준으로 한 신용도 낮을 수록 높은 신용의 신용카드 사용자를 의미함
댓글 영역