상세 컨텐츠

본문 제목

CASE STUDY 1: 신용카드 사용자 정보 데이터로 인사이트 도출하기

Python/Python 판다스

by 민도리 2021. 5. 22. 23:27

본문


그동안 배웠던 데이터 분석 실무를 적용하기 위하여
데이터 파일이 필요해서 '데이콘'이라는 사이트에서 데이터 정보를 다운받아 사용하였습니다.
기존 데이터 관련한 경진대회 사이트로, 다양한 대회를 진행하고 있었고 그 중 실제 적용할 수 있는 주제가 무엇일까
고민하다가 신용카드 사용이라는 구매와 관련된 내용을 주제로 다뤄보면 좋을 것 같아서 자료를 다운로드 받아 진행하였습니다.

데이콘: https://dacon.io/

데이터사이언티스트 AI 컴피티션

3만 AI팀이 협업하는 인공지능 플랫폼

dacon.io

신용카드 사용자 연체 예측 AI 경진대회

주제 : 신용카드 사용자 데이터를 보고 사용자의 대금 연체 정도를 예측하는 알고리즘 개발

개인정보 데이터를 활용해 신용점수 도출, 신용점수-> 향후 채무 불이행, 신용카드 대급 연체 가능성 예측
https://dacon.io/competitions/official/235713/overview/description

신용카드 사용자 연체 예측 AI 경진대회

출처 : DACON - Data Science Competition

dacon.io

데이터 칼럼명

  • index
  • gender: 성별
  • car: 차량 소유 여부
  • reality: 부동산 소유 여부
  • child_num: 자녀 수
  • income_total: 연간 소득
  • income_type: 소득 분류 ['Commercial associate', 'Working', 'State servant', 'Pensioner', 'Student']
  • edu_type: 교육 수준 ['Higher education' ,'Secondary / secondary special', 'Incomplete higher', 'Lower secondary', 'Academic degree']
  • family_type: 결혼 여부['Married', 'Civil marriage', 'Separated', 'Single / not married', 'Widow']
  • house_type: 생활 방식['Municipal apartment', 'House / apartment', 'With parents', 'Co-op apartment', 'Rented apartment', 'Office apartment']
  • DAYS_BIRTH: 출생일 데이터 수집 당시 (0)부터 역으로 셈, 즉, -1은 데이터 수집일 하루 전에 태어났음을 의미
  • DAYS_EMPLOYED: 업무 시작일 데이터 수집 당시 (0)부터 역으로 셈, 즉, -1은 데이터 수집일 하루 전부터 일을 시작함을 의미 양수 값은 고용되지 않은 상태를 의미함
  • FLAG_MOBIL: 핸드폰 소유 여부
  • work_phone: 업무용 전화 소유 여부
  • phone: 전화 소유 여부
  • email: 이메일 소유 여부
  • occyp_type: 직업 유형
  • family_size: 가족 규모
  • begin_month: 신용카드 발급 월 데이터 수집 당시 (0)부터 역으로 셈, 즉, -1은 데이터 수집일 한 달 전에 신용카드를 발급함을 의미
  • credit: 사용자의 신용카드 대금 연체를 기준으로 한 신용도 낮을 수록 높은 신용의 신용카드 사용자를 의미함

관련글 더보기

댓글 영역