프리한 데이터 공방

고정 헤더 영역

글 제목

메뉴 레이어

프리한 데이터 공방

메뉴 리스트

  • 홈
  • 태그
  • 방명록
  • 데이터 분석 정보글 (10)
    • 블로그 소개글 (1)
      • 데이터 분석 Tool (0)
    • Excel (0)
      • Excel 단축키 (0)
      • Excel 함수 (0)
      • Excel 전처리 (0)
    • Python (4)
      • Python Basic (0)
      • Python 판다스 (3)
      • Python 웹크롤링 (1)
    • Google Analytics (1)
      • SNS 광고 (0)
      • 매체별 광고 (0)
      • 검색 광고 (0)
    • SEO 검색엔진 최적화 (4)
홈태그방명록
  • 블로그 소개글 1
    • 데이터 분석 Tool 0
  • Excel 0
    • Excel 단축키 0
    • Excel 함수 0
    • Excel 전처리 0
  • Python 4
    • Python Basic 0
    • Python 판다스 3
    • Python 웹크롤링 1
  • Google Analytics 1
    • SNS 광고 0
    • 매체별 광고 0
    • 검색 광고 0
  • SEO 검색엔진 최적화 4

검색 레이어

프리한 데이터 공방

검색 영역

컨텐츠 검색

Python

  • CASE STUDY 1: 신용카드 사용자 정보 그래프 시각화하기②

    2021.05.25 by 민도리

  • CASE STUDY 1: 신용카드 사용자 정보 전 처리, 나이, 연령대 칼럼 생성①

    2021.05.25 by 민도리

  • CASE STUDY 1: 신용카드 사용자 정보 데이터로 인사이트 도출하기

    2021.05.22 by 민도리

  • 웹 HTML 언어구조

    2021.05.22 by 민도리

CASE STUDY 1: 신용카드 사용자 정보 그래프 시각화하기②

matplotlib 실행하기 우선 그래프 생성을 위해 운영체제별 폰트매니저를 지정하고 주요 칼럼별로 데이터 시각화를 진행하겠습니다. 1. 신용카드 사용자 나이 분포도 age칼럼의 빈도수(중복갯수)대로 .plot을 사용해 그래프화하였습니다. .reset_index(drop=True)는 인덱스 재설정, 기존 인덱스 제거하는 의미. 도출된 그래프에 정보를 명확히 식별하기 어려워 히스토그램을 다시 활용해 보았습니다. 어느 연령대에 사용자가 많은지 확인이 더 용이해졌지만, 그래프의 구분 선이 명확하지 않아 한번 더 처리해주었습니다. 구체적인 범위설정, x바, y바, 제목까지 붙여보았을 때, 사용자 수가 가장 많은 주 사용자는 30~40대라는 것을 알 수 있습니다. 2. 신용카드 사용자의 직업 분포도 사용자 직업의..

Python/Python 판다스 2021. 5. 25. 18:22

CASE STUDY 1: 신용카드 사용자 정보 전 처리, 나이, 연령대 칼럼 생성①

이번에는 데이터콘 사이트에서 추출한 신용카드 사용자 정보를 통해서 데이터 시각화 및 데이터 분석 케이스 스터디를 진행해보겠습니다. 기존의 칼럼 갯수가 많아서 불필요한 칼럼명 정보를 삭제한 간소화된 버전으로 케이스 스터디를 진행해보았습니다. (사실 칼럼명 삭제 안해도 크게 상관없긴 함) Pandas로 CSV 파일 불러오기 우선 분석 대상인 csv 파일을 pandas를 통해 불러옵니다. pd.read_excel() 변수 sample을 지정하여 head()를 통해 칼럼명을 확인합니다. 이 때, pd.read_excel('파일경로', header=시작 행, skipfooter=생략할 행, usecols='A:Z') 등을 통해 미리 생략할 행이나 열을 가공처리 할 수도 있습니다. .info() sample.inf..

Python/Python 판다스 2021. 5. 25. 02:07

CASE STUDY 1: 신용카드 사용자 정보 데이터로 인사이트 도출하기

그동안 배웠던 데이터 분석 실무를 적용하기 위하여 데이터 파일이 필요해서 '데이콘'이라는 사이트에서 데이터 정보를 다운받아 사용하였습니다. 기존 데이터 관련한 경진대회 사이트로, 다양한 대회를 진행하고 있었고 그 중 실제 적용할 수 있는 주제가 무엇일까 고민하다가 신용카드 사용이라는 구매와 관련된 내용을 주제로 다뤄보면 좋을 것 같아서 자료를 다운로드 받아 진행하였습니다. 데이콘: https://dacon.io/ 데이터사이언티스트 AI 컴피티션 3만 AI팀이 협업하는 인공지능 플랫폼 dacon.io 신용카드 사용자 연체 예측 AI 경진대회 주제 : 신용카드 사용자 데이터를 보고 사용자의 대금 연체 정도를 예측하는 알고리즘 개발 개인정보 데이터를 활용해 신용점수 도출, 신용점수-> 향후 채무 불이행, 신용..

Python/Python 판다스 2021. 5. 22. 23:27

웹 HTML 언어구조

웹의 기본, HTML 코딩이나 웹 언어를 배우려면 가장 기본이 되는 언어가 바로 HTML이라고 할 수 있습니다. 웹크롤링 웹크롤링을 구현 했을때 필수적으로 마주하게 되는 언어이기에 기초적인 지식이나 구조를 간단히 배우면 웹에서의 정보를 통해 데이터 분석을 할 때 보다 쉽게 이해할 수 있습니다. 실제로 코딩 입문을 하며, 파이썬을 통한 웹크롤링을 했을 때 html에 대해서 기본적인 지식이 없어서 난감했었던 경우도 있었습니다. 사실상 기본적인 구조만 알아두면 웹 사이트에서 원하는 정보의 위치가 어느 태그에 있는지 보다 쉽게 알 수 있습니다. 참고할 만한 강의 저는 동영상 강의는 유튜브에서 ‘생활코딩’의 강의를 참고하여 간단히 구조를 익혔고 코딩 입문자에 웹크롤링을 구현하고자 한다면 추천드립니다. 재생목록에서..

Python/Python 웹크롤링 2021. 5. 22. 23:09

추가 정보

인기글

최신글

페이징

이전
1
다음
TISTORY
프리한 데이터 공방 © Magazine Lab
페이스북 트위터 인스타그램 유투브 메일

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.