프리한 데이터 공방

고정 헤더 영역

글 제목

메뉴 레이어

프리한 데이터 공방

메뉴 리스트

  • 홈
  • 태그
  • 방명록
  • 데이터 분석 정보글 (27)
    • 블로그 소개글 (1)
      • 데이터 분석 Tool (0)
    • Excel (0)
      • Excel 단축키 (0)
      • Excel 함수 (0)
      • Excel 전처리 (0)
    • Python (4)
      • Python Basic (0)
      • Python 판다스 (3)
      • Python 웹크롤링 (1)
    • Google Analytics (1)
      • SNS 광고 (0)
      • 매체별 광고 (0)
      • 검색 광고 (0)
    • SEO 검색엔진 최적화 (4)
    • SQL (6)
      • SQL 기본 개념 (6)

검색 레이어

프리한 데이터 공방

검색 영역

컨텐츠 검색

전체 글

  • 데이터 분석 프로젝트 스터디

    2025.11.19 by 민도리

  • 파이썬 데이터 전처리 & 시각화

    2025.11.05 by 민도리

  • 엑셀보다 쉽고 빠른 SQL 개념 정리

    2025.11.04 by 민도리

  • 파이썬 문법 기초 개념 정리

    2025.11.03 by 민도리

  • 데이터분석: 파이썬 기초

    2025.10.31 by 민도리

  • ADSP 개인 스터디

    2025.10.30 by 민도리

  • 2025-10-29 SQL 실습 문제 풀이

    2025.10.29 by 민도리

  • SQL 문제 풀이 노트

    2025.10.28 by 민도리

데이터 분석 프로젝트 스터디

1. 문제 정의 / 비즈니스 목표 (Define Goal)목표 및 결과물 설정: 해결할 핵심 문제(이슈, 의사결정 지원 등) 검증할 만한 내용 및 최종적으로 도출할 산출물의 형태를 확인2. 데이터 수집 (Gather Data)자료 확보: 문제 해결에 필요한 데이터를 식별, 제공된 자료 외에 외부 데이터를 API, 크롤링 등으로 확보.3. EDA / 데이터 전처리 (Clean & Transform) 정제 작업: 결측치, 이상치, 중복값 등을 처리, 데이터의 형식을 통일, 필요한 경우 파생 변수를 생성합니다.가장 많은 시간 소요4. 데이터 분석 / 시각화 (Analyze & Explore)패턴 탐색: EDA를 통해 데이터의 특징, 트렌드, 관계, 분포 등 확인변수 관계를 확인하고 시각화를 통해 패턴을 설명합..

카테고리 없음 2025. 11. 19. 12:56

파이썬 데이터 전처리 & 시각화

I. 분석가 유형 및 목표 BA (비즈니스 분석가)비즈니스 문제 이해 → 요구사항 정의 → 의사결정 지원프로세스 개선, 비즈니스 모델 분석, 요구사항 관리프로덕트 분석가 (Product Analyst)제품 성과 평가/개선, 사용자 행동 분석, A/B Testing.사용자 행동, 제품 성능 관련 데이터 분석, A/B 테스트, 사용자 경로 분석데이터 분석가 (Data Analyst)주로 정형 데이터 분석, 데이터 추출/정제/보고서/시각화 생성SQL/Excel 활용, 보고서/시각화 생성 등 기술 활용 업무 수행BI 분석가비즈니스 인텔리전스 플랫폼 도구 사용, 시각화 보고서 작성내부 데이터 시각화, BI 도구 사용, Dashboard (대시보드) 구축/작성, 의사결정 정보 제공.데이터 사이언티스트 (Data S..

카테고리 없음 2025. 11. 5. 22:41

엑셀보다 쉽고 빠른 SQL 개념 정리

Ⅰ. 기본 구조 및 데이터 조회테이블 (Table): 엑셀 시트 역할. 데이터가 저장되는 기본 단위.컬럼 (Column): 열, 목록명. 테이블의 속성 (Attribute).SELECT / FROM 문:SELECT 컬럼1, 컬럼2 FROM 테이블_이름; SELECT 조회할 데이터 (컬럼 리스트).FROM 가져올 테이블 지정.쿼리 실행: 보통 Ctrl + Enter (환경에 따라 다름).AS (Alias): 컬럼/테이블에 별칭 부여. AS는 생략 가능.SELECT 이름 AS 고객명 FROM 고객;Ⅱ. 데이터 필터링 및 논리 연산WHERE: 특정 조건으로 행(Row) 필터링. [보충] 문자열은 작은 따옴표(' ')로 감싸야 함.필터링 유용한 표현:비교 연산: >, BETWEEN A AND B: A와 B 사..

카테고리 없음 2025. 11. 4. 21:06

파이썬 문법 기초 개념 정리

Ⅰ. 기본 문법 및 원시 자료형 (Primitive Data Types)변수 선언: 변수_이름 = 값. print() 함수로 값 출력.1. 숫자형 (Numeric)사칙연산: 더하기(+), 빼기(-), 곱하기(*), 나누기(/).기타 연산: 몫(//), 나머지(%), 거듭제곱(**).10 // 3 → 310 % 3 → 12 ** 3 → 82. 불리언형 (Boolean, bool)값: 참 (True) / 거짓 (False). 주의: T와 F는 대문자.논리 연산: 비교 연산자 (>, 3. 문자열 (String, str)표현: 작은 따옴표 또는 큰 따옴표 사용.연산:덧셈 (+): 문자 이어붙이기곱셉(*n번): 문자 n번 반복주의: 같은 데이터 타입 간 연산만 가능."A" + "B" → "AB"5 + "개" →..

카테고리 없음 2025. 11. 3. 21:19

데이터분석: 파이썬 기초

1. 학습 내용 & 활용 분야파이썬 설치, 출력/변수, 리스트(List), 튜플(Tuple), 딕셔너리(Dictionary), 조건문(Conditional), 반복문(Loop), 함수(Function), 클래스(Class), 유용한 문법.데이터 분석 핵심: NumPy, Pandas 라이브러리 사용법.NumPy : 빠르고 효율적인 다차원 배열 처리 (속도)Pandas : 데이터프레임(DataFrame) 및 시리즈(Series) 자료구조 제공 (excel, csv 등 파일 처리)활용 분야: 데이터 전처리, 계산, 관리, 시각화, AI 모델링(일련의 과정으로 정리된 데이터를 머신러닝, 딥러닝에 구축 및 학습)2. 출력문 & 변수와 데이터 타입 (Variables & Data Types)출력문: print() ..

카테고리 없음 2025. 10. 31. 21:06

ADSP 개인 스터디

Ⅰ. 데이터 이해 및 분석 기획1. 데이터의 기본 이해개념/본질: 데이터는 가공되지 않은 사실 또는 측정값유형:정형 (Structured): 구조화된 형식 (예: RDB 테이블).반정형 (Semi-Structured): 구조의 유연성 (예: JSON, XML).비정형 (Unstructured): 구조가 없는 형태 (예: 텍스트, 이미지, 영상).2. 지식 변환 (SECI Model)암묵지 (Tacit Knowledge): 개인화되어 내재된 지식 (경험, 노하우).형식지 (Explicit Knowledge): 문서, 매뉴얼 등 외부로 표출된 지식.SECI 모델: 암묵지와 형식지 간의 변환 4단계.공동화 (Socialization): 암묵지 → 암묵지 (경험 공유).표출화 (Externalization): ..

카테고리 없음 2025. 10. 30. 21:03

2025-10-29 SQL 실습 문제 풀이

SQL 이론 SELECT/FROM 전체칼럼을 실행하는 표시 *(아스테리크) FROM DB명.테이블명; - 반드시 속한 DB명과 함께 테이블을 작성해야 함 - 쿼리와 함께 끝에 세미콜론(;)을 붙여줘야 함 - 다수의 SQL문 여러개의 쿼리를 나눠주는 역할 (일부 쿼리만 열고 싶은 경우: 1개의 요청당 1개의 세미콜론) - 실행하고 싶은 곳에 커서를 둔 채로 ctrl+Enter를 클릭하면 해당 쿼리문만 실행됨 DISTINCT문 - 칼럼 내에 속한 값을 중복없이 불러오기 - SELECT만 사용 가능 - COUNT (DISTINCT 컬럼명) AS 새칼럼명 WHERE절 - 필터링할 조건이 있을 경우 CASE..WHEN 내가 만든 기준에 따라 칼럼을 만들고 싶을 때 - 칼럼은 SELECT에서만 변경할 수 있으므..

카테고리 없음 2025. 10. 29. 21:07

SQL 문제 풀이 노트

집계 함수의 활용월별 서버별 게임 유저 수를 중복 값 없이 추출할때(월은 first_login_date에서 yyyy-mm 형태로 추출할 것) 정답SELECT date_format(first_login_date, '%Y-%m') AS m, serverno, COUNT(distinct game_account_id) AS usercntFROM basic.usersGROUP BY date_format(first_login_date, '%Y-%m'), serverno; 내가 작성한 답변select m, serverno,count(distinct game_account_id) as usercntfrom (select date_format(first_login_date, '%Y-%m') a..

SQL/SQL 기본 개념 2025. 10. 28. 20:23

추가 정보

인기글

최신글

페이징

이전
1 2 3 4
다음
TISTORY
프리한 데이터 공방 © Magazine Lab
페이스북 트위터 인스타그램 유투브 메일

티스토리툴바