본문 바로가기
데이터분석

데이터 분석이란

by ADELA_J 2023. 4. 17.

* 데이터 분석 = 올바른 의사 결정을 돕기 위한 통찰insight 를 제공하는데 초점

   데이터 과학 = 한 걸음 더 나아가 문제 해결을 위한 최선의 솔루션 solution을 만드는데 초점

특징 데이터분석 데이터과학
범주 비교적 소규모 대규모
목표 의사 결정을 돕기 위한 통찰을 제공하는 일 문제 해결을 위해 최선의 솔루션을 만드는 일
주요 기술 컴퓨터 과학, 통계학, 시각화 등 컴퓨터 과학, 통계학, 머신러닝, 인공지능 등
빅데이터 사용 사용

 * 데이터 분석 : (넓은 의미의 데이터 분석)데이터수집 / 처리 / 정제 / 모델링 

                         (좁은 의미의 데이터 분석)기술통계 / 탐색적 데이터 분석 / 가설검정

 

 

 * 파이썬 필수 패키지

  1. 넘파이 NumPy

    - numerical Python의 줄임말로 고성능 과학 계산과 다차원 배열array을 위한 파이썬 패키지

    - 대부분 데이터를 다룰때 넘파이 배열을 사용. 다른 패키지를 사용하는데 큰 도움을 받을 수 있음.

    - 여기서 쓰는건 대부분 배열로 되어있음. 

        ▶ 자세한 내용은 링크        https://dev-adela.tistory.com/43

2. 판다스 pandas

    - 데이터 분석을 위한 전문 패키지

    - 넘파이와 다르게 숫자와 문자를 섞어서 표 형태로 저장가능한 데이터프레임DataFrame을 사용함

  3. 맷플롯립 matplotlib

    - 데이터 시각화를 위한 기본 패키지

    - 정적/동적인 그래프 및 고품질의 다양한 그래프를 제공

    - 다른 과학 패키지와 호환성이 높음. 그외 사본seaborn, 보케bokeh 같은 패키지도 많이 사용

  4. 사이파이 SciPy

    - 넘파이를 기반으로 구축된 수학/과학 계산 전문 패키지

  5. 사이킷런 scikit-learn

    - 독보적인 머신러닝 패키지, 넘파이와 사이파이에 크게 의존

 

'데이터분석' 카테고리의 다른 글

API  (1) 2023.04.18
XML  (0) 2023.04.18
JSON  (0) 2023.04.18
API  (0) 2023.04.18
데이터 분석의 시작- CSV파일 파이썬으로 출력하기  (0) 2023.04.17