* 데이터 분석 = 올바른 의사 결정을 돕기 위한 통찰insight 를 제공하는데 초점
데이터 과학 = 한 걸음 더 나아가 문제 해결을 위한 최선의 솔루션 solution을 만드는데 초점
| 특징 | 데이터분석 | 데이터과학 |
| 범주 | 비교적 소규모 | 대규모 |
| 목표 | 의사 결정을 돕기 위한 통찰을 제공하는 일 | 문제 해결을 위해 최선의 솔루션을 만드는 일 |
| 주요 기술 | 컴퓨터 과학, 통계학, 시각화 등 | 컴퓨터 과학, 통계학, 머신러닝, 인공지능 등 |
| 빅데이터 | 사용 | 사용 |
* 데이터 분석 : (넓은 의미의 데이터 분석)데이터수집 / 처리 / 정제 / 모델링
(좁은 의미의 데이터 분석)기술통계 / 탐색적 데이터 분석 / 가설검정

* 파이썬 필수 패키지
1. 넘파이 NumPy
- numerical Python의 줄임말로 고성능 과학 계산과 다차원 배열array을 위한 파이썬 패키지
- 대부분 데이터를 다룰때 넘파이 배열을 사용. 다른 패키지를 사용하는데 큰 도움을 받을 수 있음.
- 여기서 쓰는건 대부분 배열로 되어있음.
▶ 자세한 내용은 링크 https://dev-adela.tistory.com/43
2. 판다스 pandas
- 데이터 분석을 위한 전문 패키지
- 넘파이와 다르게 숫자와 문자를 섞어서 표 형태로 저장가능한 데이터프레임DataFrame을 사용함
3. 맷플롯립 matplotlib
- 데이터 시각화를 위한 기본 패키지
- 정적/동적인 그래프 및 고품질의 다양한 그래프를 제공
- 다른 과학 패키지와 호환성이 높음. 그외 사본seaborn, 보케bokeh 같은 패키지도 많이 사용
4. 사이파이 SciPy
- 넘파이를 기반으로 구축된 수학/과학 계산 전문 패키지
5. 사이킷런 scikit-learn
- 독보적인 머신러닝 패키지, 넘파이와 사이파이에 크게 의존
