1. 통계 수치 계산
- mean, min, max, std 메서드를 호출해 통계 수치를 계산할 때 열을 추출하여 메서드 사용 가능
- 열이름 [ 인덱스] => 인덱스를 True 나 False으로 반환값 받아서 비교연산자를 사용해서 원하는 값만 추출 가능..!
>> 리스트 형태로 시리즈에 전달하면 True인 인덱스의 데이터만 추출 가능 ( 이것이 바로 Boolean 추출)
**** 시리즈는 벡터의 한 종류
** 벡터 : 시리즈처럼 여러 개의 값을 가진 데이터
** 스칼라 : 단순 크기를 나타내는 데이터
2. 브로드캐스팅, Broadcasting
- 모든 데이터에 대해 한 번에 연산하는 것
- 사칙연산을 수행하거나 스칼라를 연산하여 결과값을 가져올 수도 있음.
- 시리즈 + 시리즈도 되지만 크기(길이)가 같아야함. 아니면 같은 인덱스의 값만 계산함.
▲ [1, 100]은 2개인 시리즈 ages는 8개인 시리즈이기 때문에 위에 2개만 계산이 되고 나머지는 누락값(NaN)으로 처리됨
* sort_index(ascending=False) > 인덱순 역순으로 데이터 정렬!
▲인덱스 순서대로 + 역순 =/= 순서대로+순서대로 ????????
> 두 개 값이 다를 줄 알겠지만 같은 인덱스끼리 연산하기 때문에 정렬은 정렬일 뿐
연산하는 값은 똑같다!!!!!!!!!!
※ 벡터와 벡터의 연산은 일치하는 인덱스 값끼리 수행한다!!!😬
- 데이터 프레임에서도 가능하다.
▼ 하지만 곱셈만 된다! : 정수데이터는 2를 곱한 숫자 / 문자열 데이터는 2배로 늘어남.
'데이터분석 > Pandas&Numpy' 카테고리의 다른 글
pandas 시리즈 및 데이터프레임 저장 및 불러오기 (0) | 2023.06.18 |
---|---|
Pandas 판다스 데이터 처리하기 (0) | 2023.06.14 |
pandas Series, DataFrame 만들기 (0) | 2023.06.13 |
pandas 판다스 기초적인 통계 계산 (1) | 2023.06.13 |
Pandas 판다스 데이터 추출하기 (head, loc 등 간단 기초) (0) | 2023.06.13 |