본문 바로가기
데이터분석/Pandas&Numpy

Pandas 판다스 시리즈/데이터프레임 다루기 - 불린,브로드캐스팅

by ADELA_J 2023. 6. 14.

1. 통계 수치 계산

    - mean, min, max, std 메서드를 호출해 통계 수치를 계산할 때 열을 추출하여 메서드 사용 가능

  - 열이름 [ 인덱스]  => 인덱스를 True 나 False으로 반환값 받아서 비교연산자를 사용해서 원하는 값만 추출 가능..!

   >> 리스트 형태로 시리즈에 전달하면 True인 인덱스의 데이터만 추출 가능 ( 이것이 바로 Boolean 추출)

 

**** 시리즈는 벡터의 한 종류

** 벡터 : 시리즈처럼 여러 개의 값을 가진 데이터

** 스칼라 : 단순 크기를 나타내는 데이터

2. 브로드캐스팅, Broadcasting

  - 모든 데이터에 대해 한 번에 연산하는 것 

  - 사칙연산을 수행하거나 스칼라를 연산하여 결과값을 가져올 수도 있음.

  - 시리즈 + 시리즈도 되지만 크기(길이)가 같아야함. 아니면 같은 인덱스의 값만 계산함.

▲  [1, 100]은 2개인 시리즈 ages는 8개인 시리즈이기 때문에 위에 2개만 계산이 되고 나머지는 누락값(NaN)으로 처리됨

 

* sort_index(ascending=False) > 인덱순 역순으로 데이터 정렬!

▲인덱스 순서대로 + 역순 =/= 순서대로+순서대로 ????????

   > 두 개 값이 다를 줄 알겠지만 같은 인덱스끼리 연산하기 때문에 정렬은 정렬일 뿐

     연산하는 값은 똑같다!!!!!!!!!! 

       ※ 벡터와 벡터의 연산은 일치하는 인덱스 값끼리 수행한다!!!😬

  - 데이터 프레임에서도 가능하다.

   ▼ 하지만 곱셈만 된다! : 정수데이터는 2를 곱한 숫자 / 문자열 데이터는 2배로 늘어남.