pandas aggregation 과 groupby

- DataFrame에서 aggregation 함수 적용은 RDBMS에서의 aggregation 함수 적용과 유사함.

▶ count() , 개수를 세어주는데, Null(NaN)값을 반영하지 않은 결과를 반환한다.

▶ min() , max(), sum(), mean()과 같은 aggregation 함수를 적용하기 위해서 컬럼들을 추출해 적용하면 된다.

<groupby( )>

-햐 RDBMS에서도 중요한 groupby.

- 사용시 파라미터 by에 컬럼을 입력하면 대상 컬럼으로 groupby된다.

▷ 그 후 groupby( )를 호출하면 DataFrameGroupBy라는 형태의 데이터 프레임이 반환된다.

▶ DataFrame에서는 groupby()를 호출해 반환된 결과에 aggregation 함수를 쓸 수 있다!

▶ groupby해서 'Pclass'를 묶고, PassengerId와 Survived의 컬럼 값만 count 했다.

▶여러 개의 aggregation 함수를 쓰고 싶다면 DataFrameGroupBy 객체에서 agg ( ) 메서드를 사용하면 된다..? ~~와우 어메이징~~

agg ( ) 메서드 자세한 내용 ▼

~~아니 람다도 혼합해서 쓴다고...?어메이징...~~

▷ 만약 서로 다른 여러 개의 컬럼을 서로 다른 aggregation 함수를 쓰고 싶다면...? (좀 복잡함)

▶ 딕셔너리 형태로 aggregation이 적용된 컬럼과 함수를 입력하면 됨.

pandas apply와 lambda 만남으로 데이터 가공 (0)	2023.07.07
pandas 결손 데이터를 처리하는 isna, fillna (0)	2023.07.07
pandas DataFrame과 Series의 정렬 (0)	2023.07.06
pandas iloc, loc, boolean Indexing/Slicing (0)	2023.07.06
Kaggle - Titanic 데이터로 연습하는 Pandas 01 (0)	2023.07.05

공부하고있슴다