본문 바로가기
카테고리 없음

데이터 분석 도전하기 - 4

by 노아론 2018. 12. 26.

Pandas Grouping

기준에 따른 여러 그룹으로 데이터 분할(splitting)

각 그룹에 독립적으로 함수 적용(applying)

결과물들을 하나의 데이터 구조로 결합(combining)

0 foo one -0.759985 -0.830048
1 bar one -0.361017 1.040381
2 foo two 0.927589 -0.976534
3 bar three -0.255237 -1.149321
4 foo two 0.535983 1.545994
5 bar two -0.865925 0.306166
6 foo one -0.995362 -1.492863
7 foo three 1.256075 -0.243938

A를 기준으로 합을 구해본다.

df.groupby('A').sum()

아래와 같은 결과를 얻을 수 있다.

A C D
bar -1.482179 0.197225
foo 0.964299 -1.997389

A의 값에 따른 C의 값과 D의 값의 합을 구할 수 있다.

SQL의 group by 와 같은 역할을 한다

Pandas의 기능 중 몇가지의 rows만 보여주는 함수가 있다.

pandas.DataFrame.tail or pandas.DataFrame.head이며, 마지막 N개의 행만 출력한다.

pd.tail(5) 와 같이 사용가능하다.


댓글