loc과 iloc 속성을 활용하여 보자. 우선 추출할 데이터의 행, 열 지정하는 법부터 알아보자. 행과 열 지정은 행, 열 순서로 지정을 해준다. 이를 코드로 작성하면 (데이터 프레임).loc(혹은 iloc)[[행],[열]] 이 되는것이다. 행과 열 지정하는 여러 경우를 살펴보자
1 . 슬라이싱 구문법
여기서 행 부분에 ':'기호를 작성해 주었는데 이를 해석해 보면 '모든 행 데이터에서' 라고 해석하면 된다. 첫번쨰 사진은 인덱스를 이용하는 loc속성을 사용하였기에 열 지정값에 열의 이름 그대로인 문자열을 작성해 주었다. 반면 두번째 사진에서는 iloc을 이용하였기에 열의 번호(순서에 따른)가 저장된 리스트를 넣어준 것이다. 여기서 반대로 만약 loc속성의 열 지정 부분에 열의 번호가 저장된 리스트를 넣어주게 되면 오류가 나온다.
해당 코드를 해석해보면 모든 행 데이터와 0번째부터 2번째 위치에 위치한 데이터까지의 열데이터를 출력하겠다는 의미이다.
해당 코드를 해석해보면 모든 행 데이터와 0번째 부터 짝수번째 순서에 위치한 열 데이터의 범위 내에 위치한 데이터를 출력하겠다는 의미이다.
2 . Range메소드
인덱스를 사용하는 loc에서는 해당이 안된다. iloc은 데이터의 순서를 따르기에 range함수를 이용하여 추출이 가능하다.(range()함수에 대한것은 따로 설명하지 않겠다.)
다음 코드를 해석하면 모든 행 데이터와, range(6)즉 0번째 데이터 부터 5번째 데이터까지의 열 데이터를 출력하겠다는 의미이다.
해당 코드에 대한 해석인 모든 행 데이터와 2번째 데이터 부터 5번째 데이터까지의 열 데이터를 출력하겠다는 의미가 된다.
해석해 보면 모든 행 데이터와 0번부터 5번째 까지의 데이터중 0부터 짝수번째(0부터 +2가되므로 0,2,4 번째 데이터를 의미하게 되는것이다)에 위치한 데이터를 추출하겠다는의미가 된다.
3 . loc, iloc속성을 다양하게 활용해 보기
1)
2)
3)
4)
'DataAnalysis > Python Pandas' 카테고리의 다른 글
그래프 그리기 (0) | 2019.03.07 |
---|---|
기초 통계 계산 with Pandas (0) | 2019.02.26 |
데이터 추출하기(Data Extraction) (0) | 2019.02.25 |
판다스 & 파이썬 자료형 비교 (0) | 2019.02.25 |
판다스 시작하기 (0) | 2019.02.25 |