arrange()함수에 대해서 알아보자. arrange()함수의 arrange 자체의 의미는 배열하다 라는 의미가 있다. arrange()함수를 이용해서 오름차순 혹은 내림차순으로 정렬할 수 있다. arrange()함수의 매개변수는 오름차순 및 내림차순할 변수의 이름을 넣어주면 된다. 당연히 앞에서 보았던 filter()와 select()함수와 같이 데이터를 전처리하기 위한 함수이므로 dplyr패키지 안에 내장되어 있는 함수이다. 우선 arrange()함수를 사용하기 위해서 dplyr패키지를 호출하자. 그 후 예시 데이터 프레임을 불러와서 출력해 보자.
만약 여기서 내가 수학점수(math)에 대한 값을 오른차순으로 정렬하고 싶다고 하자. 오름차순이란 가장 낮은 값부터 시작해서 가장 높은 값까지 나타내는것을 의미한다. 만약 해당 변수 값을 오름차순을 하고싶다면 arrang()함수 안에 변수 math를 넣어주면 된다
다음과 같이 arrange함수로 math변수가 오름차순 되는것을 볼 수 있다. 당연히 앞의 select함수와 동일하게 2개 이상을 오름차순 할 수도 있다.
다음과 같이 class, math변수를 오름차순 하였다고 가정하자 이런 경우에는 class변수를 기준으로 오름차순을 한 후 그 값에서 math변수에 대해 오른차순을 진행한다. 여기서 보면 반별로 수학점수가 오름차순되는것을 볼 수 있다.
반대로 내림차순을 해야한다면 어떻게 해야할까? 우선 내림차순이란 가장 큰값을 시작으로 가장 작은값까지의 출력을 의미한다. 내림차순을 하기 위해서는 오름차순을 할때 사용하였던 arrange()함수에서 desc()를 적용시켜주면 된다. 이번에는 science변수의 값을 내림차순 한다고 하자. 그럼 다음과 같이 코드를 입력해 주면 된다.
arrange()함수 안에 매개변수로 science로 하여 arrange(science)와 같이 코드를 입력해 주었다면 당연히 오름차순이 되어 가장 작은 값부터 작성이 되었을 것이다. 하지만 arrange()함수 안에 desc()를 적용해 주고 desc()의 매개변수로 science를 해주었더니 다음 사진과 같이 내림차순이 되는것을 볼 수 있다. (위의 표본 데이터와 비교해보기)
내림차순 또한 동일하게 두가지 이상의 변수에 대해 내림차순을 할 수 있다. 이번에는 class와 science변수에 대해서 내림차순을 하여보자.
다음과 같이 class변수에 대해서 내림차순을 한 후 science 변수에 대해서 내림차순을 하는것을 볼 수 있다.
다른 형식으로 응용할 수 도 있다. 위의 방법같은 경우에는 class와 science변수 모두 내림차순이 되었다. 하지만 만약 여기서 내가 class변수는 오름차순으로 하되 science변수는 내림차순 처리를 하고싶다고 가정하자. 그런경우는 순서대로 arrange(class,desc(science))식으로 해주면 된다.
해당 코드를 실행해 보면 class에 대한 값은 우선적으로 오름차순 처리가 된다. 그 후 math변수에 대해서는 각 class 값마다 내림차순 되는것을 볼 수 있다.
'DataAnalysis > R' 카테고리의 다른 글
데이터 전처리하기(Data Processing) - mutate() (0) | 2019.03.03 |
---|---|
arrange()함수를 이용한 분석 예제 (0) | 2019.03.02 |
데이터 전처리하기(Data Processing) - select() (0) | 2019.02.23 |
R에서 사용하는 연산자들 (0) | 2019.02.23 |
데이터 전처리하기(Data - Processing) - filter() (1) | 2019.02.23 |