DataAnalysis/R
데이터 전처리 Analysis Challenge
Hoplin
2019. 3. 4. 10:24
반응형
문제 및 조건
사용 데이터 : ggplot2패키지의 midwest데이터
1 . pop adults는 해당 지역의 성인인구, poptotal은 전체 인구를 나타낸다. midwest데이터에 전체 인구 대비 미성년 인구 백분율 변수를 추가하시오
2 . 미성년 인구 백분율이 가장 높은 상위 5개 county의 미성년 인구 백분율을 출력하시오
3 . 분류표의 기준에 따라 미성년 비율 등급 변수를 추가하고 각 등급에 몇 개의 지역이 존재하는지 알아보시오
분류 |
기준 |
large |
40%이상 |
middle |
30~40%미만 |
small |
30%미만 |
4 . popasian은 해당 지역의 아시아인 인구를 나타낸다. 전체 인구 대비 아시아인 인구 백분율 변수를 추가하고 하위 10개 지역의 state county아시아인 인구 백분율을 출력하시오
반응형