DataAnalysis/R

데이터 전처리 Analysis Challenge

Hoplin 2019. 3. 4. 10:24
반응형

문제 및 조건


사용 데이터  : ggplot2패키지의 midwest데이터


1 . pop adults는 해당 지역의 성인인구, poptotal은 전체 인구를 나타낸다. midwest데이터에 전체 인구 대비 미성년 인구 백분율 변수를 추가하시오


2 . 미성년 인구 백분율이 가장 높은 상위 5개 county의 미성년 인구 백분율을 출력하시오


3 . 분류표의 기준에 따라 미성년 비율 등급 변수를 추가하고 각 등급에 몇 개의 지역이 존재하는지 알아보시오


 분류

기준 

large 

40%이상 

middle 

30~40%미만 

small 

30%미만 



4 . popasian은 해당 지역의 아시아인 인구를 나타낸다. 전체 인구 대비 아시아인 인구 백분율 변수를 추가하고 하위 10개 지역의 state county아시아인 인구 백분율을 출력하시오




반응형