본문 바로가기

2018/072

[R프로그래밍] R을 이용해 바차트(막대그래프)와 히스토그램(도수분포표) 정복하기 "히스토그램과 바차트의 차이는 무엇인가?", 이 질문에 바로 대답할 수 있으신가요? 히스토그램은 우리말로 하면 도수분포표입니다. 반면, 바차트는 우리말로 막대그래프입니다. 이름만 다를 뿐 그게 그거 아닌가 할 수도 있겠지만 그 쓰임에는 분명한 차이가 있습니다. 히스토그램(이하 도수분포표)은 분포(Distribution)을 표현하는데 사용하는 반면 바차트(이하 막대그래프)는 데이터를 분류(Category)하는데 사용됩니다. 아래 그림을 살펴보시죠. 올해 책을 30권 읽었다고 가정해 보겠습니다. 이 읽은 책에 대한 데이터를 정리하는 방법은 여러가지가 있을 것입니다. 소설, 인문학, 경영서, IT, 예술 등과 같이 장르별로 읽은 책의 권수를 정리 할 수도 있고, 책의 가격대를 비교해 볼 수도 있습니다. 전자는.. 2018. 7. 27.
빈도분석, 중복성제거, CDF를 엑셀로 하기 다수의 Data를 표현할때 쓰기 좋은것이 CDF 이다.CDF를 쉽게 그리기 위해서는 사전에 두 단계를 거쳐야 한다.1) 빈도분석2) 중복성 제거 빈도분석모든 데이터가 1개씩 뿐이라면, 무시해도 되는 단계이다. 하지만 같은 값이 여러개 존재한다면, 빈도분석을 해야 한다.Excel에서 빈도분석을 하는 방법은 다양하나, COUNTIF()함수를 사용하는 방법으로 설명 하겠다. COUNTIF(F:F,F1) = 3 이다. 중복성 제거중복된 값이 존재한다면, 빈도분석을해서 조정해 주어야 누적 빈도수를 구할때 혼동이 되지 않음 1) 빈도분석: A열에서 A1의 빈도를 구함COUNTIF(A:A,A1) 2) 상수값으로 변경: 1번에서 구한 빈도값을 상수값으로 변경함 (중복값 제거를해도 빈도가 변경되지 않도록) 3) 중복 값.. 2018. 7. 27.