본문 바로가기

Tips2

geom_histogram() 살펴보기 geom_histogram() 개요 geom_histogram()은 ggplot2 패키지에서 제공되는 함수 중 하나로, 연속형 변수의 분포를 히스토그램으로 시각화하는 데 사용됩니다. 이 함수는 데이터를 일정한 간격의 구간(bins)으로 나누고, 각 구간에 속하는 데이터의 빈도를 막대로 나타냅니다. 이런 점에서 특정 범주별로 데이터의 빈도를 막대로 나타내는 geom_bar() 함수와 구분됩니다. 아래 코드를 통해 간단히 geom_histogram()을 사용하는 방법을 살펴보겠습니다. 이번 예시에서는 ggplot2 패키지에 포함되어 있는 tips 데이터셋에서 tip 변수를 이용하였습니다. tips 데이터셋은 음식점에서의 손님들이 낸 팁(tip)에 관한 정보를 포함하고 있으며, 이중 tip 변수는 "손님이 낸.. 2023. 12. 30.
범주형+연속형 변수, boxplot & violin 함수 활용 geom_boxplot()과 geom_violin()은 둘 다 ggplot2 패키지에서 제공되는 함수로, 연속형 변수의 분포를 시각화하는 데 사용됩니다. 각각의 함수가 어떻게 동작하고 어떤 특징을 가지고 있는지 살펴보겠습니다. geom_boxplot() 개요 geom_boxplot() 함수는 상자 수염 그림(Box-and-Whisker Plot)을 통해 연속형 변수 데이터의 중앙값, 사분위수(1사분위수, 3사분위수) 및 이상치(outlier)를 시각적으로 보여줍니다. 이런 특성을 통해 주로 데이터의 중심 경향과 데이터의 분포를 쉽게 파악할 수 있습니다. 예를 위해 ggplot2 패키지에 포함되어 있는 tips 데이터셋을 활용하도록 하겠습니다. tips 데이터셋 중 범주형 변수에 해당하는 day(요일)와 .. 2023. 12. 30.