본문 바로가기

전체 글14

범주형+연속형 변수, boxplot & violin 함수 활용 geom_boxplot()과 geom_violin()은 둘 다 ggplot2 패키지에서 제공되는 함수로, 연속형 변수의 분포를 시각화하는 데 사용됩니다. 각각의 함수가 어떻게 동작하고 어떤 특징을 가지고 있는지 살펴보겠습니다. geom_boxplot() 개요 geom_boxplot() 함수는 상자 수염 그림(Box-and-Whisker Plot)을 통해 연속형 변수 데이터의 중앙값, 사분위수(1사분위수, 3사분위수) 및 이상치(outlier)를 시각적으로 보여줍니다. 이런 특성을 통해 주로 데이터의 중심 경향과 데이터의 분포를 쉽게 파악할 수 있습니다. 예를 위해 ggplot2 패키지에 포함되어 있는 tips 데이터셋을 활용하도록 하겠습니다. tips 데이터셋 중 범주형 변수에 해당하는 day(요일)와 .. 2023. 12. 30.
geom_point 함수, 연속형 변수 시각화 geom_point() 개요 geom_point() 함수는 R 프로그래밍 언어의 ggplot2 패키지에서 사용되는 함수로, 산점도(Scatter plot)를 생성하는 데에 활용됩니다. 이 함수는 ggplot2 패키지의 일부이며, 데이터 시각화 작업을 위해 사용되는 강력한 도구 중 하나입니다. geom_point() 함수는 ggplot2의 그래프를 구성하는 레이어 중 하나로, 데이터셋의 각 관측치를 산점도의 점으로 나타냅니다. 각 점은 데이터에서 한 개의 관측치를 나타내며, x축과 y축 값에 따라 해당 위치에 표시됩니다. 이를 통해 변수 간의 관계나 분포를 시각적으로 파악할 수 있습니다. 예를 들어, 다음은 geom_point() 함수를 사용하여 두 변수 x와 y 간의 관계를 나타내는 간단한 산점도를 생성.. 2023. 12. 29.