본문 바로가기

Data Science11

geom_point() vs. geom_jitter() geom_jitter() 개요 geom_point()에 대한 내용은 아래 포스팅을 참조해주시기 바랍니다! https://jacey312.tistory.com/entry/geompoint-%ED%95%A8%EC%88%98-%EC%97%B0%EC%86%8D%ED%98%95-%EB%B3%80%EC%88%98-%EC%8B%9C%EA%B0%81%ED%99%94 geom_point 함수, 연속형 변수 시각화 geom_point() 개요 geom_point() 함수는 R 프로그래밍 언어의 ggplot2 패키지에서 사용되는 함수로, 산점도(Scatter plot)를 생성하는 데에 활용됩니다. 이 함수는 ggplot2 패키지의 일부이며, 데이터 시각화 작 jacey312.com 이번 포스팅에서는 geom_jitter().. 2023. 12. 30.
대표적인 범주형 plot, geom_bar() geom_bar() 개요 geom_bar() 함수는 ggplot2 패키지에서 사용되는 함수로, 막대 그래프(Bar plot)를 생성하는 데에 사용됩니다. 이 함수는 주로 범주형 변수의 빈도수를 시각화할 때 활용됩니다. TipsDay = data.frame(day = factor(c(“Thur”,”Fri”,”Sat”,”Sun”), levels = c(“Thur”,”Fri”,”Sat”,”Sun”)), count = c(62,19,87,76)) ggplot(TipsDay, aes(day,count))+geom_bar(stat=”identity”) 하나의 bar로 합쳐서 그리고 싶은 경우에는 X 축에 입력되는 변수가 아무것도 없도록 설정해야 합니다. 즉, X축에 입력되는 값이 아무것도 없도록 x=""로 설정해야.. 2023. 12. 30.
산점도와 함께 쓰는 geom_smooth() geom_smooth() 개요 geom_smooth() 함수는 ggplot2 패키지에서 사용되는 함수로, 산점도 위에 부드러운 곡선 또는 선을 그리는 데에 사용됩니다. 주로 산점도의 추세를 시각적으로 보여주기 위해 활용됩니다. 이 함수는 회귀선, LOESS(로컬 회귀), 또는 일정한 구간에서의 평균값을 나타내는 선을 그릴 수 있습니다. 여기서 산점도는 주로 geom_point() 함수를 사용할 수 있으며 X, Y 변수 중 연속형 변수가 있는 경우에 많이 사용합니다. 사용자가 geom_point() 함수를 이용해서 그린 산점도를 보면서 대략적인 X, Y 변수 간의 관계를 눈으로 확인할 수 있습니다. 예를 들어, X가 증가할 수록 Y가 증가하는 비례관계에 있다거나 서로 관계성이 높지 않다거나 하는 다양한 해.. 2023. 12. 30.
통계값 시각화 방법 평균값 시각화 - stat 인수 R언어를 활용한 시각화에서 주로 사용되는 ggplot2 패키지에 대해서 살펴보고 있습니다. 이번 포스팅에서는 앞서 살펴본 geom_histogram, geom_bar, geom_point 등 여러 함수에 대해 평균값을 같이 시각화하는 방법에 대해 살펴보겠습니다. 데이터를 그대로 보여주지 않고 데이터들의 평균값을 시각화하는 인수가 있습니다. 바로 stat 인수입니다. geom_bar 함수를 예시로 살펴보겠습니다. 아래 코드는 ggplot2 패키지에 포함된 다이아몬드 데이터셋에서 다이아몬드의 color와 price 변수를 입력해서 각 다이아몬드 색상별 평균 가격을 시각화합니다. 이때, geom_bar 함수에 stat 인수에 'summary_bin'을 입력하고 fun 인수에 '.. 2023. 12. 30.