본문 바로가기

전체 글14

범주형 변수 비중 분석, geom_mosaic() Titanic 데이터셋 'Titanic.data'는 타이타닉호 승객에 대한 데이터셋으로, 생존 여부 및 다양한 속성에 관한 정보를 포함합니다. 이 데이터셋은 타이타닉호의 여객들에 대한 기본적인 특성과 생존 여부를 나타내며, 데이터 분석이나 머신 러닝 연습에 자주 사용됩니다. 이번 포스팅에서는 Titanic 데이터셋 중에서 Class(선실 등급), Age(나이)를 기준으로 승객이 생존한 비중을 살펴보도록 하겠습니다. Titanic 데이터셋에서 승객 생존 여부는 Survived 변수에서 0은 사망, 1은 생존으로 표시되고, Class(선실 등급)은 원래 데이터셋 중 Pclass라는 데이터 중 null 값이 있는 것을 삭제한 변수입니다. 변수 내.. 2023. 12. 31.
[리뷰] 2024년 새해맞이 내 삶의 주도권을 바꿀 책추천 2024년 새해가 밝았습니다. 2023년 모두 어떠셨나요?유튜브 보다가 올해가 훌쩍 날라갔나요? 세웠던 다이어트, 일잘러 등 여러 계획들이 한달도 안되서 다 무너졌나요? 이제 지나간 2023년을 디딤판 삼아 '어제보다 더 나은' 2024년이 되시길 바라며,제가 최근 감명깊게 읽었던 3권의 책을 소개하겠습니다!이 책들은 여러분의 삶의 주도권을 변화시키기 위해 당장의 하루를 보는 시각에서부터 장기적 인생의 목표를 바라보는 관점을 변화시키는데 도움이 될 것입니다. 도둑맞은 집중력 - 오늘 하루의 주도권요한 하리 지음김하현 번역 어크로스 (2023년 4월 28일)464쪽 | 1만8000원   요즘 '성인 ADHD', '유튜브가 우리 뇌를 갉아먹고 있다'는 등의 말을 많이 들어보셨을 듯합니다. 우리나라 뿐만 아니.. 2023. 12. 31.
geom_histogram() 살펴보기 geom_histogram() 개요 geom_histogram()은 ggplot2 패키지에서 제공되는 함수 중 하나로, 연속형 변수의 분포를 히스토그램으로 시각화하는 데 사용됩니다. 이 함수는 데이터를 일정한 간격의 구간(bins)으로 나누고, 각 구간에 속하는 데이터의 빈도를 막대로 나타냅니다. 이런 점에서 특정 범주별로 데이터의 빈도를 막대로 나타내는 geom_bar() 함수와 구분됩니다. 아래 코드를 통해 간단히 geom_histogram()을 사용하는 방법을 살펴보겠습니다. 이번 예시에서는 ggplot2 패키지에 포함되어 있는 tips 데이터셋에서 tip 변수를 이용하였습니다. tips 데이터셋은 음식점에서의 손님들이 낸 팁(tip)에 관한 정보를 포함하고 있으며, 이중 tip 변수는 "손님이 낸.. 2023. 12. 30.
geom_point() vs. geom_jitter() geom_jitter() 개요 geom_point()에 대한 내용은 아래 포스팅을 참조해주시기 바랍니다! https://jacey312.tistory.com/entry/geompoint-%ED%95%A8%EC%88%98-%EC%97%B0%EC%86%8D%ED%98%95-%EB%B3%80%EC%88%98-%EC%8B%9C%EA%B0%81%ED%99%94 geom_point 함수, 연속형 변수 시각화 geom_point() 개요 geom_point() 함수는 R 프로그래밍 언어의 ggplot2 패키지에서 사용되는 함수로, 산점도(Scatter plot)를 생성하는 데에 활용됩니다. 이 함수는 ggplot2 패키지의 일부이며, 데이터 시각화 작 jacey312.com 이번 포스팅에서는 geom_jitter().. 2023. 12. 30.