본문 바로가기

언어/R15

[R-011] ggplot2 - geom_bar() 가장 흔히 볼 수 있고 이해하기 쉬운 막대그래프에 대해서 알아보자. 막대 그래프를 사용하기 위해 ggplot2를 설치해야 되겠지만 tidyverse 패키지안에 ggplot2가 포함되어 있으므로 그냥 tidyverse를 설치했다면 library(tidyverse)만 해도 되겠다. 설치되어 있지 않다면 다음과 같이 설치하면 된다. install.packages("tidyverse") library(tidyverse) 데이터 셋은 diamonds를 앞에서 이미 본 사용하도록 하겠다. - carat: 다이아몬드 무게 - cut: 컷팅의 가치 - color: 다이아몬스 색상 - clarity: 깨끗한 정도 - depth: 깊이 비율, z / mean(x, y) - table: 가장 넓은 부분의 너비 대비 다이아몬.. 2023. 5. 5.
[R-010] ggplot2 - geom_point() 두 변수간의 관계를 시각적으로 나타내기 위해 산점도 그래프가 사용된다. 일반적으로 배기량과 연비에 대한 관계를 살펴보려고 할 때 이 산점도를 사용하여 시각화 한다. 이 산점도에 색상, 크기, 모양 등을 포함하면 더 많은 정보를 표현할 수 있다. 아래 내용은 슬기로운 통계생활 유투브의 내용을 참조 및 추가하였음을 미리 밝힌다. 예제 데이터를 가져오자. 직접 만들어도 상관없겠다. 예제 데이터는 다음과 같고 아래와 같이 첨부하였으니 다운로드 받아 사용하자. 엑셀 데이터 가져오기 install.packages('readxl') library(readxl) mydata = read_excel("data.xlsx") 평가 필드(highlow) 추가하기 mydata$highlow = ifelse(mydata$mid .. 2023. 5. 3.
[R-009] 패키지 - 데이터 시각화 데이터 시각화는 말 그대로 데이터를 시각적으로 표현하는 것을 말한다. 즉, 그래프, 차트, 지도 등을 사용하여 데이터를 시각적으로 분석하고 이해하기 쉽게 만드는 것을 말한다. 시각화는 데이터 분석과 의사 결정에 중요한 역할을 하는데 그래프, 차트, 지도 등을 보면 경향, 패턴, 관계 등을 파악할 수 있어 이를 바탕으로 적절한 의사 결정을 할 수 있게 된다. 시각화 패키지로는 ggplot2, lattice, plotly, ggvis, shiny 등의 패키지가 있는데 여기에서는 ggplot2에 대해 알아보도록 하겠다. 이미 배운대로 패키지를 사용하려면 아래처럼 설치와 로드(메모리에 올리는)작업이 필요하다. install.packages("ggplot2") library(ggplot2) 과연 시각화를 통해 의.. 2023. 4. 16.
[R-008] R패키지 - 데이터 핸들링(dplyr) R의 장점은 수많은 패키지(Package)가 아닐까 생각한다. 패키지는 함수들을 모아놓은 것으로 R 패키지는 데이터를 읽어들이는데 도움을 주는 패키지, 데이터를 다루는데 도움을 주는 패키지, 데이터를 시각화하는데 도움을 주는 패키지, 데이터로 보고서를 만들어 주는 패키지 등 매우 다양하게 준비되어 있다. 몇몇 패키지들에 대해 알아보자. 패키지는 CRAN(http://cran.r-project.org)의 Packages에서 확인해 볼 수 있다. 패키지 설치하기 dplyr 패키지를 설치한다고 가정아래 패키지를 설치하고 패키지를 불러오자. install.packages('dplyr') # 패키지 설치, Rstudio에 한번 설치하면 다음에 다시 사용하기 위해 또 설치할 필요는 없다. library(dplyr).. 2023. 4. 15.