본문 바로가기

R11

통계량, boxplot, t검정 엑셀 데이터가 있을 때 R에서 불러와서 그래프(boxplot)를 만들고 통계량과 t검정 결과가 요약된 p-value를 출력하는 표를 만드는 과정에 대해 알아보도록 하자. 우리가 통계관련 지식을 알지 못하면 이해하기 어려운 부분들이 많을 수 있으므로 일단 이해를 위해서 몇 가지 통계와 관련된 용어들에 대해 알아보자. 통계를 전부 다룬다기 보다(다룰 수도 없겠지만) 이런게 있구나 정도만 훓고 지나가자. 일단 다음 내용을 읽고 무슨 뜻인지 생각해보자. "두 표본 집단의 특징값의 평균이 통계적으로 유의한 차이가 있는지 검증하자." (ChatGPT에게 살짝 물어봤다.) 예를 들어, A와 B 두 집단의 키를 조사하여 비교한다고 가정해보자. 이때, A 집단의 평균 키가 170cm이고 B 집단의 평균 키가 175cm이.. 2023. 5. 22.
[R 질문] R에 내장된 데이터셋 사용하기 초보(처음) 사용자는 실습을 위해 데이터를 구하려면 그것도 쉽지 않다. 하지만 R에는 실습을 위한 충분한 데이터를 준비해 놓았다. R에 내장된 데이터셋을 확인하는 방법에 대해 알아보자. 몇 가지 방법 중 편한 방법을 사용하자. 1) datasets:: 사용하기 datasets::을 사용하면 콜론 뒤에 사용가능한 데이터셋을 목록으로 보여준다. datasets:: 2) data() 함수 사용하기 datasets 패키지 안에 있는 데이터 집합을 보여준다. data() 참고로, 자주사용되는 mtcars, iris 등에 대한 새부 정보를 알고 싶다면 물음표(?) 뒤에 데이터 셋이름을 적으면 된다. ? mtcars Description을 보면 1974년 Motor Trend US 매거진에서 발췌했고, 32대의 자동.. 2023. 5. 5.
[R 질문] R 최신버전 확인 및 업데이트 특정한 기능이 없거나 안되는 경우 최신버전이 아니라서 발생되는 이유때문일 수도 있다. 버전이 최신버전인지 그리고 업데이트 하는 방법에 대해 알아보자. 방법은 아주 간단하다. 패키지 설치하고 메모리에 로드하고 버전 확인하고 설치하고 다시버 전 확인하고... install.packages("installr") library(installr) check.for.updates.R() install.R() version check.for.updates.R() 명령어를 사용하면 최신버전인 경우 최신버전이라고 나오며 최신버전이 아닌경우 다음과 같이 지금 버전과 최신버전을 보여준다. 설치후 다시 확인하면 다음과 같다. 참고로, 패키지가 설치되어 있지 않은 상태에서 check.for.updates.R()를 사용하면 에러.. 2023. 5. 5.
[R-008] R패키지 - 데이터 핸들링(dplyr) R의 장점은 수많은 패키지(Package)가 아닐까 생각한다. 패키지는 함수들을 모아놓은 것으로 R 패키지는 데이터를 읽어들이는데 도움을 주는 패키지, 데이터를 다루는데 도움을 주는 패키지, 데이터를 시각화하는데 도움을 주는 패키지, 데이터로 보고서를 만들어 주는 패키지 등 매우 다양하게 준비되어 있다. 몇몇 패키지들에 대해 알아보자. 패키지는 CRAN(http://cran.r-project.org)의 Packages에서 확인해 볼 수 있다. 패키지 설치하기 dplyr 패키지를 설치한다고 가정아래 패키지를 설치하고 패키지를 불러오자. install.packages('dplyr') # 패키지 설치, Rstudio에 한번 설치하면 다음에 다시 사용하기 위해 또 설치할 필요는 없다. library(dplyr).. 2023. 4. 15.