본문 바로가기

rstudio5

통계량, boxplot, t검정 엑셀 데이터가 있을 때 R에서 불러와서 그래프(boxplot)를 만들고 통계량과 t검정 결과가 요약된 p-value를 출력하는 표를 만드는 과정에 대해 알아보도록 하자. 우리가 통계관련 지식을 알지 못하면 이해하기 어려운 부분들이 많을 수 있으므로 일단 이해를 위해서 몇 가지 통계와 관련된 용어들에 대해 알아보자. 통계를 전부 다룬다기 보다(다룰 수도 없겠지만) 이런게 있구나 정도만 훓고 지나가자. 일단 다음 내용을 읽고 무슨 뜻인지 생각해보자. "두 표본 집단의 특징값의 평균이 통계적으로 유의한 차이가 있는지 검증하자." (ChatGPT에게 살짝 물어봤다.) 예를 들어, A와 B 두 집단의 키를 조사하여 비교한다고 가정해보자. 이때, A 집단의 평균 키가 170cm이고 B 집단의 평균 키가 175cm이.. 2023. 5. 22.
[R 질문] R에 내장된 데이터셋 사용하기 초보(처음) 사용자는 실습을 위해 데이터를 구하려면 그것도 쉽지 않다. 하지만 R에는 실습을 위한 충분한 데이터를 준비해 놓았다. R에 내장된 데이터셋을 확인하는 방법에 대해 알아보자. 몇 가지 방법 중 편한 방법을 사용하자. 1) datasets:: 사용하기 datasets::을 사용하면 콜론 뒤에 사용가능한 데이터셋을 목록으로 보여준다. datasets:: 2) data() 함수 사용하기 datasets 패키지 안에 있는 데이터 집합을 보여준다. data() 참고로, 자주사용되는 mtcars, iris 등에 대한 새부 정보를 알고 싶다면 물음표(?) 뒤에 데이터 셋이름을 적으면 된다. ? mtcars Description을 보면 1974년 Motor Trend US 매거진에서 발췌했고, 32대의 자동.. 2023. 5. 5.
[R 질문] R 최신버전 확인 및 업데이트 특정한 기능이 없거나 안되는 경우 최신버전이 아니라서 발생되는 이유때문일 수도 있다. 버전이 최신버전인지 그리고 업데이트 하는 방법에 대해 알아보자. 방법은 아주 간단하다. 패키지 설치하고 메모리에 로드하고 버전 확인하고 설치하고 다시버 전 확인하고... install.packages("installr") library(installr) check.for.updates.R() install.R() version check.for.updates.R() 명령어를 사용하면 최신버전인 경우 최신버전이라고 나오며 최신버전이 아닌경우 다음과 같이 지금 버전과 최신버전을 보여준다. 설치후 다시 확인하면 다음과 같다. 참고로, 패키지가 설치되어 있지 않은 상태에서 check.for.updates.R()를 사용하면 에러.. 2023. 5. 5.
[R-007] 외부 데이터 불러오기, 저장하기 분석할 데이터를 RStudio로 일일이 만들어 사용하는 일은 별로 없을 듯하고 주로 외부 데이터를 가져와서 분석을 하는게 일반적일 것이다. 많이 사용하는 외부 데이터는 주로 .txt, .csv, .xlsx 등이 될 것이고 그외에 .xml, .json 등도 사용되고 있다. 여기에서는 .txt, .csv, .xlsx만 다뤄보자. - txt : read.table() - csv : read.csv() - xlsx : read_excel() 주의할 사항으로 데이터의 위치를 확인해야 한다. 작업디렉토리에 위치시켜야 정상적으로 동작시킬 수 있다. 작업디렉토리를 확인하는 방법은 getwd()이며 다른 곳으로 지정하려면 setwd("c:/...")를 이용하면 된다. Sample 데이터는 학교알리미 사이트에서 공개데이터.. 2023. 4. 12.