본문 바로가기

빅데이터분석3

[R-007] 외부 데이터 불러오기, 저장하기 분석할 데이터를 RStudio로 일일이 만들어 사용하는 일은 별로 없을 듯하고 주로 외부 데이터를 가져와서 분석을 하는게 일반적일 것이다. 많이 사용하는 외부 데이터는 주로 .txt, .csv, .xlsx 등이 될 것이고 그외에 .xml, .json 등도 사용되고 있다. 여기에서는 .txt, .csv, .xlsx만 다뤄보자. - txt : read.table() - csv : read.csv() - xlsx : read_excel() 주의할 사항으로 데이터의 위치를 확인해야 한다. 작업디렉토리에 위치시켜야 정상적으로 동작시킬 수 있다. 작업디렉토리를 확인하는 방법은 getwd()이며 다른 곳으로 지정하려면 setwd("c:/...")를 이용하면 된다. Sample 데이터는 학교알리미 사이트에서 공개데이터.. 2023. 4. 12.
[R-006] 데이터 프레임(Data Frame) 데이터 프레임은 표 형태를 표현할 수 있도록 단순화시킨 일종의 리스트이며, 변수(필드)와 관찰치(레코드)로 구성된 2차원의 자료객체로서 자료 분석에 있어 가장 일반적인 자료 구조를 가지고 있다고 할 수 있다. 각 변수들은 서로 다른 자료형을 가질 수 있으나, 동일한 관찰치의 개수를 가져야 한다는 제약이 따른다. 일상에서 마주하는 표 자료들은 데이터프레임으로 표현하는 것이 가장 편리하다. Excel Data를 사용하는 방법을 잠시 알아보자. - 아래 파일을 다운로드 하여 작업 폴더에 위치시킨다. - install.packages("readxl") - library(readxl) - x = read_excel("exam.xlsx") - View(x) 예를 들어, 4개의 관찰치를 가진 3개의 변수를 고려해 보.. 2023. 4. 4.
[R-004] R 기본 문법 이미 다른 프로그래밍 언어를 사용해본 경험이 있다면 한번 쭉~ 읽어보면 될 듯 싶다. 읽고 간단히 실습하면서 다른 언어와 비교해봐도 좋을 것 같다. 1. 주석 "#" 다음에 나타나는 모든 문장은 주석으로서 실행에 영향을 미치지 않는다. 명령어 문장을 설명하는 목적으로 주로 사용된다. - R에서 #은 주석으로 줄바꿈을 해야만 주석에서 벗어난다. - Rstudio에서 여러 줄 주석은 드래그 후 Ctrl + Shift + C이다. 해제는 다시한번... [실습] 주석에 대해 실습해 보자. > 3 + 2 #두수의 합 [1] 5 참고로 결과로 매번 나타나는 [1] 표시는 옆에 있는 결과값이 몇 번째인가를 나타내는 번호로 첫 번째 값이 5라는 것을 의미한다. 2. 할당문 R은 프로그래밍 언어처럼 변수에 값을 저장할 .. 2023. 3. 29.