본문 바로가기

빅데이터6

[R-008] R패키지 - 데이터 핸들링(dplyr) R의 장점은 수많은 패키지(Package)가 아닐까 생각한다. 패키지는 함수들을 모아놓은 것으로 R 패키지는 데이터를 읽어들이는데 도움을 주는 패키지, 데이터를 다루는데 도움을 주는 패키지, 데이터를 시각화하는데 도움을 주는 패키지, 데이터로 보고서를 만들어 주는 패키지 등 매우 다양하게 준비되어 있다. 몇몇 패키지들에 대해 알아보자. 패키지는 CRAN(http://cran.r-project.org)의 Packages에서 확인해 볼 수 있다. 패키지 설치하기 dplyr 패키지를 설치한다고 가정아래 패키지를 설치하고 패키지를 불러오자. install.packages('dplyr') # 패키지 설치, Rstudio에 한번 설치하면 다음에 다시 사용하기 위해 또 설치할 필요는 없다. library(dplyr).. 2023. 4. 15.
[R-007] 외부 데이터 불러오기, 저장하기 분석할 데이터를 RStudio로 일일이 만들어 사용하는 일은 별로 없을 듯하고 주로 외부 데이터를 가져와서 분석을 하는게 일반적일 것이다. 많이 사용하는 외부 데이터는 주로 .txt, .csv, .xlsx 등이 될 것이고 그외에 .xml, .json 등도 사용되고 있다. 여기에서는 .txt, .csv, .xlsx만 다뤄보자. - txt : read.table() - csv : read.csv() - xlsx : read_excel() 주의할 사항으로 데이터의 위치를 확인해야 한다. 작업디렉토리에 위치시켜야 정상적으로 동작시킬 수 있다. 작업디렉토리를 확인하는 방법은 getwd()이며 다른 곳으로 지정하려면 setwd("c:/...")를 이용하면 된다. Sample 데이터는 학교알리미 사이트에서 공개데이터.. 2023. 4. 12.
[R-005] 벡터(Vector) 2 앞에서는 벡터가 무엇인지 알아봤다면 여기에서는 벡터를 조작하는 방법에 대해 알아보려고 한다. 잠시 쉬어가기 : https://kilhwan.github.io/rprogramming/ch-visualization.html 1. c()함수를 이용하여 벡터 생성하기 이미 알고 있는 것 처럼 괄호안의 자료를 나열함으로써 벡터를 생성할 수 있고 두 벡터를 이어붙이거나 해당 값의 이름을 붙일 수도 있다. 각각에 대해 알아보고 실습해 보자. 실습 벡터 생성하기 > x x [1] 1 ,3, 5, 7, 9 > s s [1] "lee" "kim" "im" 실습 두 백터 이어 붙이기 > c(x, c(11, 13)) # 위 실습을 하지 않고 하면 에러가 발생된다. 벡터는 같은 유형의 값을 가져야 한다는 것을 기억하자. [1].. 2023. 3. 29.
[R-003] 데이터 구조, 벡터 1 R을 처음 시작할 때 많이 들었던 말이 백터(Vector) 였던 것 같다. 백터는 데이터 구조중 하나인데 벡터를 말하기 전에 먼저 혼동할 수 있는 데이터 구조와 자료형에 대해 먼저 알아보는 것이 순서인 것 같다. 데이터 구조는 데이터를 효율적으로 관리할 수 있는 데이터의 구조 즉, 어떤 형태를 갖는 모양이며 데이터를 저장하는 방법으로 벡터(vector), 행렬(matrix), 배열(array), 리스트(list), 데이터 프레임(data.frame) 등이 있다. 벡터라는 말은 단일값(스칼라)들이 모여져 있는 변수(?)를 말한다. 다른 표현으로 하나 이상의 동일한 데이터 타입을 가지는 1차원 데이터 구조라고 말한다. 행렬은 동일한 데이터 타입의 2차원 데이터 구조이며, 배열은 3차원 이상의 다차원 배열을 .. 2023. 3. 29.