본문 바로가기
언어/R

[R-001] 빅데이터 분석, R

by 천왕지짐 2023. 3. 28.

R은 빅데이터를 처리하기 위한 도구이다.

 

빅데이터는 말 그대로 방대한 데이터로 그 규모가 방대하여 기존의 방법이나 도구로는 수집, 저장, 분석 등이 어려운 정형 또는 비정형 데이터를 의미한다.(절대적인 데이터의 크기보다는 인간이 수집, 저장, 분석하기가 어려운만큼 방대한 데이터라는 조금은 추상적인 의미로 볼 수 있다.)

 

빅데이터는 존재 그 자체가 중요한 것은 아니다. 빅데이터가 중요하다는 것에는 모두가 공감하지만 정작 활용방법은 쉽지 않다. 빅데이터의 수집방법이나, 수집된 자료를 가공하는 것이나, 그 속에 숨어있는 것을 찾아내는 것이 어렵다. 

 

아마존(Amazon)의 경우 실시간 이동하는 고객의 구매행위에 따라 변경되는 판매량과 재고의 실시간 분석을 통해 재고관리와 배송의 효율성을 높이고 있다고 한다.

 

R과 Python을 간단히 비교하자면 R은 데이터 분석, 통계, 데이터 그래픽을 처리하는 용도의 언어라면 Python은 특정 용도에 국한되지 않은 범용 언어로 네트워크쪽, 로봇제어 쪽에도 사용이 가능하다. 지금까지 알아본 바로는 R로 네트워크쪽이나 로봇제어는 하지 못하는 것 같다. R의 통합개발환경은 R-Studio이며 Python은 Spyder, IPython Notebook, Pycharm등이 있다. 

 

 

R 설치하기

R 사이트에서는, "R은 통계 분석과 그래픽을 위한 언어이자 환경이다.“

(R is a language and environment for statistical computing and graphics.)"라고 정의하고 있다. 정의의 핵심은 분석과 그래픽이라고 할 만큼 데이터를 분석하여 그래픽으로 보여주는데 탁월하다. 

 

 

R을 사용하는 이유
1) 오픈소스이므로 무료로 사용할 수 있다.
2) 2021년 9월 기준으로 CRAN(Comprehensive R Archive Network)에 등록된 R 패키지(package) 수는 약 18,000개 이상이다. 이 외에도 GitHub 등에서 개인이나 단체에서 개발한 R 패키지들이 존재한다. 이것들을 이용하면 최신 분석기법을 적용하고 활용할 수 있다. 
3) 정의에서 언급한바와 같이 그래프 기능이 뛰어나며 지도까지 연동된다.
4) 데이터를 조작(나누고 붙이고 쪼개고)하는데 탁월하다.
5) 객체지향 프로그래밍 언어로서의 역할을 한다.
6) R관련된 책과 공개된 자료 및 커뮤니티가 많다.
7) Python과 함께 뜨는 언어이다.
8) 설치와 실습이 매우 쉽다.

 


백문이 불여일견, 간단한 분석이라도 눈으로 직접보자.

1) 데이터가 들어있는 엑셀 또는 csv형태의 파일이 작업폴더에 준비되어 있다고 가정하자.(여기에서 "지역별 기상데이터.csv"가 준비되어 있다고 간주하겠다.)

2) RStudio의 스크립트 창에 다음과 같이 단 2줄만을 입력시킨다.

   weather <- read.csv("지역별기상데이터.csv")

   summary(weather)

 

3) 실행시키면 눈깜짝할 사이에 아래처럼 근사한 결과(최소값, 4분위값, 중간값, 평균 등)를 얻을 수 있다. 물론 지점번호의 통계는 아무 의미가 없다.

참고) 혹시 다음과 같이 에러가 발생될 수 있다.

Error in make.names(col.names, unique = TRUE) : 
  invalid multibyte string at '<c1><f6><c1><a1>'

에러가 발생되면 다음 코드를 먼저 실행시켜 준 후 동작시키면 된다.

  Sys.getlocale()
  Sys.setlocale("LC_ALL", "C") 
  Sys.setlocale("LC_ALL", "Korean") 

'언어 > R' 카테고리의 다른 글

[R-006] 데이터 프레임(Data Frame)  (0) 2023.04.04
[R-005] 벡터(Vector) 2  (0) 2023.03.29
[R-004] R 기본 문법  (0) 2023.03.29
[R-003] 데이터 구조, 벡터 1  (0) 2023.03.29
[R-002] R, RStudio 설치하기  (0) 2023.03.28

댓글