R 튜토리얼 – R 프로그래밍을 배우기위한 초보자 가이드



R Tutorial에 대한이 블로그는 R 도구를 소개하고 예제를 통해 R 프로그래밍의 다양한 기본 사항을 자세히 이해하는 데 도움이됩니다.

R은 오픈 소스이고 유연하며 여러 패키지를 제공하고 거대한 커뮤니티를 가지고 있기 때문에 가장 인기있는 데이터 분석 도구입니다. 소프트웨어 프로그래머, 통계 학자 및 데이터 마이너를 위해 설계 되었기 때문에 .이 R Tutorial 블로그에서는 예제와 함께 R에 대한 완전한 통찰력을 제공합니다.

다음은이 R Tutorial 블로그의 주제이며 다음 순서로 논의 할 것입니다.





  1. 분석이 필요한 이유 ?
  2. 비즈니스 분석이란? ?
  3. R과 R을 사용하는 이유 ?
  4. R의 설치
  5. 데이터 연산자
  6. 데이터 유형
  7. 흐름 제어

R Tutorial : 왜 분석이 필요한가요?

질문에 답하기 전에 여러 도메인에서 R의 몇 가지 문제와 해결책에 대해 간략히 설명하겠습니다.



뱅킹-R Tutorial-Edureka

은행업 :

은행에서는 매일 대량의 고객 데이터가 생성됩니다. W수백만 명의 고객과 정기적으로 거래하는 경우 모기지를 추적하기가 어려워집니다.



해결책 :

R은 모든 개별 고객에게 제공되는 대출을 유지하는 맞춤형 모델을 구축하여 시간이 지남에 따라 고객이 지불 할 금액을 결정하는 데 도움이됩니다.

보험 :

자바 스크립트는 배열의 길이를 얻습니다.

보험은 예측에 크게 의존합니다. 어렵습니다수락하거나 거부 할 정책을 결정합니다.

해결책:

지속적인 신용 보고서를 입력으로 사용하여 위험 성향을 평가할뿐만 아니라 예측 예측도 할 수있는 모델을 R에서 만들 수 있습니다.

보건 의료:

매년 수백만 명의 사람들이 병원에 입원하고 있으며 매년 수십억 명의 사람들이 입원 과정에만 소비됩니다.

해결책 :

환자 이력과 의료 이력을 감안할 때 입원 위험이있는 사람과 의료 장비를 어느 정도까지 확장해야하는지 식별하는 예측 모델을 구축 할 수 있습니다.

이제 데이터 분석이 조직에서 데이터를 활용하고이를 사용하여 새로운 기회를 식별하는 데 어떻게 도움이되는지 알게되었습니다. 조직에서 분석의 필요성에 대해 이야기한다면 다음 4 가지 측면을 접해야합니다.

다음으로 R 튜토리얼 블로그로 넘어가 보겠습니다. 여기서 먼저 비즈니스 분석이 정확히 무엇인지 이해하겠습니다.

R 자습서 : 비즈니스 분석이란 무엇입니까?

비즈니스 분석은 대규모 데이터 세트를 조사하고 숨겨진 패턴, 상관 관계 및 기타 통찰력을 얻는 프로세스입니다. 기본적으로 조직 데이터, 시장 또는 제품 조사 데이터 또는 기타 모든 종류의 데이터 등 수집 한 모든 데이터를 이해하는 데 도움이됩니다. 더 나은 결정, 더 나은 제품, 더 나은 마케팅 전략 등을 쉽게 내릴 수 있습니다. 더 나은 이해를 위해 아래 이미지를 참조하십시오.

위의 그림을 보면 첫 번째 이미지의 데이터가 흩어져 있습니다. 이제 데이터베이스의 특정 레코드와 같은 특정 항목을 원하면 복잡해집니다. 이를 단순화하려면 분석이 필요합니다. 분석을 통해 데이터 간의 상관 관계를 쉽게 파악할 수 있습니다. 수행 할 작업을 설정하면 따라야 할 경로 또는 비즈니스 분석 측면에서 어떤 경로를 통해 조직을 개선할지와 같은 결정을 내리는 것이 매우 쉬워집니다.

그러나 위의 체인에 속한 사람들이 분석 후에 제공하는 원시 데이터를 항상 이해하기를 기대할 수는 없습니다. 그래서이 격차를 극복하기 위해 우리는 데이터 시각화 .

데이터 시각화 : 데이터 시각화는 분석 후에 생성 한 엄청난 양의 데이터에 대한 시각적 액세스입니다. 인간의 마음은 시각적 이미지를 처리하고 시각적 그래픽은 원시 데이터에 비해 더 낫습니다. 원시 숫자와 비교하여 원형 차트 또는 막대 그래프를 이해하는 것은 항상 쉽습니다. 이제 이미 분석 한 데이터에서이 데이터 시각화를 어떻게 얻을 수 있는지 궁금 할 것입니다.
시장에서 데이터 시각화를위한 다양한 도구를 사용할 수 있습니다.

데이터 시각화와 일정량의 분석을 달성하는 데 도움이되는 도구가 이미 너무 많이 있다는 사실을 궁금해 할 것입니다. 왜 R을 선택해야합니까?

그래서 R 튜토리얼 블로그의 다음 주제는 '왜 R'과 '누가 R을 사용하는지'를 다룹니다.

R 튜토리얼 : 왜 R을 사용하고 누가 R을 사용합니까?

왜 R인가?

R은 프로그래밍 및 통계 언어입니다.

R은 데이터 분석 및 시각화에 사용됩니다.

R은 간단하고 배우고 읽고 쓰기 쉽습니다.

R은이 소프트웨어의 사본을 자유롭게 배포하고, 소스 코드를 읽고, 수정할 수있는 FLOSS (Free Libre 및 Open Source Software)의 예입니다.

누가 R을 사용합니까?

  • 소비자 금융 보호국은 데이터 분석에 R을 사용합니다.
  • John Deere의 통계학자는 신뢰할 수 있고 재현 가능한 방식으로 시계열 모델링 및 지리 공간 분석에 R을 사용합니다.
  • Bank of America는보고를 위해 R을 사용합니다.
  • R은 Foursquare의 유명한 추천 엔진 뒤에있는 기술 스택의 일부입니다.
  • 호주에서 네 번째로 큰 은행 인 ANZ는 신용 위험 분석에 R을 사용합니다.
  • Google은 R을 사용하여 경제 활동을 예측합니다.
  • Firefox 웹 브라우저를 담당하는 기반 인 Mozilla는 R을 사용하여 웹 활동을 시각화합니다.

다음은 R이 사용되는 일부 도메인입니다.

이제 R 자습서 블로그로 이동하여 R을 설치하겠습니다.

R 튜토리얼 : R 설치

시스템에 R을 설치하는 과정을 안내해 드리겠습니다. 아래 단계를 따르십시오.

1 단계 : https://cran.r-project.org/ 링크로 이동합니다.

2 단계 : 시스템에 R 3.3.3을 다운로드하여 설치합니다.

더 나은 이해를 위해 아래 스크린 샷을 참조하십시오.

위의 단계에 따라 R 설치 부분이 완료되었습니다. 이제 RStudio IDE를 다운로드하여 R에서 직접 코딩을 시작할 수 있습니다. 이를 다운로드하려면 다음 단계를 따르십시오.

1 단계 : 링크로 이동-https://www.rstudio.com/

2 단계 : 시스템에 Rstudio를 다운로드하여 설치합니다.

모든 것을 설치하고 나면 코드 설정이 완료됩니다!

초보자를위한 R 튜토리얼 | R 프로그래밍 튜토리얼 | Edureka

다음으로 R Tutorial 블로그에서 R의 데이터 연산자가 무엇인지 이해하겠습니다.

R 튜토리얼 : R의 데이터 연산자

주로 5 가지 유형의 연산자가 있으며 다음과 같습니다.

  1. 산술 연산자 : 더하기, 빼기, 곱하기, 나누기 등의 산술 연산을 수행합니다.
  2. 할당 연산자 :할당 연산자는 값을 할당하는 데 사용됩니다. 예를 들면 :
  • 할당 연산자 =
    통사론:
    변수 이름 = 값
> x = 5 >엑스 
출력 : [1] 5
  • 할당 연산자<-
    통사론:
    변수 이름<- value

    > x<- 15 > x
    출력 : [1] 15
  • 할당 연산자<<-
    구문 :
    변수 이름<<- value
> x<<- 2 > x
출력 : [1] 2
  • 할당 연산자->
    구문 :
    값-> 변수 이름

    > 25-> x > x 
    출력 : [1] 25

3. 관계 연산자 : 두 개체 간의 관계를 정의합니다. 예 :,<=,!= etc.

> xx! = 2
산출:[1] 참

4. 논리 연산자 :이 연산자는 두 엔티티를 비교하며 일반적으로 &, |와 같은 부울 (논리) 값과 함께 사용됩니다. 그리고!.

> x2 & 3
산출:[1] 참

5. 특수 연산자 : 이러한 연산자는 논리 계산이 아닌 특정 목적으로 사용됩니다. 예를 들면 :

  • 벡터에 대해 일련의 숫자를 순서대로 만듭니다.

    > xx
    출력 : [1] 2 3 4 5 6 7 8
  • % in %이 연산자는 요소가 벡터에 속하는지 식별하는 데 사용됩니다.

    > xyy % in % x
    출력 : [1] TRUE

R 튜토리얼 : 데이터 유형

데이터 유형은 정보를 저장하는 데 사용됩니다. R에서는 변수를 일부 데이터 유형으로 선언 할 필요가 없습니다. 변수는 R-Objects로 할당되며 R-object의 데이터 유형은 변수의 데이터 유형이됩니다.R에는 주로 6 개의 데이터 유형이 있습니다.

각각에 대해 더 자세히 살펴 보겠습니다.

벡터 : Vector는 동일한 기본 유형의 데이터 요소 시퀀스입니다. 예:

vtr = (1, 3, 5, 7 9)

또는

vtr<- (1, 3, 5 ,7 9)

5 개의 벡터 클래스라고도하는 5 개의 원자 벡터가 있습니다.

명부 : 목록은 마이너스 숫자, 문자열, 벡터 및 그 안에 다른 목록과 같은 다양한 유형의 요소를 포함하는 R 객체입니다.

> n = c (2, 3, 5) > s = c ( 'aa', 'bb', 'cc', 'dd', 'ee') > x = 목록 (n, s, TRUE) > x

산출 -

[[1]] [1] 2 3 5 [[2]] [1] 'aa' 'bb' 'cc' 'dd' 'ee'[[3]] [1] TRUE

배열 : 배열은 2 차원 이상의 데이터를 저장할 수있는 R 데이터 객체입니다. 벡터를 입력으로 사용하고 dim 매개 변수의 값을 사용하여 배열을 만듭니다.

vector1<- c(5,9,3) vector2<- c(10,11,12,13,14,15) 결과<- array(c(vector1,vector2),dim = c(3,3,2))

산출 -

,, 1 [, 1] [, 2] [, 3] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15 ,, 2 [, 1] [, 2] [, 3 ] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15

배열 : 행렬은 요소가 2 차원 직사각형 레이아웃으로 배열 된 R 객체입니다. Matrix () 함수를 사용하여 Matrix를 만듭니다. 예: 행렬 (데이터, nrow, ncol, byrow, dimnames) 어디,

데이터 행렬의 데이터 요소가되는 입력 벡터입니다.

nrow 만들 행 수입니다.

ncol 만들 열 수입니다.

byrow 논리적 단서입니다. TRUE이면 입력 벡터 요소가 행별로 정렬됩니다.

dimname 행과 열에 지정된 이름입니다.

> 매트<- matrix(c(1:16), nrow = 4, ncol = 4 ) > 매트
산출 :
[, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

요인 : 요인은 데이터를 분류하고 레벨로 저장하는 데 사용되는 데이터 개체입니다. 문자열과 정수를 모두 저장할 수 있습니다. 통계 모델링을위한 데이터 분석에 유용합니다.

> 데이터<- c('East','West','East','North','North','East','West','West“,'East“) > factor_data<- factor(data) > factor_data

산출 :

[1] 동쪽 서쪽 동쪽 북쪽 북쪽 동쪽 서쪽 서쪽 동쪽 레벨 : 이스트 노스 웨스트

데이터 프레임 : 데이터 프레임은 각 열에 하나의 변수 값이 포함되고 각 행에 각 열의 값 세트가 하나씩 포함 된 테이블 또는 2 차원 배열과 같은 구조입니다.

> std_id = c (1 : 5) > std_name = c ( 'Rick', 'Dan', 'Michelle', 'Ryan', 'Gary') > 마크 = c (623.3,515.2,611.0,729.0,843.25) > std.data<- data.frame(std_id, std_name, marks) > std.data

산출 :

std_id std_name 표시 1 1 Rick 623.30 2 2 및 515.20 3 3 미셸 611.00 4 4 라이언 729.00 5 5 게리 843.25

이것으로 R의 다양한 데이터 유형이 끝났습니다. 다음으로 R Tutorial 블로그에서 앞으로 나아가 다른 핵심 개념 인 흐름 제어 문을 이해하겠습니다.

R 자습서 : 흐름 제어 문

흐름 제어 문은 함수 내에서 스크립트의 실행 흐름을 제어 할 수 있으므로 매우 중요한 역할을합니다. 가장 일반적으로 사용되는 흐름 제어 문은 아래 이미지에 나와 있습니다.

이제 각각의 예를 들어 설명하겠습니다.

R 튜토리얼 : 선택자 문

  • If 제어문 :이 제어문은 단일 조건을 평가합니다. 그것은 단지 하나의 키워드 'if'다음에 조건과 그것이 참인 경우에 실행되어야하는 특정 문장 집합을 가지고 있기 때문에 매우 쉽습니다. 더 나은 이해를 위해 아래 순서도를 참조하십시오.

이 순서도에서 코드는 다음과 같은 방식으로 응답합니다.

  1. 먼저 조건을 확인하는 루프에 들어갑니다.
  2. 조건이 참이면 조건부 코드 또는 작성된 문이 실행됩니다.
  3. 조건이 거짓이면 문이 무시됩니다.

아래는 만약 R의 제어문. R Studio에서이 예제를 실행 해보십시오.

x = 2 반복 {x = x ^ 2 print (x) if (x> 100) {중단}

출력 :

[1] 4 [1] 16 [1] 256
  • If Else 제어문 :시험제어문의 유형조건 그룹을 평가하고 명령문을 선택합니다. 더 나은 이해를 위해 아래 순서도를 참조하십시오.

이 순서도에서 코드는 다음과 같은 방식으로 응답합니다.

  1. 먼저 조건을 확인하는 루프에 들어갑니다.
  2. 조건이 참이면 첫 번째 'if'문이 실행됩니다.
  3. 조건이 거짓이면 'else if'조건이되고 참이면 'else if'코드가 실행됩니다.
  4. 마지막으로 'else if'코드도 거짓이면 'else'코드로 이동하여 실행됩니다. 즉, 이러한 조건 중 어느 것도 참이 아니면 'else'문이 실행됩니다.

아래는 다른 경우라면 R의 제어문. R Studio에서이 예제를 실행 해보십시오.

x5) {print ( 'x는 5'보다 큼)} elseif (x == 5) {print ( 'x는 5'와 같음)} else {print ( 'x는 5'보다 크지 않음)}

산출:

[1] 'x는 5와 같음'
  • Switch 문 :이 제어문은 기본적으로 특정 표현식을 알려진 값과 비교하는 데 사용됩니다. 더 나은 이해를 위해 아래 순서도를 참조하십시오.

이 스위치 케이스 순서도에서 코드는 다음 단계로 응답합니다.

  1. 우선 표현식이있는 스위치 케이스에 들어갑니다.
  2. 다음으로 Case 1 조건으로 이동하여 조건에 전달 된 값을 확인합니다. 참이면 Statement 블록이 실행됩니다. 그 후에는 스위치 케이스에서 분리됩니다.
  3. 거짓 인 경우 다음 케이스로 전환됩니다. Case 2 조건이 참이면 명령문을 실행하고 해당 케이스를 중단하고 그렇지 않으면 다음 케이스로 다시 점프합니다.
  4. 이제 대소 문자를 지정하지 않았거나 사용자로부터 잘못된 입력이 있다고 가정 해 봅시다. 그러면 기본 문을 인쇄 할 기본 케이스로 이동합니다.

다음은 R의 switch 문의 예입니다. R Studio에서이 예를 실행 해보세요.

vtr<- c(150,200,250,300,350,400) option <-'mean' switch(option, 'mean' = print(mean(vtr)), 'mode' = print(mode((vtr))), 'median' = print(median((vtr))) ) 

출력 :

[1] 275

R 튜토리얼 : 루프 문

루프는 특정 작업 집합을 반복하여 반복적으로 수행 할 필요가 없도록 도와줍니다. 작업을 10 번 수행해야한다고 상상해보세요. 매번 코드를 작성하기 시작하면 프로그램의 길이가 늘어나 나중에 이해하기 어려울 것입니다. 그러나 동시에 루프를 사용하여 동일한 명령문을 루프 내에 작성하면 시간이 절약되고 코드 가독성이 더 쉬워집니다. 또한 코드 효율성 측면에서 더욱 최적화됩니다.

위 이미지에서‘ 반복' 및‘ 동안 '문은 조건이 참이 될 때까지 특정 규칙 집합을 실행하는 데 도움이되지만 에 대한' 문 블록을 반복하려는 횟수를 알고있을 때 사용되는 루프 문입니다. 이제 10 번 반복하고 싶다면 'for'문을 사용하지만 코드를 몇 번 반복할지 확실하지 않으면 'repeat'또는 'while'루프.

각각의 예를 들어 설명하겠습니다.

  • 반복 : 반복 루프는 정지 조건이 충족 될 때까지 동일한 코드 세트를 반복해서 실행하는 데 도움이됩니다. 더 나은 이해를 위해 아래 순서도를 참조하십시오.

위의 순서도에서 코드는 다음 단계로 응답합니다.

  1. 우선 코드 세트를 입력하고 실행합니다.
  2. 다음으로 조건을 확인하고 참이면 거짓이 될 때까지 동일한 코드 세트를 다시 실행합니다.
  3. 거짓으로 판명되면 루프를 직접 종료합니다.
  • 동안 : while 문은 중지 조건이 충족 될 때까지 동일한 코드 집합을 반복해서 실행하는 데 도움이됩니다. 더 나은 이해를 위해 아래 순서도를 참조하십시오.

위의 순서도에서 코드는 다음 단계로 응답합니다.

  1. 먼저 상태를 확인합니다.
  2. 참이면 코드 세트를 실행합니다.
  3. 다음으로 조건을 다시 확인하고 참이면 동일한 코드를 다시 실행합니다. 조건이 거짓 인 것으로 확인되면 즉시 루프를 종료합니다.

다음은 R의 while 문의 예입니다. R Studio에서이 예를 실행 해보세요.

x = 2 동안 (x<1000) { x=x^2 print(x) } 

산출:

4 16256 65536

그렇다면이 두 문장이 어떻게 다른지 궁금 하시겠죠? 당신의 의심을 제거하겠습니다!
반복문과 while 문의 주요 차이점은 상태에 따라 변경된다는 것입니다. 동안 loop는 기본적으로 문을 실행하기 위해 루프에 들어갈 때를 정의하고 반복 루프는 명령문 실행 후 루프에서 나갈 때를 정의합니다. 따라서이 두 문장을 진입 제어 루프와 종료 제어 루프라고합니다. 그렇기 때문에 while 및 repeat 문이 다릅니다.

  • For 루프 : For 루프는 코드 블록을 여러 번 실행해야 할 때 사용됩니다. 더 나은 이해를 위해 아래 순서도를 참조하십시오.

위의 순서도에서 코드는 다음 단계로 응답합니다.

  1. 우선 루프를 반복 할 횟수를 지정하는 초기화가 있습니다.
  2. 다음으로 상태를 확인합니다. 조건이 참이면 지정된 횟수만큼 코드 세트를 실행합니다.
  3. 조건이 거짓 인 것으로 확인되면 즉시 루프를 종료합니다.

다음은 R의 for 문의 예입니다. R Studio에서이 예를 실행 해보세요.

vtr<- c(7,19,25,65, 45) for( i in vtr) { print(i) } 

출력 :

7 19 25 65 45

다음으로 R Tutorial 블로그의 마지막 명령문, 즉 점프 명령문으로 이동하겠습니다.

R 튜토리얼 : 점프 문

Break 문 : Break 문은 프로그램을 종료하는 데 도움이되고 루프 다음에 나오는 다음 문으로 제어를 재개합니다. 이 문은 스위치 케이스에서도 사용됩니다. 더 나은 이해를 위해 아래 순서도를 참조하십시오.

위의 순서도에서 코드는 다음 단계로 응답합니다.

  1. 먼저 조건을 확인하는 루프에 들어갑니다.
  2. 루프 조건이 거짓이면 루프를 직접 종료합니다.
  3. 조건이 참이면 중단 조건을 확인합니다.
  4. 중단 조건이 참이면 루프에서 존재합니다.
  5. 중단 조건이 거짓이면 루프에 남아있는 문을 실행 한 다음 동일한 단계를 반복합니다.

다음은 R의 jump 문의 예입니다. R Studio에서이 예를 실행 해보세요.

엑스<- 1:5 for (val in x) { if (val == 3){ break } print(val) } 

산출:

[1] 1 [1] 2

다음 진술 : 다음 문은 루프를 종료하지 않고 현재 반복되는 루프를 건너 뛰고 자 할 때 사용됩니다. 다음 문은 다른 프로그래밍 언어의 '계속'과 매우 유사합니다. 더 나은 이해를 위해 아래 순서도를 참조하십시오.

위의 순서도에서 코드는 다음 단계로 응답합니다.

예제가있는 Java의 pojo 클래스
  1. 먼저 조건을 확인하는 루프에 들어갑니다.

  2. 루프 조건이 거짓이면 루프를 직접 종료합니다.

  3. 루프 조건이 참이면 블록 1 문을 실행합니다.

  4. 그 후 '다음'문을 확인합니다. 존재하는 경우 그 이후의 명령문은 루프의 동일한 반복에서 실행되지 않습니다.

  5. 'next'문이 없으면 그 이후의 모든 문이 실행됩니다.

다음은 R의 다음 문의 예입니다. R Studio에서이 예를 실행 해보세요.

for (i in 1:15) {if ((i %% 2) == 0) {다음} print (i)}

출력 :

1 3 5 7 9 11 13 15

이것은 R 튜토리얼 블로그의 끝입니다. 위에서 논의한 모든 개념에 대해 여러분이 명확하게 이해하시기 바랍니다. 계속 지켜봐주세요. 다음 블로그는 R 교육에 관한 것입니다. 여기에서 저는 R의 개념을 ex와 함께 자세히 설명 할 것입니다.앰플.

이제 R의 기본 사항을 이해 했으므로 전 세계에 250,000 명 이상의 만족 한 학습자 네트워크를 보유한 신뢰할 수있는 온라인 학습 회사 인 Edureka에서 R 교육을 통한 Edureka의 데이터 분석은 R 프로그래밍, 데이터 조작, 탐색 적 데이터 분석, 데이터 시각화, 데이터 마이닝, 회귀, 감정 분석에 대한 전문 지식을 습득하고 소매, 소셜 미디어에 대한 실제 사례 연구에 R Studio를 사용하는 데 도움이됩니다.

질문이 있으십니까? 이 'R Tutorial'블로그의 댓글 섹션에 언급 해 주시면 가능한 한 빨리 연락 드리겠습니다.