SAS 자습서 : SAS에 대해 알아야 할 모든 것



이 SAS Tutorial 블로그에서 SAS 란 무엇입니까? 무엇을 할 수 있으며 SAS가 시장에서 가장 인기있는 분석 도구 중 하나 인 이유를 이해합니다.

질문-SAS Tutorial-EdurekaSAS는 무엇입니까? 왜 SAS를 배워야합니까?의 이점은 무엇입니까 ?위의 질문에 대한 답을 찾고 있습니까? 그렇다면 이것은SAS 튜토리얼귀하의 모든 질문에 답할 것입니다.

우리 인간은 호기심 많은 종 이죠? 우리는 항상 더 많은 것을 알고 싶습니다. 알고 자하는이 열망은 우리로 하여금 더 많은 질문을하게하며, 결과적으로 우리는 더 많은 답변을 주시하게합니다.





간단한 문제를 생각해 봅시다. 쇼핑을하고 싶은데 두 가지 옵션 중에서 선택할 수있는 경우 :

  • $ 149 쿠폰
  • 25 % 할인 쿠폰

어떤 옵션이 더 많이 절약 할 수 있는지 궁금 할 것입니다.이것은 하나의 시나리오입니다. 우리는 그러한 질문이 많고 적절한 결정을 내릴 수없는 다양한 시나리오를 접할 수 있습니다. 이 질문이 당신을 호기심을 유발합니까?답을 찾는 것에 대해? 그렇다면 분석 및 데이터 분석에 도움이되는 도구를 좋아할 것입니다. SAS는 그러한 도구 중 하나입니다.



SAS 튜토리얼

기사가 끝나면 다음 주제에 익숙해 져야합니다.

SAS에 대한 이해가 이해가되지 않으면 불완전합니다. 데이터 분석.그럼 시작하겠습니다.

데이터 분석이란?

“분석”이라는 단어는 한동안 유행 해 왔지만이를 정의 할 수있는 단일 방법은 없습니다. 간단한 예를 들어 분석을 이해해 보겠습니다. 당신이 티셔츠를 사고 싶다고 상상 해보세요. 당신이 생각할 수있는 가능한 질문은 무엇입니까? 몇 가지 일반적인 사항에 대해 도와 드리겠습니다.



  • 언제 티셔츠를 사야하나요?
  • 티셔츠에 얼마를 써야하나요?
  • 티셔츠를 온라인으로 구매해야하나요 아니면 매장을 방문해야하나요?
  • 온라인으로 티셔츠를 구매하기로 결정했다면 어떤 웹 사이트에서 구매해야하나요?
  • 매장을 방문하기로 결정하면 어느 매장을 방문해야하나요?

결정은 시간, 돈, 선호도 및 이전 경험과 같은 요인에 따라 달라질 수 있습니다. 위의 문제를 계속합시다. 다음을 고려하세요:

  • 당신은 일요일에 자유 롭습니다
  • 예산은 $ 300입니다.
  • 티셔츠를 직접 고를 수있는 매장 방문을 선호합니다.
  • 이전 매장 방문이 실망시키지 않았기 때문에 특정 매장을 방문하기로 결정했습니다.

위의 요점을 바탕으로 일요일에 상점을 방문하여 약 $ 265의 비용이 드는 티셔츠를 구입하기로 결정했다고 가정합니다. 몇 가지 가능성을 고려하여 요구 사항에 적합한 것을 선택하고 결정을 내 렸습니다.

간단히 말해서 당신은 티셔츠를 사는 데 도움이되는 일종의 분석을했습니다. 좀 더 단순화하겠습니다. 당신의 두뇌는 여기서 두 가지 간단한 일을했습니다.

  • 귀하의 요구 사항에 따라 수집 된 정보
  • 데이터를 이해하고 그 정보를 바탕으로 티셔츠 구매 결정을 도왔습니다.

이것이 분석을 사용하여 수행 할 수있는 작업입니다. 정보를 수집하고 분석하여 더 나은 결정을 내릴 수 있습니다. 위의 예는쉬운, 몇 가지 가정을 기반으로 결정을 내릴 수 있습니다. 문제와 의사 결정이 이렇게 쉽지 않은 경우에는 어떻게합니까?

비즈니스 관점에서이 문제를 고려하십시오.전자 상거래 회사가 이전 데이터를 기반으로 고객의 구매 패턴을 연구하려고한다고 가정합니다. 회사는 수천 개의 레코드를 고려해야하지 않습니까? 이제 우리가 방금 이야기 한 데이터 또는 회사가 사람들이 가질 수있는 다양한 선호도에 대해 고려할 수있는 순열 및 조합을 상상해보십시오.

또한 회사에 모든 데이터가 없을 수도 있습니다. 예를 들어 고객이 티셔츠를 사지 않았다면 고객이 티셔츠를 사지 않기로 결정한 요인은 무엇입니까? 이 누락 된 데이터는 문제를 일으킬 수 있습니다. 이러한 문제를 어떻게 처리합니까? 그러한 데이터를 어떻게 처리합니까? 잘,이러한 문제는 분석을 사용할 때 더 쉬워집니다. 분석을 사용하면 불필요한 데이터를 제거하고 관련 정보를 최적화하여 더 나은 결정을 내리는 데 도움이되는 패턴을 찾을 수 있습니다.

피보나치 수 C ++

분석 및 이러한 문제를 단순화 할 수있는 많은 도구가 있습니다.눈에 띄는 도구 중 하나는 SAS입니다. 이 SAS Tutorial은 SAS를 이해하고 SAS를 사용하여 문제를 해결하는 데 도움이됩니다.

새로운 업데이트를 받으려면 YouTube 채널을 구독하십시오 ..!

SAS 필요

분석 시장은 지난 몇 년 동안 엄청나게 성장했습니다. 이로 인해 사용되는 도구 수가 증가했습니다. 이 모든 것들은 어떤 식 으로든 유익합니다. 이제 SAS 자습서를 진행하고 시장에서 가장 널리 사용되는 몇 가지 도구를 살펴 보겠습니다.

  • SAS : 상업 분석 시장에서 가장 많이 사용되는 도구입니다. 수많은 통계 기능과 우수한 GUI (Enterprise Guide & Miner)를 통해 확실히 시장을 선도합니다.
  • 아르 자형: 오픈 소스 소프트웨어입니다. R은 잘 문서화되어 있기 때문에 배우기 쉽습니다. 비용 효율적이고 강력한 통계 기능이 있습니다.
  • 파이썬 널리 사용되는 또 다른 오픈 소스 스크립팅 언어입니다. Python 사용량은 시간이 지남에 따라 증가했습니다.오늘날에는 Numpy, Scipy 및 MatPlotLib와 같은 라이브러리가 있습니다. 거의 모든 통계 작업을 수행하거나 이러한 라이브러리를 사용하여 모든 모델을 구축 할 수 있습니다.

SAS 대. R 대. 파이썬

이 SAS 튜토리얼에서이 세 가지 도구를 비교해 보겠습니다. 비교를 위해 다음 매개 변수를 사용하겠습니다.

1) 직업

연구 및 분석에 필수적인 도구이기 때문에 SAS 교육을받은 리소스에 대한 많은 요구 사항을 생성했습니다. SAS는 시장 점유율의 70 %를 차지합니다. R은 15 %를 보유하고 파이썬은 10 % 미만으로 가장 적게 보유합니다.

2) 이해의 용이성

SAS는 배우기 가장 쉬운 도구 중 하나입니다. SQL에 대한 지식이 부족한 사람도 쉽게 배울 수 있습니다. Python은 분석을 위해 SAS만큼 편리하지 않습니다. R은 지루하고 긴 코드를 작성해야하므로 SAS에 우위를 제공합니다.

3) 4 세대 언어

SAS는 4 세대 프로그래밍 언어입니다. 4 세대 프로그래밍 언어는 '상업용 비즈니스 소프트웨어 개발과 같은 특정 목적을 염두에두고 설계된 프로그래밍 언어'입니다. 프로그래밍 노력을 줄이고 소프트웨어 개발에 소요되는 시간과 비용을 최소화하도록 설계되었습니다. R과 Python은 4 세대 언어가 아닙니다.

4) 유연성

SAS는 시장 요구 사항에 지속적으로 업데이트됩니다. 통합이 용이하여 더 유연하고 유용합니다. 이것은 또한 다른 기술과 잘 융합된다는 것을 의미합니다. 진정한 의미에서 유연하게 만듭니다.

위의 이유는 SAS가 시장에서 1 위를 차지하고 있다는 주장을 강력하게 뒷받침합니다.이제이 세 가지 분석 도구를 비교해 보았습니다. 이 SAS 튜토리얼을 통해 SAS를 좀 더 자세히 이해할 수 있습니다.

SAS 자습서 : SAS 란? ?

이제 무엇인지 이해하려고 노력합시다. SAS와 그 기능은 무엇입니까?

SAS는 Statistical Analysis System을 의미합니다. SAS Institute에서 개발 한 소프트웨어 제품군입니다.

SAS 애플리케이션

아래 이미지는 SAS의 몇 가지 응용 프로그램을 보여줍니다.

간단히 말해서 SAS는 복잡한 데이터를 처리하고 조직이 더 나은 결정을 내리거나 가까운 미래에 가능한 결과를 예측하는 데 도움이되는 의미있는 통찰력을 생성 할 수 있습니다.

SAS를 사용하면 다양한 소스에서 데이터를 마이닝, 변경, 관리 및 검색하고 분석 할 수 있습니다.SAS의 그래픽 포인트 앤 클릭 사용자 인터페이스는 비전문 사용자가 그래픽 작업 및 고급 옵션에 해당 기능을 사용할 수 있도록 도와줍니다.

SAS 튜토리얼 | 데이터 분석을위한 SAS 자습서 | Edureka

SAS 구성 요소

SAS 자습서를 진행하고 몇 가지 중요한 SAS 구성 요소를 살펴 보겠습니다.

  • SAS베이스 : 가장 널리 사용되는 구성 요소입니다. 데이터 관리 기능이 있습니다. Base SAS를 사용하여 데이터 분석을 수행 할 수 있습니다.
  • SAS / 그래프 : SAS / Graph를 사용하면 데이터를 그래프로 나타낼 수 있습니다. 따라서 데이터 시각화가 쉬워집니다.
  • SAS / STAT : 분산, 회귀, 다변량, 생존 및 심리 분석과 같은 통계 분석을 수행 할 수 있습니다.
  • SAS / ETS : 시계열 분석에 적합합니다.

이 기사는 입문 기사이므로 Base SAS에 초점을 맞출 것이며 모든 사람이 이해하기 쉬울 것입니다.

전문가로부터 SAS를 배우고 싶으십니까? 지금 등록

프로그래밍 언어로서의 SAS

대부분의 프로그래밍 환경은 메뉴 기반 (포인트 앤 클릭) 또는 명령 기반 (명령 입력 및 실행)입니다. 그러나 SAS는 메뉴 기반이나 명령 기반이 아닙니다. 이는 SAS 프로그램으로 알려진 일련의 명령 또는 명령문을 사용하기 때문입니다. 이 프로그램은 수행하려는 작업을 설명하며 SAS 언어로 작성되었습니다.

데이터

데이터는 모든 데이터 세트의 중심입니다. SAS에서 데이터는 변수가 열 공간을 차지하고 관측치가 행 공간을 차지하는 표 형식으로 제공됩니다.

데이터 유형 :

SAS는 숫자를 숫자 데이터로 취급하고 나머지는 모두 문자 데이터에 속합니다. 따라서 SAS에는 숫자와 문자의 두 가지 데이터 유형이 있습니다. 쉽죠?

DATA 단계 및 PROC 단계는 SAS 프로그램의 기본 구성 요소를 형성합니다. 이러한 빌딩 블록의 역할은이 SAS 자습서에서 논의 할 내용입니다.

SAS의 구성 요소

데이터 단계로 프로그램을 시작하여 SAS 데이터 세트를 생성 한 다음 데이터를 PROC 단계로 전달합니다. PROC 단계는 데이터를 처리합니다. DATA 및 PROC 단계의 작동 방식을 이해하기 위해 아래 예를 고려해 보겠습니다.

인치 단위의 숫자를 센티미터로 변환하고 결과를 'size'라는 변수에 저장하고 인쇄하고 싶다고 가정하면 DATA 단계에서 인치 단위의 숫자를 센티미터로 변환하고 PROC 단계는 결과를 인쇄합니다.

아래 이미지는 위에서 언급 한 문제에 대한 코드 스 니펫을 보여줍니다.

문은 DATA 및 PROC 단계를 구성합니다. 단계의 길이는 하나에서 100 개 이상의 명령문까지 다양합니다. DATA 단계는 데이터를 읽고 수정하는 데 사용되는 반면 PROC 단계는 데이터를 분석하고 유틸리티 기능을 수행하거나 보고서를 인쇄하는 데 사용된다는 것을 기억하는 것이 중요합니다.

DATA 단계는 DATA 키워드로 시작하며 그 뒤에 SAS 데이터 세트에 대해 선택한 이름이옵니다. 위의 DATA 단계가 size라는 데이터 세트를 생성한다는 것이 분명합니다. DATA 단계는 외부 데이터 파일에서 데이터를 읽고 루프 및 case 문을 포함하는 데 사용할 수도 있습니다. 데이터를 병합, 정렬, 결합 및 연결하는 데 사용할 수 있습니다.

마찬가지로 프로시 저는 PROC 문으로 시작합니다. 여기서 키워드 PROC는 사용 된 프로 시저 이름 뒤에옵니다 (예 : 프로 시저 이름은 PRINT, SORT 또는 MEAN 일 수 있음). SAS 프로 시저에는 대부분 몇 가지 가능한 명령문이 있습니다.

SAS가 새 단계 (DATA 또는 PROC 문으로 표시됨)를 발견 할 때마다 이전 단계를 종료하거나 종료하고 새 단계로 시작합니다.

일반적인 프로그램은 데이터를 입력하거나 수정하기 위해 DATA 단계로 시작한 다음 데이터를 PROC 단계로 전달하지만 데이터와 PROC 단계를 혼합하는 유일한 패턴은 아닙니다. 당신이 할 수있는 것처럼스택 빌딩 블록어떤 순서로든 DATA 및 PROC 단계를 어떤 순서로든 정렬 할 수 있습니다. 프로그램에는 DATA 단계 또는 PROC 단계 만 포함될 수도 있습니다.

그럼에도 불구하고 이러한 기본 기능을 이해하면 SAS 프로그램을 작성하는 것이 훨씬 더 쉽습니다. 위에서 언급 한 내용은 모든 SAS 초보자가 알아야 할 몇 가지 기본 사항입니다. SAS 자습서의 다음 부분으로 이동하여 SAS University Edition을 설치하는 방법을 이해하겠습니다.

이제 초보자도 SAS를 배우고 연습 할 수 있습니다. SAS Institute Inc 출시되었습니다 SAS University Edition 무료로 제공됩니다. Base SAS를 배우는 데 필요한 모든 기능은 여기에서 사용할 수 있습니다. Learning Base SAS를 사용하면 다른 구성 요소를 쉽게 배울 수 있습니다.

다음 단계는 SAS University Edition을 설치하는 데 도움이됩니다.SAS 프로그래밍을 실습 할 수있는 소프트웨어입니다.

SAS 자습서 : 설치

SAS University Edition 설치는 쉽습니다. 그러나 가상 머신으로서의 가용성을 위해서는 가상 환경에서 실행해야합니다. SAS 소프트웨어를 실행하기 전에 PC에 가상화 소프트웨어를 설치해야합니다. 다음 단계는 SAS 환경을 다운로드하고 설정하는 데 도움이됩니다.

1) SAS University Edition 다운로드

SAS University Edition은이 링크에서 다운로드 할 수 있습니다. SAS University Edition . 위 링크를 클릭하면 다음과 같은 창이 나타납니다. 다운로드를 시작하기 전에 요구 사항 세부 정보를 읽으십시오.

2) 설치를위한 빠른 시작 가이드

설치 과정에 완전히 익숙하지 않은 사용자는 1 단계에서와 같이 다음 가이드와 비디오를 볼 수 있습니다. 이는 선택 사항이며 이미 익숙한 경우 건너 뛸 수 있습니다.

3) 가상화 소프트웨어 설정

2 단계의 링크를 통해 적합한 가상화 소프트웨어를 다운로드 할 수 있습니다. 가상화 소프트웨어를 이미 설치 한 경우이 단계를 건너 뛸 수 있습니다.

4) Zip 파일 다운로드

SAS University Edition과 호환되는 적절한 버전을 선택하십시오.현재 보유하고있는 가상화 환경으로 zip 파일로 다운로드됩니다. 이름다음과 유사합니다. ‘unvbasicvapp_9411005_vmx_en_sp0_1.zip’

5) Zip 파일 압축 해제

위의 압축 파일의 압축을 풀고 적절한 디렉토리에 저장하십시오.

6) 가상 머신로드

VMware 플레이어를 열고 시작하고 확장자가 .v로 끝나는 파일을 찾습니다.mx를 열고 엽니 다. 다음 화면이 표시됩니다. 참고로 할당 된 메모리 및 하드 디스크 공간과 같은 기본 설정을 기록해 두십시오.

7) 가상 머신 전원 켜기

클릭 이 가상 머신의 전원을 켭니다. 녹색 화살표 표시와 함께 가상 머신을 시작할 수 있습니다. 다음 화면이 나타납니다.

로드하는 동안 다음 화면이 나타납니다. 그런 다음 가상 머신을 실행할 수 있습니다. SAS 환경을 열 URL로 이동하라는 메시지가 표시됩니다.

8) S tarting SAS Studio

브라우저에서 새 탭을 열고 위 이미지에서 강조 표시된 URL을로드하십시오.. SAS 환경이 준비되었음을 나타내는 다음 화면이 나타납니다. 다른 URL을 얻을 수 있습니다.PC마다 다를 수 있습니다.

당신은 스튜디오를 시작할 수 있고 당신은 갈 수 있습니다.

SAS 프로그램 실행

이제 SAS University Edition 설치 방법을 이해 했으므로 SAS Tutorial의 다음으로 샘플 SAS 프로그램을 살펴 보겠습니다.

아래 코드는 피보나치 수열을 인쇄하는 방법을 보여줍니다. 피보나치 수열이 뭔지 모를 경우 정의 해 드리겠습니다.

피보나치 수열은 1 또는 0으로 시작하여 1이 뒤 따르고 각 숫자 (피보나치 숫자라고 함)가 앞의 두 숫자의 합과 같다는 규칙에 따라 진행되는 숫자 세트입니다. 피보나치 수열이 F (n)으로 표시되고 여기서 n은 수열의 첫 번째 항인 경우 다음 방정식은 n = 0에 대한 피보나치 수열을 보여줍니다. 여기서 처음 두 항은 관례에 따라 0과 1로 정의됩니다.

F (0) = 0, 1, 1, 2, 3, 5, 8, 13, 21, 34…

어떤 상황에서는 n = 1을 사용하는 것이 일반적입니다. 이 경우 처음 두 용어는 기본적으로 1과 1로 정의되므로 다음과 같습니다.

F (1) = 1, 1, 2, 3, 5, 8, 13, 21, 34…

1로 시작하는 피보나치 시퀀스를 생성하는이 SAS 코드를 살펴 보겠습니다.

DATA 피보나치 Do i = 1 ~ 10 Fib = Sum (Fib, lag (Fib)) if i = 1 then Fib = 1 output end PROC PRINT Fibonacci Run

위의 코드에서는 다음 숫자를 계산하기 위해 'Fib'이라는 함수를 정의했습니다. Fib은 현재 Fib 번호와 이전 Fib 번호의 합과 같습니다.피보나치번호. lag 함수를 사용하여 마지막 함수를 검색하고 이전 fib 번호의 값을 가져옵니다.

다음 이미지는 위 코드의 출력을 보여줍니다. PROC PRINT 프로 시저를 사용하여 출력을 인쇄 된 형식으로 표시했습니다.

이 SAS 튜토리얼 블로그가 마음에 드셨기를 바랍니다. 이것은 SAS Tutorial 블로그 시리즈의 첫 번째 블로그였습니다. 내 다음 블로그는 SAS 프로그래밍에 관한 것입니다. SAS에서 프로그램을 작성하는 방법을 배우기 위해 읽어보십시오.

SAS를 배우고 분석 분야에서 경력을 쌓으려면 다음을 확인하십시오. 강사 주도의 라이브 교육 및 실제 프로젝트 경험과 함께 제공됩니다.이 교육은 SAS를 깊이있게 이해하고 마스터하는 데 도움이됩니다.SAS 언어의 다양한 개념.

C ++ 피보나치 시리즈

전문가로부터 SAS를 배우고 싶으십니까? 지금 등록

질문이 있으십니까? 의견란에 언급 해 주시면 연락 드리겠습니다.