데이터 과학을위한 SQL : 초보자를위한 원 스톱 솔루션



SQL for Data Science에 대한이 블로그 게시물은 SQL을 사용하여 데이터를 저장, 액세스 및 검색하여 데이터 분석을 수행하는 방법을 이해하는 데 도움이됩니다.

데이터 과학이 시대에 가장 유망한 직업으로 1 위를 차지한 이후로 우리 모두는 . SQL for Data Science에 대한이 블로그 게시물은 SQL을 사용하여 데이터를 저장, 액세스 및 검색하여 데이터 분석을 수행하는 방법을 이해하는 데 도움이됩니다.

다음은 주제 목록입니다. 이 블로그에서 다루는 내용 :





    1. 데이터 과학에 SQL이 필요한 이유는 무엇입니까?
    2. SQL이란?
    3. SQL의 기초
    4. MySQL 설치
    5. 실습

데이터 과학에 SQL이 필요한 이유는 무엇입니까?

매일 2.5 조 바이트가 넘는 데이터를 생성하고 있다는 사실을 알고 계셨습니까? 이러한 데이터 생성 속도는 다음과 같은 고급 기술이 인기를 끌고있는 이유입니다. 데이터 과학 , , 등등.

데이터에서 유용한 통찰력을 도출하는 것을 데이터 과학이라고합니다. 데이터 과학에는 수많은 데이터의 추출, 처리 및 분석이 포함됩니다. 현재 우리에게 필요한 것은 방대한 양의 데이터를 저장하고 관리하는 데 사용할 수 있습니다.



AWS CLI를 여는 방법

데이터 과학이란?-Edureka

여기가 SQL이 들어옵니다.

SQL은 전체 데이터 과학 프로세스를보다 원활하게 수행하기 위해 대량의 데이터를 저장, 액세스 및 추출하는 데 사용할 수 있습니다.



SQL이란?

SQL Structured Query Language를 의미하는 것은 관계형 데이터베이스를 관리하기위한 쿼리 언어입니다.

그러나 관계형 데이터베이스 란 정확히 무엇입니까?

관계형 데이터베이스는 데이터베이스 테이블을 변경하지 않고도 데이터에 액세스, 편집, 업데이트 등을 할 수있는 잘 정의 된 테이블 그룹입니다. SQL은 관계형 데이터베이스의 표준 (API)입니다.

SQL로 돌아 오면 SQL 프로그래밍을 사용하여 데이터베이스 레코드 쿼리, 삽입, 업데이트, 삭제와 같은 데이터에 대한 여러 작업을 수행 할 수 있습니다. SQL을 사용하는 관계형 데이터베이스의 예로는 MySQL 데이터베이스, Oracle 등이 있습니다.

SQL에 대해 자세히 알아 보려면 다음 블로그 :

  1. SQL 데이터 유형 이해 – SQL 데이터 유형에 대해 알아야 할 모든 것
  2. CREATE TABLE in SQL – SQL에서 테이블 생성에 대해 알아야 할 모든 것

SQL 데모를 시작하기 전에 기본 SQL 명령에 대해 알아 봅시다.

SQL의 기초

SQL은 데이터 테이블을 수정하는 간단한 명령 집합을 제공합니다. 몇 가지 기본 SQL 명령을 살펴 보겠습니다.

  • 데이터베이스 생성 – 새 데이터베이스를 만듭니다.
  • 테이블 만들기 – 새 테이블을 만듭니다.
  • 에 집어 넣다 - 데이터베이스에 새 데이터를 삽입합니다.
  • 고르다 - 데이터베이스에서 데이터를 추출합니다.
  • 업데이트 – 데이터베이스의 데이터 업데이트
  • 삭제 – 데이터베이스에서 데이터를 삭제합니다.
  • ALTER DATABASE – 데이터베이스 수정
  • ALTER TABLE – 테이블을 수정
  • 드롭 테이블 – 테이블을 삭제합니다
  • 인덱스 생성 – 요소를 검색하기위한 색인 생성
  • DROP INDEX – 삭제 색인

SQL을 더 잘 이해하기 위해 MySQL을 설치하고 데이터를 다루는 방법을 살펴 보겠습니다.

MySQL 설치

MySQL 설치는 간단한 작업입니다. 여기에 단계별 가이드 시스템에 MySQL을 설치하는 데 도움이됩니다.

설치가 완료되면 MySQL의 경우 데이터를 삽입, 조작 및 수정하는 방법을 보여주는 간단한 데모를 보려면 아래 섹션을 따르십시오.

데이터 과학 용 SQL – MySQL 데모

이 데모에서는 데이터베이스를 만들고 처리하는 방법을 살펴 봅니다. 이것은 SQL에 대한 데이터 분석을 시작하기위한 초급 레벨 데모입니다.

그럼 시작하겠습니다!

1 단계 : SQL 데이터베이스 생성

SQL 데이터베이스는 데이터를 구조화 된 형식으로 저장할 수있는 스토리지웨어 하우스입니다. 이제 다음을 사용하여 데이터베이스를 만들어 보겠습니다. MySQL :

데이터베이스 생성 edureka edureka 사용

위의 코드에는 두 가지 SQL 명령이 있습니다.

노트 : SQL 명령은 대문자로 정의되며 세미콜론은 SQL 명령을 종료하는 데 사용됩니다.

  1. CREATE DATABASE :이 명령은‘edureka’라는 데이터베이스를 생성합니다.

  2. USE :이 명령은 데이터베이스를 활성화하는 데 사용됩니다. 여기서는‘edureka’데이터베이스를 활성화합니다.

2 단계 : 필수 데이터 기능이있는 테이블 만들기

테이블 생성은 데이터베이스 생성만큼 간단합니다. 각각의 데이터 유형으로 테이블의 변수 또는 기능을 정의하기 만하면됩니다. 이 작업을 수행하는 방법을 살펴 보겠습니다.

CREATE TABLE 장난감 (TID INTEGER NOT NULL PRIMARY KEY AUTO_INCREMENT, Item_name TEXT, Price INTEGER, Quantity INTEGER)

위의 코드 조각에서 다음과 같은 일이 발생합니다.

  1. 'CREATE TABLE'명령을 사용하여 toys라는 테이블을 만듭니다.
  2. 장난감 테이블에는 TID (트랜잭션 ID), Item_name, Price 및 Quantity의 4 가지 기능이 있습니다.
  3. 각 변수는 해당 데이터 유형으로 정의됩니다.
  4. TID 변수는 기본 키로 선언됩니다. 기본 키는 기본적으로 고유 한 값을 저장할 수있는 변수를 나타냅니다.

다음 명령을 사용하여 정의 된 테이블의 세부 정보를 추가로 확인할 수 있습니다.

DESCRIBE 장난감

aws cli에 액세스하는 방법

3 단계 : 테이블에 데이터 삽입

이제 표를 만들었으므로 몇 가지 값으로 채워 보겠습니다. 이 블로그의 앞부분에서 INSERT INTO와 같은 단일 명령을 사용하여 테이블에 데이터를 추가하는 방법을 언급했습니다.

이것이 어떻게 이루어지는 지 보겠습니다.

장난감 값에 삽입 (NULL, '기차', 550, 88) 장난감 값에 삽입 (NULL, 'Hotwheels_car', 350, 80) 장난감 값에 삽입 (NULL, 'Magic_Pencil', 70, 100) 장난감 값에 삽입 ( NULL, 'Dog_house', 120, 54) INSERT INTO toys VALUES (NULL, 'Skateboard', 700, 42) INSERT INTO toys VALUES (NULL, 'GI Joe', 300, 120)

위의 코드 스 니펫에서는 INSERT INTO 명령을 사용하여 6 개의 관측치를 '장난감'테이블에 삽입했습니다. 각 관찰에 대해 대괄호 안에 테이블을 생성하는 동안 정의 된 각 변수 또는 특성의 값을 지정했습니다.

TID 변수는 1부터 자동 증가하므로 NULL로 설정됩니다.

이제 테이블에있는 모든 데이터를 표시하겠습니다. 아래 명령을 사용하여 수행 할 수 있습니다.

장난감에서 * 선택


4 단계 : 데이터 항목 수정

G.I의 가격을 올리기로 결정했다고 가정 해 보겠습니다. Joe는 많은 고객을 확보하고 있기 때문입니다. 데이터베이스에서 변수의 가격을 어떻게 업데이트 하시겠습니까?

간단합니다. 아래 명령을 사용하면됩니다.

업데이트 장난감 세트 가격 = 350 WHERE TID = 6

UPDATE 명령을 사용하면 테이블에 저장된 값 / 변수를 수정할 수 있습니다. SET 매개 변수를 사용하면 특정 기능을 선택할 수 있으며 WHERE 매개 변수는 변경하려는 변수 / 값을 식별하는 데 사용됩니다. 위의 명령에서 TID가 6 (G.I. Joe) 인 데이터 항목의 가격을 업데이트했습니다.

이제 업데이트 된 테이블을 보겠습니다.

장난감에서 * 선택

보려는 열을 참조하여 표시 할 내용을 수정할 수도 있습니다. 예를 들어, 아래 명령은 장난감 이름과 해당 가격 만 표시합니다.

장난감에서 Item_name, 가격 선택

5 단계 : 데이터 검색

따라서 데이터를 삽입하고 수정 한 후에는 마침내 비즈니스 요구 사항에 따라 데이터를 추출하고 검색 할 때입니다. 여기에서 추가 데이터 분석 및 데이터 모델링을 위해 데이터를 검색 할 수 있습니다.

코드에서 Java 프로그램을 중지하는 방법

SQL을 시작하는 간단한 예이지만 실제 시나리오에서는 데이터가 훨씬 더 복잡하고 크기가 큽니다. 그럼에도 불구하고 SQL 명령은 여전히 ​​동일하게 유지되므로 SQL을 매우 간단하고 이해하기 쉽게 만듭니다. 간단한 SQL 명령 세트로 복잡한 데이터 세트를 처리 할 수 ​​있습니다.

이제 몇 가지 수정을 통해 데이터를 검색해 보겠습니다. 아래 코드를 참조하고 출력을 보지 않고 무엇을하는지 이해해보십시오.

SELECT * from toys LIMIT 2

당신은 그것을 짐작했습니다! 내 테이블에있는 처음 두 관측 값을 표시합니다.

더 흥미로운 것을 시도해 봅시다.

선택 * 장난감에서 가격 별 주문 ASC

그림과 같이 가격 변수의 오름차순에 따라 값이 정렬됩니다. 가장 많이 구매하는 세 가지 항목을 찾고 싶다면 어떻게 하시겠습니까?

정말 간단합니다!

선택 * 장난감에서 수량 별 주문 DESC LIMIT 3

한 번 더 해보겠습니다.

선택 * 장난감에서 가격> 400 가격 별 주문 ASC


이 쿼리는 가격이 400 이상인 장난감의 세부 정보를 추출하고 가격의 오름차순으로 출력을 정렬합니다.

이것이 SQL을 사용하여 데이터를 처리하는 방법입니다. 이제 데이터 과학을위한 SQL의 기본 사항을 알았으므로 자세한 내용이 궁금하실 것입니다. 다음은 시작하는 데 도움이되는 몇 가지 블로그입니다.

  1. 데이터 과학이란? 데이터 과학에 대한 초보자 가이드
  2. MySQL 자습서 – MySQL 학습을위한 초보자 가이드

인공 지능 및 기계 학습에 대한 전체 과정에 등록하려는 경우 Edureka는 특별히 선별 된 지도 학습, 비지도 학습 및 자연어 처리와 같은 기술에 능숙해질 것입니다. 여기에는 딥 러닝, 그래픽 모델 및 강화 학습과 같은 인공 지능 및 기계 학습의 최신 발전 및 기술 접근 ​​방식에 대한 교육이 포함됩니다.