Tableau에 이미 참여할 수 있는데 왜 블렌딩해야합니까?



Tableau의 데이터 통합-단일 뷰에서 함께 분석하려는 여러 데이터 원본에 관련 데이터가있을 때 사용되는 방법입니다.

하루에 2.5 조 바이트의 데이터를 생성하고 소비하는 세상에서 조직은 최적의 효율성을 달성하기 위해 데이터를 변환하고 결합하는 새로운 방법을 모색해야합니다. 이러한 데이터 결합 방법 중 하나는 Tableau의 데이터 통합 .

이제 이것은 주어진 조직의 데이터주기에서 매우 중요한 목적을 수행하기 때문에 대부분의 조직에서 매우 필수적인 모듈이됩니다. . 이 블로그에서는 다음 개념에 대해 설명합니다.





Tableau에서 데이터 통합이 필요한 이유는 무엇입니까?

당신이 개발자 테이블 Salesforce에 저장된 트랜잭션 데이터와 Access에 저장된 할당량 데이터가있는 사용자 결합하려는 데이터는 서로 다른 데이터베이스에 저장되고 각 테이블에서 캡처 된 데이터의 세분성은 두 데이터 소스에서 다르므로 데이터 통합이이 데이터를 결합하는 가장 좋은 방법입니다.

데이터 통합은 다음 조건에서 유용합니다.



  1. 교차 데이터베이스 조인에서 지원하지 않는 다른 데이터베이스의 데이터를 결합하려고합니다.

    교차 데이터베이스 조인은 큐브 (예 : Oracle Essbase) 또는 일부 추출 전용 연결 (예 : Google Analytics)에 대한 연결을 지원하지 않습니다. 이 경우 분석 할 데이터에 대해 개별 데이터 원본을 설정 한 다음 데이터 통합을 사용하여 데이터 원본을 단일 시트에 결합합니다.

  2. 데이터의 세부 수준이 다릅니다.

    때로는 하나의 데이터 세트가 다양한 세부 수준 즉, 다른 데이터 세트보다 세분화가 크거나 작습니다.

    예를 들어 트랜잭션 데이터 및 할당량 데이터를 분석한다고 가정합니다. 트랜잭션 데이터는 모든 트랜잭션을 캡처 할 수 있습니다. 그러나 할당량 데이터는 분기 수준에서 트랜잭션을 집계 할 수 있습니다. 트랜잭션 값은 각 데이터 세트의 다양한 세부 수준에서 캡처되므로 데이터 통합을 사용하여 데이터를 결합해야합니다.



Tableau의 데이터 통합이란 무엇입니까?

데이터 통합은 다음에서 매우 강력한 기능입니다. . 단일보기에서 함께 분석하려는 여러 데이터 소스에 관련 데이터가있을 때 사용됩니다. 한 데이터 소스의 데이터 테이블을 다른 데이터 소스의 데이터 열로 보완하는 데이터를 결합하는 방법입니다.

일반적으로 조인을 사용하여 이러한 종류의 데이터 결합을 수행하지만 데이터 유형 및 세분성과 같은 요인에 따라 데이터 통합을 사용하는 것이 더 나은 경우가 있습니다.

데이터 결합과 어떻게 다릅니 까?

데이터 혼합은 기존의 왼쪽 조인을 시뮬레이션합니다. 둘의 주요 차이점은 언제 결합은 집계와 관련하여 수행됩니다.

왼쪽 조인

왼쪽 조인을 사용하여 데이터를 결합하면 조인이 수행되는 데이터베이스로 쿼리가 전송됩니다. 왼쪽 조인을 사용하면 왼쪽 테이블의 모든 행과 왼쪽 테이블에서 일치하는 행이있는 오른쪽 테이블의 모든 행이 반환됩니다. 조인 결과는 Tableau로 다시 전송되고 집계됩니다.

예를 들어 다음 테이블이 있다고 가정합니다. 공통 열이 사용자 ID , 왼쪽 조인은 왼쪽 테이블의 모든 데이터와 오른쪽 테이블의 모든 데이터를 가져옵니다. 각 행에는 왼쪽 테이블에 일치하는 행이 있기 때문입니다.

데이터 결합-Tableau의 데이터 통합-Edureka데이터 통합

데이터 통합을 사용하여 데이터를 결합하면 시트에서 사용되는 각 데이터 원본에 대한 쿼리가 데이터베이스로 전송됩니다. 집계 된 데이터를 포함한 쿼리 결과는 Tableau에서 다시 전송되고 결합됩니다. 보기는 연결 필드의 차원을 기반으로 기본 데이터 원본, 왼쪽 테이블 및 보조 데이터 원본, 오른쪽 테이블의 집계 된 행의 모든 ​​행을 사용합니다.

연결 필드를 변경하거나 연결 필드를 더 추가하여 혼합에 보조 데이터 원본의 다른 데이터 행이나 추가 데이터 행을 포함하여 집계 된 값을 변경할 수 있습니다.

예를 들어 다음 테이블이 있다고 가정합니다. 연결 필드가 사용자 ID 두 테이블에서 데이터를 혼합하면 왼쪽 테이블의 모든 데이터를 가져오고 왼쪽 테이블을 오른쪽 테이블의 데이터로 보완합니다. 이 경우 다음과 같은 이유로 모든 값이 결과 테이블의 일부가 될 수는 없습니다.

  • 왼쪽 테이블의 행에는 널값으로 표시된대로 오른쪽 테이블에 일치하는 행이 없습니다.
  • 별표 (*)로 표시된대로 오른쪽 테이블의 행에 여러 해당 값이 있습니다.

위와 동일한 테이블이 있지만 보조 데이터 소스에라는 새 필드가 있다고 가정합니다. 목적 . 다시 말하지만, 연결 필드가 사용자 ID , 데이터를 통합하면 왼쪽 테이블의 모든 데이터를 가져와 오른쪽 테이블의 데이터로 보완합니다. 이 경우 이전 예제와 동일한 null 값과 별표가 다음과 함께 표시됩니다.

  • 때문에 목적 필드가 측정 값이면 행 값이 표시됩니다.목적오른쪽 테이블의 데이터가 왼쪽 테이블의 데이터와 결합되기 전에 집계 된 필드입니다.
  • 이전 예에서와 같이 왼쪽 테이블의 행에는 해당 행이 없습니다. 목적 두 번째 널값으로 표시되는 필드.

가입을 대체하는 경우 블렌딩

1. 데이터를 정리해야합니다.

조인 후 테이블이 서로 올바르게 일치하지 않는 경우 각 테이블에 대한 데이터 원본을 설정하고 필요한 사용자 지정 (즉, 열 이름 변경, 열 데이터 유형 변경, 그룹 생성, 계산 사용 등)을 수행합니다. 그런 다음 데이터 통합을 사용하여 데이터를 결합합니다.

2. 조인으로 인해 데이터가 중복됩니다.

조인 후 중복 데이터는 다양한 세부 수준의 데이터 증상입니다. 중복 데이터가 발견되면 조인을 만드는 대신 데이터 통합을 사용하여 대신 공통 차원을 통합하십시오.

3. 데이터가 많습니다.

일반적으로 조인은 동일한 데이터베이스의 데이터를 결합하는 데 권장됩니다. 조인은 데이터베이스에서 처리되므로 조인이 데이터베이스의 기본 기능 중 일부를 활용할 수 있습니다. 그러나 대규모 데이터 세트로 작업하는 경우 조인은 데이터베이스에 부담을주고 성능에 상당한 영향을 미칠 수 있습니다. 이 경우 데이터 통합이 도움이 될 수 있습니다. Tableau는 데이터가 집계 된 후 데이터 결합을 처리하기 때문에 결합 할 데이터가 더 적습니다. 결합 할 데이터가 적 으면 일반적으로 성능이 향상됩니다.

Tableau에서 데이터 통합

단일 시트에서 함께 분석하려는 별도의 데이터 소스에 데이터가있는 경우 데이터 통합을 사용할 수 있습니다. Tableau에는 샘플 슈퍼마켓샘플 커피 chain.mdb 데이터 통합을 설명하는 데 사용됩니다.

1 단계 : 데이터에 연결하고 데이터 원본 설정

자바에서 토큰은 무엇입니까
  • 데이터 세트에 연결하고 데이터 소스 페이지에서 데이터 소스를 설정하십시오. 나는nbuilt 데이터 소스 샘플 커피 chain.mdb ,MS Access 데이터베이스 파일 인 데이터 혼합을 설명하는 데 사용됩니다.
  • 이동 데이터 > 새로운 데이터 소스, 두 번째 데이터 세트에 연결합니다.이 예에서는 샘플 – 슈퍼마켓 데이터 소스. 티데이터 소스를 설정합니다.
  • 시트 탭을 클릭하여 뷰 작성을 시작하십시오.

2 단계 : 기본 데이터 원본 지정

  • 주 데이터 원본에서 하나 이상의 필드를 뷰로 끌어 주 데이터 원본으로 지정합니다. 에서 데이터 창에서 주 데이터 원본으로 지정할 데이터 원본을 클릭합니다. 이 예에서 샘플 커피 체인 선택됩니다.
  • 다음 스크린 샷은 파일에서 사용할 수있는 다양한 테이블과 조인을 보여줍니다.

3 단계 : 보조 데이터 원본 지정

  • 기본 데이터 원본 또는 활성 링크가 아닌 데이터 원본의 뷰에 사용되는 필드는 자동으로 후속 데이터 원본을 보조 데이터 원본으로 지정합니다. 이 경우 Sample Superstore입니다.

4 단계 : 데이터 통합

  • 이제 공통 차원을 기반으로 두 소스의 데이터를 통합 할 수 있습니다 ( 상태 ,이 경우). 작은 링크 이미지가 차원 (상태) 옆에 나타납니다. 이는 두 데이터 소스 간의 공통 차원을 나타냅니다.
  • 다음을 사용하여 막대 차트를 생성한다고 가정합니다. 이익 비율 컬럼 선반에서 상태 Row Shelf의 차트는 슈퍼마켓과 커피 체인점 모두에서 각 주마다 수익률이 어떻게 다른지 보여줍니다.

Tableau에서 데이터 통합의 제한 사항

  1. 비가 산 집계와 관련된 몇 가지 데이터 혼합 제한이 있습니다. 중앙값 , 및 RAWSQLAGG .
  2. 데이터 혼합은 높은 세분성으로 쿼리 속도를 저하시킵니다.
  3. 혼합 데이터를 사용하는 계산 된 필드를 기준으로 정렬하려고하면 계산 된 필드가 정렬 대화 상자의 필드 드롭 다운 목록에 나열되지 않습니다.
  4. 큐브 데이터 원본은 Tableau에서 데이터를 통합하기위한 주 데이터 원본으로 만 사용할 수 있습니다. 보조 데이터 소스로 사용할 수 없습니다.

여러분 모두에게 공정한 아이디어가 있기를 바랍니다. Tableau의 데이터 통합 이 블로그에서. 더 많은 지식을 원하십니까? 걱정하지 마세요.이 동영상을 통해 개념을 더 잘 이해할 수 있습니다.