Informatica 자습서 : Informatica 'Inside Out'이해



이 Informatica 자습서 블로그에서는 Informatica PowerCenter, informatica 아키텍처 및 Informatica에서 도메인을 만드는 방법에 대해 자세히 설명합니다.

지난 블로그에서 실제 응용 프로그램입니다.이제 Informatica, 아키텍처 및 사용 사례에 대한이 Informatica 자습서 블로그에서 자세히 살펴 보겠습니다. 은 다양한 표준, 시스템 및 애플리케이션에서 상호 운용되는 독특하고 편파적이지 않은 데이터 통합 ​​플랫폼이기 때문에 오늘날 시장에서 가장 몰입도가 높은 기술 중 하나입니다.지난 블로그에서 설명했듯이 Informatica PowerCenter는 Informatica의 주력 제품이며 종종 같은 의미로 사용됩니다. 요약하자면 Informatica Powercenter는 모든 규모의 기업 및 정부 조직이 거의 모든 비즈니스 시스템의 데이터를 어떤 형식 으로든 액세스, 검색 및 통합하고 해당 데이터를 모든 속도로 기업 전체에 제공 할 수있는 단일 통합 엔터프라이즈 데이터 통합 ​​플랫폼입니다. . ETL 도구 (추출, 변환 및로드)이며 다른 ETL 도구에 비해 주요 이점은 다음과 같습니다.

  • 강력하며 Windows 및 UNIX 기반 시스템 모두에서 사용할 수 있습니다.
  • 고성능이지만 개발, 유지 및 관리가 매우 간단합니다.

Informatica 자습서 : Informatica PowerCenter 이해

Informatica를 실시간으로 이해하려면 Informatica Architecture 및 Informatica의 기타 구성 요소에 대해 깊이 이해해야합니다. 따라서이 Informatica Tutorial 블로그의 끝에서 다음 내용을 이해할 수 있습니다.





  1. Informatica Architecture 란 무엇입니까?
    1. Informatica의 클라이언트 구성 요소
      1. Informatica PowerCenter 리포지토리 관리자
      2. Informatica PowerCenter 디자이너
      3. PowerCenter 워크 플로 관리자
      4. PowerCenter 워크 플로 모니터
      5. 콘솔 관리자
    2. Informatica의 서버 구성 요소
      1. 리포지토리 서비스
      2. 통합 서비스
      3. SAP BW 서비스
      4. 웹 서비스 허브
  2. Informatica의 데이터 흐름
  3. Informatica 도메인 및 노드
  4. Informatica 서비스 및 서비스 관리자
  5. 사용 사례 : SCD를 사용하여 제품 차원 테이블을로드하는 방법

Informatica Architecture 란 무엇입니까?

Informatica PowerCenter의 아키텍처는 SOA (Service Oriented Architecture) 개념을 기반으로합니다. SOA (서비스 지향 아키텍처)는 서로 통신하는 서비스 그룹으로 정의 할 수 있습니다. 통신 프로세스에는 간단한 데이터 전송이 포함되거나 동일한 활동을 조정하는 둘 이상의 서비스가 포함될 수 있습니다.

Informatica의 개발은 구성 요소 기반 개발 기술을 기반으로합니다. 구성 요소 기반 개발은 특정 기능이있는 미리 정의 된 구성 요소 나 기능 단위 또는 둘 다를 사용하여 최종 제품을 조립하는 기술입니다. PowerCenter는 다른 구성 요소 (변환이라고 함)를 사용하고 필요에 따라 서로 연결하여 소스에서 대상으로의 데이터 흐름을 구축 할 수 있도록함으로써 구성 요소 기반 개발 방법론을 따릅니다. 이에 대한 좋은 방법은 먼저 Informatica의 구성 요소를 이해 한 다음 Informatica를 적용하여 사용 사례를 통해 일반적인 비즈니스 문제를 해결하는 방법을 배우는 것입니다.



따라서 Informatica PowerCenter 도구는 2 개의 구성 요소로 구성됩니다. 그들은:

  • 클라이언트 구성 요소
  • 서버 구성 요소
Informatica-tutorial-Informatica-Architecture

그림 : Informatica 아키텍처 개요

Informatica PowerCenter의 클라이언트 구성 요소 :

  • PowerCenter 리포지토리 관리자 :

리포지토리 관리자는 리포지토리를 관리하는 데 사용됩니다. 사용자 및 그룹을 관리 할 수 ​​있습니다. 저장소 사용자와 사용자 그룹을 생성, 삭제 및 편집 할 수 있습니다. 저장소 권한과 폴더 권한을 할당하고 취소 할 수도 있습니다.



리포지토리 관리자에는 다음 창이 있습니다.

  • 항해자: 리포지토리 관리자, 디자이너 및 워크 플로 관리자에서 만든 모든 개체가 표시됩니다. 먼저 저장소별로 구성한 다음 폴더별로 구성합니다.
  • 본관: 네비게이터에서 선택한 객체의 속성을 제공합니다. 이 창의 열은 네비게이터에서 선택한 객체에 따라 변경됩니다.
  • 산출: 리포지토리 관리자 내에서 실행되는 작업의 출력을 제공합니다.

그림 : 리포지토리 관리자

  • Informatica PowerCenter 디자이너

PowerCenter Designer는 다양한 소스와 대상간에 데이터를 이동하는 방법을 지정하는 클라이언트입니다. 여기에서 변환이라고하는 다양한 PowerCenter 구성 요소를 사용하여 다양한 비즈니스 요구 사항을 해석하고이를 통해 데이터를 전달합니다 (변환). Designer는 소스 정의, 대상 정의 및 변환을 생성하는 데 사용되며 매핑 개발에 더 많이 사용할 수 있습니다.

그림 : Informatica PowerCenter Designer

  • Informatica PowerCenter 워크 플로 관리자

    전체 운영 목적을 달성하도록 설계된 하나 이상의 세션 및 기타 작업의 순서가 지정된 집합입니다. 그것은 전자xecutes는 일련의 매핑 (세션) 및 기타 작업을 수행합니다.

그림 : 워크 플로 관리자

Workflow Manager는 디자이너가 워크 플로를 빌드하고 실행할 수있는 PowerCenter 응용 프로그램입니다. 다음과 같이 열 수 있습니다.

  • 'W'아이콘을 클릭하여 Designer에서 시작할 수 있습니다.
  • 시작> 모든 프로그램> Informatica PowerCenter 9.6.1> 클라이언트> PowerCenter 클라이언트> PowerCenter Workflow Manager 경로에서 독립적으로 열 수 있습니다.
  • 워크 플로 디자이너에서 열 수 있음-워크 플로 개체를 만드는 데 사용하는 도구

그림 : Workflow Manager 인터페이스

워크 플로 관리자는 워크 플로를 만들고 구성하는 데 도움이되는 다음 창을 표시합니다.

  • 여러 저장소 및 폴더에 연결하고 작업 할 수 있습니다. 네비게이터에서 Workflow Manager는 유효하지 않은 개체 위에 빨간색 아이콘을 표시합니다.
  • 작업, 워크 플로 및 워크 릿을 생성, 편집 및 볼 수 있습니다.
  • 여기에는 다양한 유형의 출력 메시지를 표시하는 탭이 있습니다. 출력 창에는 다음 탭이 있습니다.
    • 워크 플로우, worklet 또는 태스크를 저장할 때 메시지를 표시합니다. 저장 탭은 워크 플로 또는 워크 릿을 저장할 때 유효성 검사 요약을 표시합니다.
    • 로그를 가져옵니다. Workflow Manager가 저장소에서 개체를 가져올 때 메시지를 표시합니다.
    • 워크 플로우, worklet 또는 태스크를 검증 할 때 메시지를 표시합니다.
    • 저장소 객체를 복사 할 때 메시지를 표시합니다.
    • 통합 서비스의 메시지를 표시합니다.
    • 리포지토리 서비스의 메시지를 표시합니다.

Informatica 워크 플로 디자이너

Informatica 서버에 대한 세션, 작업 및 Worklet의 실행 순서 및 종속성을 매핑합니다.

그림 : 워크 플로 디자이너

PHP 창을 설치하는 방법
  • 작업 개발자

세션, 쉘 명령 및 이메일 작업을 생성합니다. 태스크 개발자에서 생성 된 태스크는 재사용 가능

  • Worklet 디자이너

작업 집합을 나타내는 개체를 만듭니다. Worklet 개체는 재사용 가능합니다.

Workflow Manager에는 수행하는 작업의 상태를 보여주는 상태 표시 줄도 표시됩니다.

다음 그림은 시작 작업, 링크 및 세션 작업 구성 요소를 포함한 일반적인 워크 플로의 모습을 보여줍니다.

그림 : Workflow Manager의 예

  • Informatica PowerCenter 워크 플로우 모니터

PowerCenter 도구 인 Workflow Monitor는 워크 플로 및 작업 실행을 모니터링하는 데 사용됩니다.

워크 플로 모니터를 사용하여 다음을 수행 할 수 있습니다.

  • Gantt 차트보기 또는 작업보기에서 실행되는 워크 플로 또는 작업에 대한 세부 정보보기
  • 워크 플로 또는 작업 실행, 중지, 중단 및 다시 시작
  • 워크 플로 모니터는 한 번 이상 실행 된 워크 플로를 표시합니다.
  • Workflow Monitor는 통합 서비스 및 리포지토리 서비스에서 지속적으로 정보를 수신합니다. 또한 저장소에서 정보를 가져 와서 기록 정보를 표시합니다.

그림 : 워크 플로 모니터

Informatica Workflow Monitor를 여는 방법 :

Workflow Monitor를 열려면 다음으로 이동하십시오.

시작> 모든 프로그램> lnformatica PowerCenter 9.6.1> 클라이언트> PowerCenter 클라이언트> PowerCenter 워크 플로 모니터

모니터를 열 수도 있습니다.

  • Workflow Manager 네비게이터에서
    • Workflow Manager에서 워크 플로를 실행할 때 Workflow Monitor를 열도록 Workflow Manager를 구성 할 수 있습니다.
    • Designer, Workflow Manager 또는 Repository Manager의 도구> 워크 플로 모니터에서
  • 또는 도구 도구 모음의 워크 플로 모니터 아이콘에서

그림 : 워크 플로 모니터 섹션

  • 컴퓨팅콘솔 관리자

Informatica Administrator 콘솔 (관리자 도구)은 Informatica 도메인 및 Informatica 보안을 관리하기위한 관리 도구입니다.Informatica Administrator 콘솔 (관리자 도구)은 Informatica 설치 후 사용할 수 있습니다.

그림 : Informatica 관리자 콘솔

관리 콘솔은 도메인에서 다음 작업을 수행합니다.

  • 애플리케이션 서비스 관리 : 통합 서비스 및 저장소 서비스를 포함하여 도메인의 모든 애플리케이션 서비스를 관리합니다.
  • 노드 구성 : 백업 디렉터리 및 리소스를 포함한 노드 속성을 구성합니다. 노드를 종료 한 다음 필요할 때 다시 시작할 수 있습니다.
  • 도메인 개체 관리 : 서비스, ​​노드, 라이센스 및 폴더와 같은 개체를 생성하고 관리합니다.
  • 도메인 개체 속성보기 및 편집 : 도메인의 모든 개체에 대한 속성을보고 편집 할 수 있습니다.
  • 보안 관리 작업 : 사용자, 그룹, 역할 및 권한을 관리합니다.
  • 로그 이벤트보기 : 로그 뷰어를 사용하여 도메인, 통합 서비스, SAP BW 서비스, 웹 서비스 허브 및 저장소 서비스의 로그 이벤트를 볼 수 있습니다.

그림 : 관리자 콘솔 인터페이스

SQL Server 통합 서비스 자습서

요컨대 Informatica의 클라이언트 구성 요소는 5 개의 구성 요소 즉, 구성 요소로 구성됩니다. Informatica Repository Manager, Informatica PowerCenter Designer, Informatica Workflow Manager, Informatica Workflow Monitor 및 Informatica Administrator Console. 전체 도구의 거푸집을 형성합니다. 이제 Informatica PowerCenter의 서버 구성 요소를 이해해 보겠습니다.

Informatica PowerCenter의 서버 구성 요소

PowerCenter 서버 구성 요소는 다음 서비스로 구성됩니다.

  • 리포지토리 서비스 : 리포지토리 서비스는 리포지토리를 관리합니다. 저장소 데이터베이스 테이블에 메타 데이터를 검색, 삽입 및 업데이트합니다.
  • 통합 서비스 : 통합 서비스는 세션 및 워크 플로를 실행합니다.
  • SAP BW 서비스 : SAP BW 서비스는 SAP BW의 RFC 요청을 찾고 SAP BW에서 데이터를 추출하거나 SAP BW로 데이터를로드하는 워크 플로를 시작합니다.
  • 웹 서비스 허브 : 웹 서비스 허브는 웹 서비스 클라이언트로부터 요청을 수신하고 PowerCenter 워크 플로를 서비스로 노출합니다.

이제 Informatica의 클라이언트 및 서버 구성 요소를 모두 이해 했으므로 다음 정보 그래픽은 Informatica의 데이터 흐름, 즉 데이터가 처리되는 방식을 설명합니다.

그림 : Informatica의 데이터 흐름

이 시점에서 도메인 및 노드, 서비스 및 서비스 관리자와 같은 Informatica의 다른 기본 단위가 무엇인지 이해하는 것은 매우 논리적입니다. 따라서 Informatica에 대한 실습을 수행하기 전에 잠시 이해해 보겠습니다.

Informatica 도메인 및 노드 :

도메인의 두드러진 특징은 다음과 같습니다.

  • 도메인은 논리적 모음 또는 노드 및 서비스 집합입니다.
  • PowerCenter 도메인은 PowerCenter의 기본 관리 단위입니다.
  • 도메인은 단일 PowerCenter 설치이거나 여러 PowerCenter 설치로 구성 될 수 있습니다.

노드의 두드러진 특징은 다음과 같습니다.

  • 노드는 물리적 시스템의 논리적 표현입니다. 호스트 이름 및 포트 번호와 같은 물리적 속성이 있습니다.
  • 각 노드는 애플리케이션 및 핵심 서비스를 담당하는 서비스 관리자를 실행합니다.
  • 노드는 게이트웨이 노드 또는 작업자 노드 일 수 있지만 하나의 도메인에만 속할 수 있습니다.

그림 : Informatica 도메인 n 노드

Informatica 서비스 및 서비스 관리자 :

서비스는 특화된 기능을 제공하는 리소스입니다. 모든 PowerCenter 프로세스는 노드에서 서비스로 실행됩니다.

Informatica PowerCenter에는 두 가지 유형의 서비스가 있습니다.

  • Application Services는 Repository 및 Integration Services를 포함한 서버 기반 기능을 나타냅니다.
  • 핵심 서비스는 PowerCenter가 작동하는 환경을 관리하고 유지하는 기능을 나타내며 로그 서비스, 라이선싱 서비스 및 도메인 서비스와 같은 서비스를 포함합니다.

서비스 매니저

  • Service Manager는 모든 도메인 작업을 관리하고 도메인 내의 각 노드에서 실행되는 서비스입니다.
  • 게이트웨이 노드에서 서비스 관리자는 다음을 담당합니다.
    • 도메인 제어
    • 도메인에서 실행되는 서비스 관리
    • 서비스 조회 제공
  • 모든 노드에서 Service Manager는 핵심 서비스 및 응용 프로그램 서비스를 제어하기위한 것입니다.

PowerCenter의 다양한 구성 요소가 상호 작용하는 방식 :

그림 : Informatica 구성 요소 상호 작용

사용 사례 : SCD를 사용하여 제품 차원 테이블을로드하는 방법

문제 설명: 우리의 목표는 유효 날짜를 사용하여 SCD (Slowly Changing Dimensions) 유형 2를 사용하여 제품 차원 테이블을로드하는 것입니다.

고객의 고객 ID, 이름, 도시, 주 및 국가 세부 정보를 포함하는 고객 소스 시스템이 주어지면 고객이 다른 값을 가질 때마다 대상 차원 테이블에 새 항목을 만들어야합니다.

이를 더 잘 이해하기 위해 고객이 이미 대상 차원 테이블에있는 값과 다른 주 또는 도시 값을 반환하는 경우 업데이트 된 값으로 새 항목을 만들어야합니다. 이는 SCD 솔루션 기반 대상 테이블을 사용하여 달성됩니다.

다음은 SCD를 사용하여 제품 치수 테이블을로드하는 단계별 프로세스입니다.

1 단계 : PowerCenter Designer를 엽니 다.

2 단계 : 저장소에 연결

그림 : 저장소에 대한 연결 설정

3 단계 : 디자이너 시작

그림 : PowerCenter Designer 시작

4 단계: 데이터베이스에서 소스로드

그림 : 소스 데이터 세트를로드하는 다양한 옵션

5 단계: 데이터베이스에 연결

6 단계 : SCD_INPUT_DATA 테이블 선택

7 단계 : 마찬가지로 데이터베이스에서 대상 세트로드

그림 : 타겟 세트에 대한 다양한 옵션

8 단계 : 아래와 같이 필요한 작업을 수행하는 워크 플로우를 설계합니다.

그림 : 데이터베이스 워크 플로 디자인

9 단계 : Oracle SQL Developer 실행 및로드 SCD_CUSTOMER

그림 : SCD_CUSTOMER 테이블

10 단계 : 고객 Mary 및 Hannah에 대한 상태 값 수정

그림 : Mary의 값 수정

그림 : Hannah의 값 수정

11 단계 : Workflow 모니터 시작 및 워크 플로우 실행

그림 : 워크 플로 실행

그림 : 워크 플로 출력

tableau desktop 9 유자격 준회원

12 단계 : 아래 명령을 실행하여 대상 데이터베이스를 얻습니다.

  • scd_customer_target에서 선택 *

그림 : 대상 출력에 대한 SQL 쿼리 실행

13 단계 : 제품 치수 표 출력

그림 : 제품 치수 표 출력

결론적으로로드 된 제품 테이블에는 현재 값의 변동을 포함하여 데이터의 기록 값이 포함되어 있으며 이는 Informatica PowerCenter를 사용하여 얻은 것입니다.

이 Informatica Tutorial 블로그가 Informatica의 기반을 구축하는 데 도움이되었고 Informatica에 대해 자세히 알아볼 수있는 충분한 관심을 얻었기를 바랍니다.

이미 Informatica를 커리어로 채택하기로 결정한 경우 당사의 코스 페이지. Edureka의 Informatica 인증 교육은 강사 주도의 라이브 세션과 실제 사용 사례를 사용한 실습 교육을 통해 Informatica의 전문가가 될 수 있습니다.

질문이 있으십니까? 의견란에 언급 해 주시면 연락 드리겠습니다.