Informatica 혁신 : Informatica PowerCenter의 핵심



Informatica Transformations가 무엇인지 완전히 이해하고 사용 사례를 통해 다양한 주요 Informatica 변환에 대한 통찰력을 얻으십시오.

Informatica Transformations는 테이블, 파일 또는 필요한 기타 대상과 같은 정의 된 대상 구조에 데이터를 읽거나 수정하거나 전달할 수있는 리포지토리 개체입니다. 변환은 기본적으로 데이터 흐름과 데이터가 대상에로드되는 방식을 정의하는 규칙 집합을 나타내는 데 사용됩니다. Informatica PowerCenter는 각각 특정 기능을 제공하는 여러 변환을 제공합니다.또한 Informatica가 데이터 통합 ​​플랫폼에서 오늘날의 시장을 선도하고있는 Informatica Transformations는 .

Informatica Transformations를 더 잘 이해하려면 먼저 매핑이란 무엇입니까? 매핑은 일련의 변환으로 함께 연결된 소스 및 대상 개체의 모음입니다. 따라서 매핑의 변환은 워크 플로를 실행하는 동안 통합 서비스가 데이터에 대해 수행 할 작업을 나타냅니다. 워크 플로우에 대해 더 잘 이해하려면 블로그를 확인하십시오. Informatica 자습서 : 워크 플로 관리





다양한 Informatica 변환이란 무엇입니까?

Informatica 변환은 주로 두 가지 범주로 분류 할 수 있습니다. 첫 번째는 서로 변환의 연결 (매핑 연결)을 기반으로하고 두 번째는 소스와 대상 사이의 전체 행 수의 변화를 기반으로합니다. 연결을 기반으로 한 Informatica 변환부터 살펴 보겠습니다.

1) 연결을 기반으로 한 Informatica의 변환 유형 :



자바에서 프로그램을 종료하는 방법
  • 연결된 변환.
  • 연결되지 않은 변환.

Informatica에서 하나 이상의 변환에 연결된 변환을 연결된 변환 .

연결된 변환은 모든 입력 행에 대해 변환이 호출되고 값을 반환 할 것으로 예상 될 때 사용됩니다. 예를 들어 연결된 조회 변환을 사용하여 조회 식에 부서 ID를 지정하여 특정 부서에서 근무하는 모든 직원의 이름을 알 수 있습니다.

주요 연결된 Informatica 변환 중 일부는 Aggregator, Router, Joiner, Normalizer 등입니다.



다른 변환과 연결되지 않은 변환을 연결되지 않은 변환 .이들의 기능은 표현식 변환과 같은 다른 변환 내에서 호출하여 사용됩니다. 이러한 변환은 매핑 파이프 라인의 일부가 아닙니다.

연결되지 않은 변환은 특정 조건에서만 해당 기능이 필요한 경우에 사용됩니다.예를 들어, 프로그래머는 데이터에 대해 복잡한 작업을 수행하고 싶지만이 작업을 수행하기 위해 식 또는 필터 변환과 같은 Informatica 변환을 사용하지 않으려 고합니다. 이 경우 작업을 수행하고 외부 프로 시저 변환에서 호출하는 코드로 외부 DLL 또는 UNIX 공유 라이브러리를 만들 수 있습니다.

Informatica 변환에는 3 가지가 있습니다. 유효한 매핑으로 연결 해제 할 수있는 외부 프로 시저, 조회 및 저장 프로 시저 (통합 서비스가 실행할 수있는 매핑)

2) 행 수 변경에 따른 Informatica 변환 유형

  • 능동적 변환
  • 수동적 변환

능동적 변환 :– 활성 변환은 다음 작업 중 하나를 수행 할 수 있습니다.

  • 변환을 통과하는 행 수 변경 : 예를 들어 필터 변환은 필터 조건을 충족하지 않는 행을 제거하기 때문에 활성화됩니다.
  • 트랜잭션 경계 변경 : 트랜잭션 경계는 커밋이 호출되기 전이나 두 커밋 호출 사이의 모든 트랜잭션을 둘러싸는 경계입니다. 예를 들어, 트랜잭션 작업 중에 사용자는 특정 트랜잭션 후에 커밋이 필요하다고 느끼고 commit 명령을 호출하여 저장 점을 만들고 그렇게함으로써 사용자가 기본 트랜잭션 경계를 변경합니다. 기본적으로 트랜잭션 경계는 자동 커밋 지점 또는 EOF에 대한 파일 시작 사이에 있습니다.
  • rowtype 속성 변경 : Rowtype 속성은 테이블의 행을 나타내는 레코드 유형입니다. 레코드는 테이블에서 선택한 전체 데이터 행을 저장하거나 포인터 또는 포인터 변수에서 가져올 수 있습니다. 예를 들어 업데이트 전략 변환은 행 유형을 값 삽입의 경우 0, 업데이트의 경우 1, 삭제의 경우 2 또는 거부의 경우 3으로 플래그 지정합니다.
  • Aggregator, Filter, Joiner, Normalizer 등은 Active 변환의 몇 가지 예입니다.

패시브 변환 : 수동 변환은 다음 조건을 모두 충족하는 변환입니다.

  • 변환 전후의 행 수는 동일합니다.
  • 트랜잭션 경계를 유지합니다.
  • rowtype 속성을 유지합니다.
  • Expression, ExternalProcedure, HTTP 등은 수동 변환의 몇 가지 예입니다.

수동 변환에서는 새 행이 작성되지 않거나 기존 행이 삭제됩니다.

행 수를 변경하지 않는 경우 수동 변환이 사용되는 이유가 궁금 할 것입니다. 일반적으로 값을 업데이트하고 공유 라이브러리에서 외부 프로 시저를 호출하며 맵렛의 입력 및 출력을 정의하는 데 사용됩니다. 맵렛은 매핑의 변환 만 모은 것입니다. 예를 들어 학생 데이터베이스의 경우 마크 열의 값을 백분율 대신 백분위 수로 업데이트하려는 경우 값을 변환하고 전체 행 수를 동일하게 유지하는 동일한 열에서 업데이트하는 표현식 변환을 사용하여 수행 할 수 있습니다. 변형 후.

변환이 수동 변환으로 사용되는 경우 나중에 활성 변환으로 사용할 수 없다는 제한이 없습니다. 마찬가지로 연결되지 않은 변환은 필요에 따라 연결된 변환으로 사용할 수 있습니다. 이러한 범주간에 가능한 모든 조합을 형성 할 수 있으며 이것이 Informatica 변환의 마법입니다. 이 블로그 뒷부분에서 변환이 속할 수있는 가능한 유형에 대한 더 나은 아이디어를 얻을 수 있습니다.

다양한 유형의 Informatica 변환에 대해 이해 했으므로 이제 살펴 보겠습니다.다음은 몇 가지 주요 Informatica 변환 유형입니다.

변환 유형 기술
어 그리 게이터활성 연결집계 계산을 수행합니다.
표현수동 연결값을 계산합니다.
자바활성 연결 또는 수동 연결Java로 코딩 된 사용자 로직을 실행합니다. 사용자 로직의 바이트 코드는 저장소에 저장됩니다.
결합 자활성 연결다른 데이터베이스 또는 플랫 파일 시스템의 데이터를 결합합니다.
조회활성 연결됨 또는 수동 연결됨 또는 활성 연결되지 않음 또는 수동 연결되지 않음플랫 파일, 관계형 테이블, 뷰 또는 동의어에서 데이터를 조회하고 반환합니다.
노멀 라이저활성 연결파이프 라인에서 관계형 또는 플랫 파일 소스의 데이터를 정규화하는 데 사용됩니다.
계급활성 연결레코드를 최고 또는 최저 범위로 제한합니다.
라우터활성 연결그룹 조건에 따라 데이터를 여러 변환으로 라우팅합니다.
SQL활성 연결 또는 수동 연결데이터베이스에 대해 SQL 쿼리를 실행합니다.
노동 조합활성 연결다른 데이터베이스 또는 플랫 파일 시스템의 데이터를 병합합니다.
XML 생성기활성 연결하나 이상의 입력 포트에서 데이터를 읽고 단일 출력 포트를 통해 XML을 출력합니다.
XML 파서활성 연결하나의 입력 포트에서 XML을 읽고 하나 이상의 출력 포트로 데이터를 출력합니다.
XML 소스 한정자활성 연결통합 서비스가 세션을 실행할 때 XML 소스에서 읽는 행을 나타냅니다.

이제 변환을 하나씩 살펴 보겠습니다.

집계 변환

집계 변환은 활성 및 연결된 변환입니다. 이 Informatica 변환은 평균 및 합계와 같은 계산을 수행하는 데 유용합니다 (주로 여러 행 또는 그룹에서 계산을 수행하기 위해). 예를 들어, 총 일일 판매 수를 계산하거나 월간 또는 연간 판매의 평균을 계산합니다. AVG, FIRST, COUNT, PERCENTILE, MAX, SUM 등과 같은 집계 함수를 집계 변환에 사용할 수 있습니다.

조회 변환

조회 변환은 가장 널리 사용되고 널리 사용되는 Informatica 변환입니다. 사용자의 요구 사항에 따라 조회 변환은 Active 또는 Passive 변환으로 결합 된 Connected 또는 Unconnected 변환으로 사용할 수 있습니다. 나는t는 관련 필수 데이터를 얻기 위해 주로 소스, 소스 한정자 또는 대상에서 세부 정보를 조회하는 데 사용됩니다. 또한‘플랫 파일’,‘관계형 테이블’,‘보기’또는‘동의어’를 찾을 수도 있습니다. 하나의 매핑에서 여러 조회 변환을 사용할 수 있습니다.

조회 변환은 다음 유형의 포트 (정보 전송을위한 논리적 포인트)로 생성됩니다.

  • 입력 포트 (I)
  • 출력 포트 (O)
  • 포트 조회 (L)
  • 리턴 포트 (R) (연결되지 않은 조회의 경우에만)

연결 및 연결되지 않은 조회 변환의 차이점 :

  • 연결된 조회는 매핑 파이프 라인에서 직접 입력 값을 수신하는 반면 연결되지 않은 조회는 조회에서 값을 수신합니다. 다른 변형에서 표현. Informatica의 매핑에는 소스, 변환 및 함께 연결된 대상이 포함될 수 있으며 파이프 라인으로 간주됩니다.
  • 연결된 조회는 여러 반환 포트가있는 동일한 행에서 여러 열을 반환합니다.에스연결되지 않은 조회에는 반환 포트가 하나만 있으며 각 행에서 하나의 열을 반환합니다. 예를 들어, 특정 부서 ID에 대해 직원 데이터베이스에서 연결된 조회를 매개 변수로 사용하면 이름, 직원 ID 번호, 주소 등과 같이 해당 부서의 직원과 관련된 모든 세부 정보를 얻을 수 있습니다. 연결되지 않은 조회는 이름, 직원 ID 번호 또는 사용자가 지정한 속성과 같은 직원의 속성 하나만 가져올 수 있습니다.
  • 연결된 조회는 모든 조회 열을 캐시하는 반면 연결되지 않은 조회는 조회 출력 및 조회 조건 만 캐시합니다.
  • 연결된 조회는 사용자 정의 기본값을 지원하지만 연결되지 않은 조회는 사용자 정의 값을 지원하지 않습니다. 예를 들어, 조회 후 특정 열의 모든 값을 NULL로 변경하려는 경우 조회 표현식에서 해당 열의 기본값을 NULL로 설정할 수 있습니다. 그러나 연결되지 않은 조회의 경우에는이 기능을 사용할 수 없습니다.

고객 데이터베이스에서 취소되지 않은 송장이 2 개 이상있는 고객의 세부 정보를 알고 싶습니다. 이 데이터를 얻기 위해 조회 변환을 사용할 수 있습니다.

단계는 다음과 같습니다.

  1. Invoice 테이블을 소스로 매핑 디자이너에로드하여 시작합니다. 소스 데이터를 Designer에로드하는 방법이 명확하지 않은 경우 여기를 클릭하세요 . 조회 소스 정보 변환 -edureka
  2. 이제 취소되지 않은 송장을 필터링 해 보겠습니다. 이렇게하려면 이름이 지정된 새 필터를 만듭니다. fil_ODS_CUSTOMER_ACTIVE 속성이있는 소스 한정자에 NOT (ISNULL (DATE_CLOSED)) 및 CANCELED = 0.
  3. 이제 아래와 같이 이름을 사용하여 디자이너에서 조회 변환을 추가합니다. lkp_CUSTOMER :

  4. 조회 테이블을 고객 테이블로 지정하십시오.
  5. 헤더를 두 번 클릭하십시오. lkp_CUSTOMER 편집 메뉴를 엽니 다. 조건 탭에서 조회 조건을 다음과 같이 설정하십시오. CUST_ID = CUST_NO.
  6. 속성 탭에서 연결 정보를 $ 소스 그리고 클릭 확인 변환을 저장하려면 :
  7. 링크 lkp_CUSTOMER 포트 ODS_CUSTOMER_ACTIVE 필요한 변환을 완료하기위한 포트 ODS_CUSTOMER_ACTIVE 필수 대상 파일입니다.
  8. 조회 변환을 포함하는 최종 아이콘 맵은 다음과 같아야합니다.

식 변환

식 변환은 수동적이고 연결된 Informatica 변환입니다. 식 변환은 행 방식 조작에 사용됩니다. 개별 레코드에 대해 수행하려는 모든 유형의 조작에 대해 식 변환을 사용합니다. 식 변환은 행 방식 데이터를 받아들이고 조작 한 다음 대상에 전달합니다. 예를 들어, 각 제품의 할인을 계산하거나 성과 이름을 연결하거나 날짜를 문자열 필드로 변환합니다.

결합 자 변환

조이너 변환은 유형이 다른 두 소스를 결합하는 데 사용되는 활성 및 연결된 Informatica 변환입니다. 조이너 변환은 두 소스간에 하나 이상의 열 쌍과 일치하는 지정된 조건을 기반으로 소스를 조인합니다. 두 개의 입력 파이프 라인에는 마스터와 세부 파이프 라인 또는 분기가 포함됩니다. 두 개 이상의 소스를 결합하려면 결합 자 변환의 출력을 다른 소스와 결합해야합니다. 매핑에서 n 개의 소스를 조인하려면 n-1 조이너 변환이 필요합니다. 조이너 변환은 다음 유형의 조인을 지원합니다.
  • 표준
  • 마스터 아우터
  • 세부 외부
  • 전체 외부
표준 join은 조건에 따라 일치하지 않는 마스터 및 세부 정보 소스의 모든 데이터 행을 삭제합니다. 마스터 아우터 조인은 마스터 소스에서 일치하지 않는 모든 행을 삭제하고 세부 소스의 모든 행과 마스터 소스의 일치하는 행을 유지합니다. 디테일 아웃 r 조인은 마스터 소스의 모든 데이터 행과 세부 소스의 일치하는 행을 유지합니다. 상세 소스에서 일치하지 않는 행을 버립니다. 전체 외부 join은 마스터 및 세부 소스 모두의 모든 데이터 행을 유지합니다.

단일 결합자를 사용하여 두 개 이상의 소스를 결합 할 수 없습니다. 세 개의 소스를 결합하려면 두 개의 결합 자 변환이 필요합니다.

Joiner를 사용하여 직원, 부서 및 위치의 세 테이블을 조인하려고한다고 가정 해 보겠습니다. 두 명의 조이너가 필요합니다. Joiner-1이 합류하고, Employees와 Departments, Joiner-2가 Joiner-1과 Locations 테이블의 출력에 합류합니다.

단계는 다음과 같습니다.

  1. 세 가지 소스를 매핑 디자이너로 가져옵니다.
  2. Joiner -1을 작성하여 Department_ID를 사용하여 직원 및 부서를 결합하십시오.

  3. 다음 결합자인 Joiner-2를 만듭니다. Joiner-1의 출력과 Locations Table의 포트를 가져와 Joiner-2로 가져옵니다. Location_ID를 사용하여이 두 데이터 소스를 결합합니다.
  4. 마지막 단계는 필요한포트Joiner-2에서 타겟으로 또는 표현식을 통해변환대상 테이블에.

유니온 변환

통합 변환은 활성 및 연결된 Informatica 변환입니다. 다양한 스트림 또는 파이프 라인의 여러 데이터 세트를 하나의 데이터 세트로 병합하는 데 사용됩니다. 이 Informatica 변환은 SQL의 UNION ALL 명령과 유사하게 작동하지만 중복 행을 제거하지는 않습니다. 어 그리 게이터를 사용하여 대상에서 예상되지 않는 중복을 제거하는 것이 좋습니다.

노멀 라이저 변환

노멀 라이저 변환은 활성 및 연결된 Informatica 변환입니다. 대부분의 시간 데이터가 비정규 화 된 형식으로 저장되는 COBOL 소스와 함께 가장 널리 사용되는 Informatica 변환 중 하나입니다. 또한 노멀 라이저 변환을 사용하여 단일 데이터 행에서 여러 행을 만들 수 있습니다.

플랫 파일 / Cobol 소스에서 쉼표로 구분 된 데이터 플랫 파일을로드 해 보겠습니다.

단계는 다음과 같습니다.

  1. 먼저 상점 이름과 분기 별 수익이 포함 된 상점 (플랫 파일)을로드합니다.
  2. 이름이 지정된 새 노멀 라이저 변환을 만듭니다. NRM_STORE_EXP 다음과 같이 두 개의 포트 Store 및 Quarter (4 분기에 대한 데이터가 있으므로 4 번 반복) :
  3. 포트 탭은 아래와 같습니다.
  4. 다음 열을 복사 / 연결하고 Normalizer Transformation에 연결합니다.
    저장
    Quarter1
    Quarter2
    3 분기
    4 분기
    매핑은 다음과 같아야합니다.
  5. 다음을 사용하여 새 식 변환 만들기 exp_STORE . 다음 열을 복사 / 연결하고 아래와 같이 Expression Transformation에 연결합니다.
    저장
    쿼터
    GK_QUARTER
    GCID_QUARTER
  6. 정규화 변환을 사용하여 매핑을 완료하려면 식을 최종 대상에 연결합니다.

XML 변환

XML 변환은 활성 및 연결된 Informatica 변환입니다. Informatica 변환에서 XML 변환은 주로 소스 파일이 XML 유형이거나 데이터가 XML 유형 인 경우에 사용됩니다. XML 변환은 주로 세 가지 변환으로 분류 할 수 있습니다.

  • XML 소스 한정자 변환.
  • XML 파서 변환.
  • XML 생성기 변환.

XML 소스 한정자 변환 : XML 소스 한정자는 활성 및 연결된 변환입니다. XML 소스 한정자는 XML 소스 정의에만 사용됩니다. Informatica 서버가 XML 소스로 세션을 실행할 때 읽는 데이터 요소를 나타냅니다. XML 소스 규정 자에는 소스의 모든 열에 대해 하나의 입력 또는 출력 포트가 있습니다. 매핑에서 XML 소스 정의를 제거하면 Designer는 해당 XML 소스 한정자 변환도 제거합니다.

XML 파서 변환 : XML 파서 변환은 활성 및 연결된 변환입니다. XML 파서 변환은 파이프 라인 내에서 XML을 추출한 다음이를 대상으로 전달하는 데 사용됩니다. XML은 파일 또는 데이터베이스와 같은 소스 시스템에서 추출됩니다. XML 구문 분석기 변환은 단일 입력 포트에서 XML 데이터를 읽고 하나 이상의 출력 포트에 데이터를 씁니다.

XML 생성기 변환 : XML 생성기는 활성 및 연결된 변환입니다. XML 생성기 변환은 파이프 라인 내에서 XML을 만드는 데 사용됩니다. XML 생성기 변환은 하나 이상의 입력 포트에서 데이터를 읽고 단일 출력 포트를 통해 XML을 출력합니다.

순위 변환

순위 변환은 활성 및 연결 변환입니다. 데이터의 상위 또는 하위 순위를 선택하는 데 도움이되는 Informatica 변환입니다. 예를 들어 판매량이 매우 높은 상위 10 개 지역을 선택하거나 최저 가격 제품 10 개를 선택합니다.

내 직원 데이터베이스의 대상 테이블에 첫 번째와 마지막 레코드를로드하려는 경우를 고려하십시오.이 아이디어는 레코드에 시퀀스 번호를 추가 한 다음 레코드에서 상위 1 순위와 하위 1 순위를 가져 오는 것입니다.

  1. 소스 한정자에서 두 개의 순위 변환으로 포트를 끌어다 놓습니다.
  2. 시작 값이 1 인 재사용 가능한 시퀀스 생성기를 만들고 다음 값을 두 순위 변환에 연결합니다.
  3. 다음과 같이 순위 속성을 설정합니다. 새로 추가 된 시퀀스 포트를 Rank Port로 선택해야합니다. Group by Port.Rank – 1로 포트를 선택할 필요가 없습니다.
  4. 순위 – 2
  5. 대상의 두 인스턴스를 만듭니다.출력 포트를 대상에 연결합니다.

라우터 변환

라우터는 활성 및 연결된 변환입니다. 필터 변환과 유사합니다. 유일한 차이점은 필터 변환은 조건을 충족하지 않는 데이터를 삭제하는 반면 라우터에는 조건을 충족하지 않는 데이터를 캡처하는 옵션이 있다는 것입니다. 여러 조건을 테스트하는 데 유용합니다. 입력, 출력 및 기본 그룹이 있습니다.

테이블의 홀수 및 짝수 레코드를 분리하려는 경우 라우터 변환을 사용하여 수행 할 수 있습니다.

아이디어는 레코드에 시퀀스 번호를 추가 한 다음 레코드 번호를 2로 나누는 것입니다. 나눌 수있는 경우 짝수 대상으로 이동하고 그렇지 않은 경우 홀수 대상으로 이동합니다.

  1. 소스를 끌어서 식 변환에 연결합니다.
  2. 시퀀스 생성기의 다음 값을 식 변환에 추가합니다.
  3. 식 변환에서 두 포트를 만듭니다. 하나는 '홀수'이고 다른 하나는 '짝수'입니다.
  4. 다음과 같이 표현식을 작성하십시오.
  5. 라우터 변환을 식에 연결합니다.
  6. 라우터 변환 아래에 두 그룹을 만듭니다.
  7. 아래와 같은 조건을 부여하십시오.
  8. 그런 다음 두 그룹을 다른 대상으로 보냅니다. 이것이 전체 흐름입니다.

이 Informatica Transformation 블로그가 다양한 Informatica 변환에 대한 이해를 높이는 데 도움이되었고 Informatica에 대해 자세히 알아볼 수있는 충분한 관심을 얻었기를 바랍니다.

AWS CLI 사용 방법

이 블로그가 도움이 되었다면 Informatica Tutorial 블로그 시리즈를 확인하십시오. 과 Informatica 자습서 : Informatica 'Inside Out'이해 .Informatica 인증에 대한 자세한 내용은 당사 블로그를 참조하십시오. Informatica 인증 : 알아야 할 모든 것 .

이미 Informatica를 커리어로 채택하기로 결정한 경우 당사의 코스 페이지. Edureka의 Informatica 인증 교육은 강사 주도의 라이브 세션과 실제 사용 사례를 사용한 실습 교육을 통해 Informatica 전문가가 될 것입니다.