데이터웨어 하우스의 아키텍처



이 블로그는 데이터웨어 하우스의 전체 아키텍처를 중점적으로 다룹니다.

데이터웨어 하우스 란?

데이터웨어 하우스는 여러 위치의 통합 데이터가 저장되는 중앙 위치입니다. 데이터웨어 하우스는 새 데이터가 생성 될 때마다로드되지 않지만 최종 사용자는 정보가 필요할 때마다이를 평가할 수 있습니다. 매일, 매월 또는 분기에 한 번 데이터웨어 하우스를로드해야하는시기에 대해 비즈니스에서 결정하는 특정 타임 라인이 있습니다.





데이터웨어 하우스 아키텍처

데이터웨어 하우징 시스템마다 구조가 다릅니다. 일부는 적은 수의 데이터 소스를 가질 수 있지만 일부는 클 수 있습니다.

이미지에 언급 된 것처럼 여러 트랜잭션 시스템, 소스 1 및 기타 소스가 있습니다. 소스는 SAP 또는 플랫 파일 일 수 있으므로 소스 조합이있을 수 있습니다. ETL (추출, 전송,로드)은 데이터 마트에서 데이터웨어 하우스를로드하는 데 사용됩니다. 데이터 하우스와 데이터 마트의 차이점은 데이터웨어 하우스가 조직 전반에 걸쳐 사용되는 반면 데이터 마트는 개별 맞춤형보고에 사용된다는 것입니다.



예를 들어 재무 부서와 같은 회사에는 마케팅 부서와 매우 다른 여러 부서가 있습니다. 이들은 모두 서로 다른 소스에서 데이터를 가져오고 맞춤형보고가 필요합니다. 재무 부서는 주로 통계에 관심이 있고 마케팅 부서는 프로모션에 관심이 있습니다. 마케팅 부서는 재무에 대한 정보를 요구하지 않습니다.

맞춤형보고를 위해서는 데이터 마트라는 데이터웨어 하우스의 하위 집합이 필요합니다. 로드하는 방법에는 두 가지가 있습니다. 먼저 데이터웨어 하우스를로드 한 다음 마트를로드하거나 그 반대의 경우도 마찬가지입니다. 데이터 액세스 계층 인보고 시나리오에서 사용자는 데이터웨어 하우스에 액세스하여 보고서를 생성합니다. 이러한 모든보고 도구는 의사 결정 수준의 사람들이 기술 정보에 관심이 없기 때문에 소비자가 전면 인터페이스를 매우 쉽게 만들 수 있도록 설계되었습니다. 그들은 주로 사용 가능한 깔끔한 보고서에 관심이 있습니다.

병합 정렬 구현 C ++

따라서 이러한 모든보고 도구는 프런트 엔드에서 수행되지만 백 엔드에서는 쿼리를 생성하고 데이터베이스에 접속하면 사용자가 적시에 보고서를받습니다. 이러한보고 도구는 보고서를 실행하고 생성 할 작업을 예약 할 수 있습니다.



질문이 있으십니까? 댓글 섹션에 언급 해 주시면 다시 연락 드리겠습니다.

관련 게시물: