OLTP 대 OLAP



다음 블로그에서는 OLTP 대 OLAP 및 다양한 사용 사례에 대해 간략하게 설명합니다.

OLTP 대 OLAP

OLTP는 사용자가 데이터 저장소를 사용하여 많은 온라인 트랜잭션을 수행하는 온라인 트랜잭션 시스템 또는 데이터 저장 시스템에 가깝다고합니다. 또한 실시간으로 더 많은 임시 읽기 / 쓰기가 발생한다고합니다.





파이썬의 생성자는 무엇입니까

OLAP는 오프라인 데이터 저장소에 가깝습니다. 액세스됩니다횟수오프라인 방식으로. 예를 들어, 대량 로그 파일을 읽은 다음 데이터 파일에 다시 기록합니다. OLAP가 사용되는 일부 공통 영역은 로그 작업, 데이터 마이닝 작업 등입니다.

Cassandra는 실시간이므로 OLTP에 더 가깝다고합니다. 반면 Hadoop은 분석 및 대량 쓰기에 사용되기 때문에 OLAP에 더 가깝습니다.



OLAP 및 OLTP를 통합하는 이유는 무엇입니까?

향후 365 일 호텔 예약을위한 가장 저렴한 가격을 찾고 있다면 여기에 Cassandra에 대한 방대한 데이터 세트가 있고 실시간 데이터베이스에 대한 추천을 받고 싶다면 가격을 기준으로 프로모션이 실행됩니다.

이러한 시나리오에서 우리는 모든 기록을 반복하고 그 위에 분석을 유지해야합니다. 이는 자주 시작해야하는 거대한 오프라인 작업입니다. 여기에서 Hadoop은 대량 데이터 처리에 사용됩니다.

다른 이점은 하나의 클러스터를 실행하고 다른 Hadoop 클러스터 실행을 중단 할 수 있다는 것입니다.



세 번째 이점은 많은 운영 비용을 줄일 수 있다는 것입니다.

사용자가 Hive, Pig Latin과 같은 다양한 Hadoop 생태계에 정통하고 데이터를 통합해야하는 경우 Cassandra에서 일부 데이터 소스를 플러그인하고 Map을 실행해야하는 시나리오가 있습니다. 일자리도 줄입니다.

OLTP와 OLAP 사이에는 눈에 띄는 패턴이 있습니다. OLTP에서는 쓰기 수가 적습니다. 호텔 정보. 가격 변경이 초당 5000 회마다 발생한다고 가정하면 여기에 더 많은 읽기가있을 수 있습니다. 이러한 시나리오에서는 초당 1 회의 쓰기가있을 수 있지만 읽기는 수백, 수천으로 추방 될 수 있습니다. 따라서 여기의 비율은 약 1 : 1000입니다.

Cassandra가 읽기 / 쓰기가 동일한 모델을 포함하는이 모델에 쉽게 맞출 수 있다는 것은 흥미로운 관찰입니다. 또한 OLTP와 관련하여 조정 가능하고 강력한 일관성 모델을 사용하더라도 최종 일관성 모델과 가장 강력한 일관성 모델 사이의 밀리 초 간격을 볼 수 있습니다. 따라서 Cassandra는 OLTP에 적합합니다.

OLAP를 사용하면 여러 OLAP 패턴을 볼 수 있습니다. 즉, 여러 쓰기가 동시에 발생합니다. OLAP에서는 데이터를 한 번에 덤프합니다. 즉, 모든 로그 파일을 데이터 저장소에 저장 한 다음 처리를 시작합니다. 데이터 패턴 또는 액세스 패턴은 OLTP 종류의 응용 프로그램과 정확히 반대입니다. 여기에서 Hadoop 또는 MapReduce가 유용합니다.

질문이 있으십니까? 댓글 섹션에 언급하시면 다시 연락 드리겠습니다.

관련 게시물:

자바 스크립트는 배열의 길이를 얻습니다.

카산드라를 배워야하는 5 가지 이유