Sqoop을 사용하여 Oracle에서 HDFS로



Sqoop을 사용하여 Oracle에서 HDFS로-Sqoop을 사용하여 Oracle에서 HDFS 로의 단계를 확인하십시오.

1. 아래 링크에서 Oracle Expresss Edition을 다운로드하고 압축을 풉니 다.





https://docs.google.com/a/edureka.in/file/d/0B2-rlCGKD40NNW5BcHZMTkdtcmc/edit

61



2. 압축을 풀면 아래 이미지와 같이 Oracle XE Edition의 실행 파일이 있습니다.

3. OracleXEUniv를 두 번 클릭하여 시스템에 Oracle 데이터베이스를 설치하고 실행을 클릭합니다.



4. 다음을 클릭합니다.

5. 라이센스 계약에 동의하고 다음을 클릭하십시오.

6. 기본적으로 oracle은 시스템을 데이터베이스 이름으로 사용합니다. 비밀번호 입력

이 데이터베이스에 대해.

암호 입력 –> 시스템

암호 확인 –> 시스템

자바에서 컴파일하는 방법

다음을 클릭하십시오.

7. 설치를 클릭합니다.

8. 마침을 클릭합니다

9. 폴더에있는 sqlnet.ora 파일을 편집하겠습니다.

C : oraclexepporacleproduct.2.0serverNETWORKADMIN

그것을 열면 아래 내용을 찾을 수 있습니다.

아래 스크린 샷에서와 같이 편집하십시오.

10. Oracle의 SQL 명령 줄을 시작하겠습니다.

시작 메뉴-> 모든 프로그램-> Oracle Database 10g Express Edition->

SQL 명령 줄을 실행하고 두 번 클릭합니다.

11. Oracle Database에 대한 Cli가 제공됩니다.

12. Oracle 데이터베이스에 연결하겠습니다.

사용자 이름 : 시스템

암호 : 시스템

성공적으로 연결되었다는 메시지를 받게됩니다.

13. 간단한 테이블을 만들어 보겠습니다.

명령:

테이블 emp (ID 번호) 생성

14. Insert 명령을 사용하여 값을 삽입 해 보겠습니다.

명령:

emp 값에 삽입 (2)

15. Select Command를 사용하여 테이블에 데이터가 삽입되었는지 확인하겠습니다.

명령:

emp에서 * 선택

16. 데이터를 커밋합시다.

명령:

범하다

17. Oracle Database에서 Sqoop으로 데이터를 가져 오려면 다음을 추가해야합니다.

Oracle 커넥터 (ojdbc6_g.jar).

아래 링크에서 항아리를 다운로드 할 수 있습니다.

https://docs.google.com/a/edureka.in/file/d/0B2-rlCGKD40Nekw3ZXBRWUU5Y1E/edit

18. Cloudera cdh3를 열고 FileZilla를 사용하여 Oracle 커넥터를 Cloudera cdh3 (데스크톱으로)로 이동합니다.

Windows에서 cloudera cdh3 vm으로 파일을 이동하는 방법을 이해하려면 아래 링크를 사용하십시오.

https://www.edureka.co/blog/transfer-files-windows-cloudera-demo-vm/

자바에서 문자열을 날짜 형식으로 변환

19. Cloudera Cdh3 Desktop에 Oracle 커넥터가 있으면 다음의 lib 폴더로 이동합니다.

아래 명령을 실행하여 sqoop :

명령:

sudo cp /home/cloudera/Desktop/ojdbc6_g.jar / usr / lib / sqoop / lib /

20. 아래 명령을 실행하여 디렉토리를 Sqoop으로 변경합니다.

명령:

cd / usr / lib / sqoop /

21. Windows에서 명령 프롬프트 (CMD)를 열고 IPv4 주소

실행함으로써

아래 명령 :

명령:

ipconfig

22. 아래를 실행하여 Oracle 데이터베이스에있는 테이블 emp의 데이터를 hdfs로 가져옵니다.

명령:

명령에 필요한 항목 :

IPv4 주소 – IPv4 주소입니다. 제 경우에는 192.168.46.1입니다.

데이터베이스 이름 – 시스템

테이블 이름 – emp

반환 유형 만 다른 함수는 오버로드 할 수 없습니다.

사용자 이름 – 시스템

암호 – 시스템

출력 디렉토리 – 임의 일 수 있습니다. sqoopoutput1을 사용했습니다.

명령:

sudo bin / sqoop import –connect jdbc : oracle : thin : system /

system@192.168.46.1 : 1521 : 차량

–username system -P –table system.emp –columns“ID”–target-dir /

sqoopoutput1 -m 1

23. 명령이 성공적으로 실행되면 다음 메시지가 표시됩니다.

그 검색 기록은 아래 이미지와 같습니다.

24. 브라우저를 열고 아래 URL로 이동하십시오.

URL : http : // localhost : 50070 / dfshealth.jsp

파일 시스템 찾아보기를 클릭하십시오.

25. sqoopoutput1 디렉토리를 클릭합니다.

26. part-m-00000 파일을 클릭하십시오 :

27. 다음은 Oracle 데이터베이스에서 가져온 데이터입니다.

축하합니다! Oracle 데이터베이스에서 데이터를 성공적으로 가져 왔습니다.

Sqoop을 사용하여 HDFS로 ..!