오라클 클라우드 빅데이터 서비스: Oracle BDC
Oracle Big Data Cloud(이하 Oracle BDC)는 PaaS 형태로 제공하는 빅데이터 서비스입니다. Oracle Cloud는 Oracle BDC외에도 Autonomous Data Warehouse(ADW), Oracle Data Analytics(OAC), Object Storage, Data Integration Platform(DIPC), 관리형 아파치 카프카(Oracle Event Hub), Data Hub, NoSQL 서비스 등 데이터 레이크 구축과 데이터를 분석하는 여러 서비스를 제공합니다.
Oracle BDC는 레이크 구축과 데이터를 분석함에 있어서 데이터 전처리(ETL, Preprocessing), 실시간 처리(Streaming), EDA(Exploratory data analysis)와 머신러닝(Spark MLlib)을 담당합니다. Oracle BDC 인스턴스는 하둡 에코를 근간으로 만들어진 완전한 형태의 하둡 클러스터입니다.
본 문서는 Oracle BDC 서비스로 인스턴스(하둡 클러스터)를 만들고 관리하는 절차를 주제로합니다. Spark 및 데이터 분석 방법은 문서의 범위를 벗어납니다, Oracle BDC에서 Spark, Kafka 연동 및 스트리밍 처리, Spark MLlib 등은 별도 문서로 준비하겠습니다. Oracle BDC 서비스를 시작하고 관리하는 방법을 소개하며 다음과 같은 내용을 다룹니다.
- Oracle BDC 소개 (1장)
- Oracle BDC 서비스 만들기(2장)
- Oracle BDC 클러스터 관리: 확장, 축소, 패치 ..(3장)
- Oracle BDC와 접근하기 (4장)
- Oracle BDC에 Job 등록하기 (5장)
- Oracle BDC 연동 (6장)
- Oracle BDC의 인증 정보 관리(7장)
- Oracle BDC의 아파치 제플린(8장)
본 문서는 내용을 참고하여 Oracle BDC 실습이 가능하도록 구성되었고 실행 동영상을 제공합니다. 실습을 위해서는 오라클 클라우드 계정이 필요합니다.
Oracle Cloud Trial 계정 만들기
현재 사용할 수 있는 Oracle Cloud 계정이 없으시다면, Oracle Cloud Trial이 대안이 될 수 있습니다. 다음 문서를 참고하여 Oracle Trial을 만드시기 바랍니다.
이제 Oracle BDC로 들어가 보겠습니다.