호튼웍스(Hotonworks)는 빅데이터 플랫폼의 테스트와 학습을 효과적으로 지원하는 것을 목표로 HDP Sandbox를 제공합니다. HDP Sandbox는 HDP 최신 패키지를 모두 포함하며, VirtualBox, VMWare 및 Docker 이미지로 배포됩니다. 하둡이 익숙하지 않거나 최신 HDP 구성을 확인하고자 한다면 HDP Sandbox는 가장 이상적인 시작점입니다.
본 문서는 HDP Sandbox를 VirtualBox에 설치하는 과정을 소개합니다.
HDP Snadbox 설치
VirtualBox에 HDP Snadbox 설치하는 과정을 소개합니다. VirtualBox는 컴퓨터에 설치되어 있다는 가정으로 진행하겠습니다. HDP Sanbox는 다음 URL에서 다운로드 받을 수 있습니다.
VirtualBox용 이미지를 다운로드해야 합니다. VirtualBox 이미지는 파일 포맷은 zip이고 사이즈는 약 15GB입니다. 압출을 풀면 ova 파일이 만들어집니다. 이 파일의 사이트는 약 16.8GB입니다.
가상 이미지에 메모리는 최소 8GB를 할당해야 합니다. 12GB를 할당하는 것을 권장합니다.
VirtualBox 이미지 로딩
ViratualBox 이미지 로딩 절차를 따라 하기 형식으로 설명하겠습니다.
<그림 1>과 같이 “가상 시스템 가져오기” 메뉴를 선택합니다.
그림 1:
'가상 시스템 가져오기' 메뉴 실행
<그림 2>와 앞에서 다운로드한 ova 파일을 지정합니다.
그림 2:
VirtualBox 이미지 로딩을 위해 OVA 파일 지정
<그림 3>에서는 이미지 로딩 기본 설정을 출력합니다. 메모리에 최소 8GB가 설정되어있습니다. 메모리가 여유가 된다면 12GB로 변경하는 것을 추천합니다.
그림 3:
가상 이미지 기본 설정
<그림 3>을 마치면 <그림 4>와 같이 가상 이미지가 로딩됩니다. 약 2~3분 정도 걸립니다.
그림 4:
가상 이미지 로딩 과정
<그림 4>에서 이미지 로딩이 완료되면, <그림 5>와 같이 해당 이미지가 출력됩니다. 네트워크 설정을 위해서 <그림 5>와 같이 “Hotonworks Sandbox HDP 2.6.5“를 선택하고 설정 메뉴를 클릭합니다.
그림 5:
가상 이미지 로딩 완료 및 설정 메뉴 선택
네트워크 설정을 위해서 <그림 6>과 같이 “NAT”를 지정하고 “케이블 연결됨”을 선택합니다.
그림 6:
네트워크 설정
네트워크 설정을 한 후에, <그림 7>과 같이 “Hotonworks Sandbox HDP 2.6.5“를 선택하고 시작 메뉴를 클릭하여 이미지를 시작합니다.
그림 7:
HDP Sandbox 이미지 실행
이미지를 시작이 완료되면, <그림 8>과 같은 콘솔에 메시지가 출력됩니다.
그림 8:
가상 이미지 실행 및 콘솔 출력
가상 이미지가 시작되었다면, 별도 콘솔 혹은 putty와 같은 ssh 클라이언트 프로그램을 이용하여 가상 이미지에 접근할 수 있습니다. <그림 9>는 ssh로 가상 서버에 접근하는 과정을 소개합니다. 초기 id/password는 “root/hadoop“입니다. 초기 패스워드는 최초 로그인 시점에 변경됩니다. <그림 9>에서 ssh 접근, 로그인, 패스워드 변경 절차를 확인할 수 있습니다.
항목
설명
ssh url
ssh root@localhost -p 2222
os user
root
default password
hadoop
그림 9:
가상 서버 로그인
가상 서버의 root에 접근한 후에, ambari 서버의 기본 패스워드를 설정해야 합니다. ambari는 Hotonworks Sandbox HDP 2.6.5의 관리 서버입니다. ambari 로그인 패스워드를 변경하기 위해서, <그림 9>와 같이 ambari-admin-password-reset 명령을 실행합니다.
그림 10:
Ambari 로그인 및 패스워드 변경
Ambari 서버의 “http://localhost:8080“입니다. 브라우저에서 이 URL에 접근하면 <그림 11>이 출력됩니다. admin 계정과 <그림 10>에서 설정한 패스워드로 Ambari 서버에 로그인할 수 있습니다.
그림 11:
Ambari 서버 로그인
<그림 12>는 Ambari 서버의 메인 페이지 입니다. 브라우저에 <그림 12>와 같은 페이지가 출력된다면, “Hotonworks Sandbox HDP 2.6.5” 가상 서버가 정상적으로 로딩된 상태입니다.
그림 12:
Ambari 메인 페이지
마치며
여기까지가 VirtualBox에 “Hotonworks Sandbox HDP 2.6.5” 가상 이미지를 설치하는 모든 절차입니다. 앞으로 “Hotonworks Sandbox HDP 2.6.5“에서 주요 하둡 컴포넌트를 살펴보는 문서를 준비하겠습니다.