반응형
1.zeppelin 기반 로컬 개발 환경 구성이란?
spark 를 공부할 때, zeppelin 이라는 노트북을 이용하면 편하다.
python 에서 주피터와 비슷한 역할의 툴이다.
spark 개발을 안한지 오래되서, 다시 공부를 하기 위해 구성해보려고 한다.
요즘 데이터 엔지니어들이 보는 코딩 테스트에는 알고리즘 문제 뿐만 아니라, 스파크를 이용한 문제도 출제 된다.
역시 docker-compose 를 이용해서 구성한다.
2.왜 Docker-compose ?
오픈 소스 버전을 그대로 로컬에 받아서 설치하려면, 적지 않은 시간이 소요된다.(java 설치 lib 등등의 환경 설정. 네트워크 설정 이나 연동 등 .. )
누군가 고생해서 만들어 놓은 docker image 와 docker-compose 에 설정이 기술된 yaml 파일을 이용하여 손쉽게 올릴 수 있다. (보통 docker compose [오픈 소스 이름] 을 치면 쉽게 찾을 수 있다. )
3. zeppelin, spark 설치
구성해보기보다는 따라하기에 가깝다. 내가 참고한 블로그를 참조 한다. 여기를 참고하는게 더 정확하니까 아래 링크로 이동하자.
a) 설치 스크립트
# git clone 다운로드
$ https://omrisk.medium.com/apache-spark-3-playground-back-to-school-with-zeppelin-notebooks-pt-3-4ebc18da68f7
# 컨테이너 올리기
$ docker-compose -f docker-compose.yml -f docker-compose-zeppelin.yml up -d
b) 브라우저 접속
- http://localhost:9090 접속, (zeppelin)
- 마찬가지로 spark mster GUI 에도 접근이 가능하다.
- 기본적으로 예제 코드와 스파크 앱을 띄우는 노트가 있다. ( spark server 입장에서는 zeppelin 도 하나의 appication 이기 때문에 spark 를 사용하기 위해서는 인터프리터가 구동되어야 한다.)
** 보통 zeppelin 과 spark 를 연동 할때 spark_home ,master 엔드포인트를 잡아주는데, 아래에서 처럼 노트 안에서 잡아줄수도 있는 것 같다.
시간이 생기면 추가로 보충하겠다... 너무 바쁘다 요즘.
반응형
'오픈 소스' 카테고리의 다른 글
open-webui /ollama 를 이용해 내 컴퓨터에 ChatGPT 구축하기 (0) | 2024.09.20 |
---|---|
프로메테우스(prometheus) 구성 및 기본 사용법 (0) | 2022.03.27 |
아파치 슈퍼셋(superset) 구성 및 기본 사용법 (0) | 2021.08.21 |
앤서블(Ansible) 구성 및 기본 사용법 (0) | 2021.06.11 |
도커(Docker) 구성 및 기본 사용법 (0) | 2021.06.02 |