본문 바로가기
기타/[책] 빅데이터를 지탱하는 기술

[독서] 시각화 도구, 빅데이터를 지탱하는 기술

by HelloJudy 2022. 3. 11.

2장. 빅데이터의 탐색

2-3. 애드 혹 분석과 시각화 도구

 

 

< 애드 혹 분석 > : 수작업

 

[ (대화형 도구) 'Jupyter Notebook' ]

* 시각화 라이브러리: matplotlib

- 노트북에서 외부 커맨드 실행 : '!' 로 시작

- 자동화 이전에 노트북으로 하는 애드 혹 분석이 우선 과제.

 

 

< 대시보드 도구 > : 정기적인 데이터 처리

: 최신의 집계 결과를 즉시 확인 기대

- 정해진 지표 변화 모니터링

 

1. Redash

SQL에 의한 쿼리의 실행 결과를 그대로 시각화

-> 별도 데이터 마트 필요X

But, BI 도구만큼 대량 데이터 처리X

 

2. Superset

화며상에서 마우스 조작만으로 그래프 만들기

'대화형 대시보드'

 

3. Kibana

Elasticsearch의 프론트 엔드에서 실시간 작성

 

 

< BI 도구 > : 대화적인 대시보드

장기적인 데이터 추이 시각화

 

- 배치 처리에 의한 데이터 마트 작성 -> 알고 싶은 것이 늘어날 때마다 데이터 마트에 테이블 생성 -> 다수의 대시보드 생성

 


출처: 니시다 케이스케, 「빅데이터를 지탱하는 기술」, 제이펍, 2018, p56~77

 

반응형

댓글