2장. 빅데이터의 탐색
2-3. 애드 혹 분석과 시각화 도구
< 애드 혹 분석 > : 수작업
[ (대화형 도구) 'Jupyter Notebook' ]
* 시각화 라이브러리: matplotlib
- 노트북에서 외부 커맨드 실행 : '!' 로 시작
- 자동화 이전에 노트북으로 하는 애드 혹 분석이 우선 과제.
< 대시보드 도구 > : 정기적인 데이터 처리
: 최신의 집계 결과를 즉시 확인 기대
- 정해진 지표 변화 모니터링
1. Redash
SQL에 의한 쿼리의 실행 결과를 그대로 시각화
-> 별도 데이터 마트 필요X
But, BI 도구만큼 대량 데이터 처리X
2. Superset
화며상에서 마우스 조작만으로 그래프 만들기
'대화형 대시보드'
3. Kibana
Elasticsearch의 프론트 엔드에서 실시간 작성
< BI 도구 > : 대화적인 대시보드
장기적인 데이터 추이 시각화
- 배치 처리에 의한 데이터 마트 작성 -> 알고 싶은 것이 늘어날 때마다 데이터 마트에 테이블 생성 -> 다수의 대시보드 생성
출처: 니시다 케이스케, 「빅데이터를 지탱하는 기술」, 제이펍, 2018, p56~77
반응형
'기타 > [책] 빅데이터를 지탱하는 기술' 카테고리의 다른 글
[독서] 분산 처리 프레임워크, 빅데이터를 지탱하는 기술 (0) | 2022.04.13 |
---|---|
[독서] 데이터 마트, 빅데이터를 지탱하는 기술 (0) | 2022.04.11 |
[독서] 데이터 집계 고속화, 빅데이터를 지탱하는 기술 (0) | 2022.03.05 |
[독서] 크로스 집계, 빅데이터를 지탱하는 기술 (0) | 2022.03.03 |
댓글