데이터 분석가로 일을 하다보니, 데이터 추출 및 가공을 통해 수치를 뽑아낸 후 다른사람에게 보여주며 이해를 시키는 것이 중요한 부분이라는 것을 매번 느끼고있다.
비즈니스 문제를 해결하거나, 데이터의 패턴을 파악하고자할 때 어떻게 시각화를 할까 매번 고민하는데 해결하려는 문제 유형에 따라 차트의 기본 설정을 좁힐 수 있는 5가지 방법을 소개하려한다.
보고서를 만들때나 대시보드를 제작할 때 목적에 맞게 시각화를 하는 방법은 무엇일까
1. 값을 비교하려는 경우
차트는 데이터셋에서 하나 이상의 값을 비교하는 데 가장 적합하다.
- 여러달에 걸쳐서,
- 각 segment에서 제품의 성능을 비교
- 키, 몸무게 등
비교를 위한 차트로는 다음 유형의 그래프를 사용할 수 있다.
막대 그래프(Bar Chart), 파이차트(Pie Chart), 선 그래프(Line Chart), 산점도 그래프(Scatter Plot), 불릿 그래프(Bullet Chart)
2. 무언가의 구성을 보여주고싶은 경우
개별 부분이 전체를 구성하는 방법
- 지역별 총 매출
- 월별 주문 접수
다음 유형의 그래프를 사용할 수 있다.
파이차트(Pie Chart), 누적 막대 그래프(Stacked Bar Chart), 영역형 차트(Area Chart), 폭포수 차트(Waterfall)
3. 데이터의 분포를 나타내고 싶은 경우
분포 차트는 값의 이상값, 값이 정상 경향을 나타내는지 등 정보 범위를 이해하는 데 도움이 된다.
분포도는 특히 하나의 컬럼을 이해하는 데 사용된다.
- 변수의 분포를 보여주는 히스토그램
- 급여 배분 분포 확인
다음 유형의 그래프를 사용할 수 있다.
막대 그래프(Bar Chart), 산점도 그래프(Scatter Plot), 선 그래프(Line Chart)
4. 데이터셋의 추세를 나타내고 싶은 경우
특정 기간동안 데이터셋이 어떻게 수행되었는지에 대한 자세한 정보를 파악하고자 한다.
- 연간 웹사이트 방문자 수
- 수익, 재고 등 재무 정보
- 회사의 주가
다음 유형의 그래프를 사용할 수 있다.
선 그래프(Line Chart), 이중축 선 그래프(Dual-Axis Line Chart)
5. 값-집합 간의 관계를 잘 나타내고 싶은 경우
관계 차트는 하나의 변수가 하나 또는 여러 개의 다른 변수와 어떻게 관련되는지 보여주는 데 적합하다.
어떤 것이 다른 변수에 긍정적인 영향을 미치거나 영향을 미치지 않거나 부정적인 영향을 미치는 방식을 보여줄 수 있다.
- 인구 밀도 대 소득 잠재력 그래프
- 면적 대 집값 그래프
다음 유형의 그래프를 사용할 수 있다.
산점도 그래프(Scatter Plot), 선 그래프(Line Chart), 거품/풍선형 그래프(bubble chart)
시각화를 해서 데이터에 대한 이해를 돕는 부분이 보고하는 사람의 입장으로서 매우 중요한 일이기 때문에, 어떤식으로 표현하는게 적합한가에 대한 고민과 실험으로 더 좋은 결과를 내고 싶다.
아래에 표시한 인포그래픽은 여러가지 경우에 대한 내용을 보기 좋게 구성해두어서 어떤식으로 그래프를 구성할지 조금 더 이해를 도와줄 것 같다.
[참조]
https://chartio.com/images/tutorials/charts/scatter-plots/scatter-plot-example-1.png
https://user-images.githubusercontent.com/11630480/49819830-9660ae00-fd8b-11e8-8896-273ac38f0588.png
https://vizzlo.com/uploads/changelog-smarter-bubble-chart.png
'Dev > 데이터 분석' 카테고리의 다른 글
[통계] 독립표본 t검정(t-test) (0) | 2023.02.28 |
---|---|
[데이터분석] 공유 자전거 데이터 분석(2편) (0) | 2022.08.31 |
[데이터분석] 공유 자전거 데이터 분석(1편) (0) | 2022.06.30 |
[데이터분석] 데이터 분석가는 어떤 일을 하나요? (0) | 2021.12.17 |
[가설검정] P-value란?(어떤 사건이 우연히 발생할 확률) (2) | 2021.12.17 |