[부스트코스] 데이터 시각화를 위한 태블로(태블로 기초 이해 - 태블로 상관 관계 분석)

728x90

EP.6 태블로 상관 관계 분석

 

1. 분산형 차트

  • 측정값 간의 관계를 파악하기 위한 시각화 방식
  • 열 선반과 행 선반에 각각 측정값을 배치하면 자동적으로 만들어진다
  • 자유도를 주기 위해선 별도의 '매개 변수' 를 만들어서 매개 변수 안의 값에 따라 다양하게 활용할 수 있음

 

 

  1. 할인율을 평균 및 축 단위를 소수점 한 자리 수로 변경
  2. 마크, 색상 변경
  3. 수익의 크기에 따라 0을 기준으로 파랑, 주황으로 나누어 표시
  4. 할인율이 높을수록 수익이 낮아진다는 선형 추세선 표시

 

2. 데이터 가이드

  •  데이터 설명으로 작성된 인사이트를 자동으로 표시하여 사용자가 이상값을 찾고 마크에 대한 설명을 확인할 수 있도록 지원합니다.
  • 데이터 설명에서 제공하는 비주얼리제이션을 통해 이상값 측정 및 그 이면의 잠재적 주요 동인을 파악할 수 있습니다.

 

2-1. 데이터 가이드

 

2-2. 이서준 데이터의 설명을 확인할 수 있음

 

2-3. 이서준 데이터의 평균 수익은 -26만원인데, 하나의 극한값 -306만원이 있는 게 확인된다

 

2-4. 극한값이 제외된다면 수익의 합계가-260만원에서 42만원으로 변경되는 것도 확인할 수 있다

 

3. 매개 변수 적용

  • 분산형 차트에서 특정 기준을 충족하는 값을 동적으로 표현할 수 있다.
  • 매개변수는 계산된 필드, 필터, 또는 참조선과 결합하여 사용해야 한다.

 

매개 변수 지정

 

수익의 합계가 p.수익 이상, 평균 할인율이 p.할인율 이상인 '집합'  생성

 

참조선 지정

728x90