[경영정보시각화능력(BIS)] 필기 정리 3과목 경영정보시각화 디자인(시각화도구 활용, 시각화요소 디자인)

728x90

3과목 경영정보시각화 디자인

Section 02 시각화도구 활용

1. 사무자동화 프로그램을 활용한 시각화

1) 사무자동화 프로그램의 시각화 관련 주요 기능

  • 차트
  • 조건부 서식
    • 특정 범위의 값을 강조하거나, 데이터 크기에 따라 서식을 변화시키는 등 시각적인 효과를 줌
  • 데이터 막대
    • 조건부 서식의 한 종류, 숫자 및 퍼센트 값으로 상대적인 크기 시각화

  • 아이콘 세트
    • 데이터 막대와 같이 퍼센트 값 시각화
  • 스파크라인 
    • 셀 내의 작은 크기의 추세 그래프, 데이터의 추세나 패턴을 한눈에 파악

 

2) 사무자동화 프로그램 활용 시각화의 장단점

 

장점

  • 다양한 시각화 옵션
  • 간편하고 익숙한 인터페이스: 직관적인 인터페이스, 시각화 요소 생성 및 데이터 조작 용이
  • 데이터 분석과 통합: 데이터 필터링, 정렬, 피벗 테이블 등 기능을 통해 집계 분석 및 보고서 작성 유용

단점

  • 기능 및 유연성의 제한: 대규모 데이터에는 한계
  • 수작업의 번거로움
  • 제한된 대시보드 기능: 대시보드 생성 시 수작업과 수식을 통해 조합해야하므로 번거로움
  • 협업 및 공유의 제한: 동시 편집 및 파일 공유, 관리 어려움

 

2. 시각화도구(BI소프트웨어)의 특징

1) 시각화도구(BI소프트웨어)의 개념

  • 비즈니스 인텔리전스(BI, Business Intelligence)를 지원하는 소프트웨어
    • BI: 조직에서 데이터를 분석하여 실행 가능한 통찰의미 있는 정보를 생성하기 위해 사용하는 기술, 전략, 프로세스

 

2) 시각화도구(BI소프트웨어)의 특징

  • 시각화도구를 통해 스프레드시트, DB, 클라우드서비스 등 데이터 소스에서 데이터를 추출, 변환, 로드(ETL)할 수 있음
  • 인터랙티브 기능을 통해 정보에 대한 인사이트를 얻을 수 있음

 

3) 시각화도구(BI소프트웨어)의 장단점

 

장점

  • 데이터의 탐색적 분석(EDA)
  • 기술 통계(데이터의 구조와 통계적 특성 요약)와 시각화 기법을 통해 데이터의 분포, 상관 관계, 이상치 등을 시각적으로 파악하며, 데이터 간의 상호작용과 패턴을 탐색할 수 있음

단점

  • 시각화도구는 일일이 데이터별 변환 과정을 기록하지 않고 최종 결과만 저장해주는 특성이 있으므로
    재현 가능성반복 가능성을 구현하기 어려울 수 있음(프로그래밍이 더 적합)
  • 재현 가능성: 시각화 결과를 재현할 수 있는 능력
    • 코드, 데이터, 분석 방법등을 기술하여 다른 사람이 시각화를 재현할 수 있도록 해야 함(신뢰성, 투명성)
  • 반복 가능성: 동일한 조건에서 동일한 시각화 결과를 다시 얻을 수 있는 능력
    • 도표에 무작위적인 요소가 포함되어 있더라도 해당 요소들이 재생성 가능한 방식으로 지정되어 언제든지 동일한 도표를 재생성할 수 있는 것을 의미함
    • 무작위 데이터를 다룰 때 반복 가능성을 보장하기 위해 원본값 설정과 함께 사용된 난수 생성기의 기록을 명시

4) 시각화도구 예시

  • PowerBI , Tableau 

 

5) 시각화도구 기본함수

구분
기능
PowerBI
Tableau
숫자/
집계/
통계 함수
절댓값 반환
ABS
ABS
나누기
DIVIDE
DIV
반올림
ROUND
ROUND
모든 값의 평균 반환
AVERAGE
AVG
열에서 비어 있지 않은 행의 수 반환
COUNT
COUNT
최댓값 반환
MAX
MAX
최솟값 반환
MIN
MIN
중앙값 반환
MEDIAN
MEDIAN
샘플 집단을 기준으로 모든 값의 통계적 표준편차 반환
STDEV.S
STDEV
샘플 집단을 기준으로 모든 값의 통계적 분산 반환
VAR.S
VAR
문자열
함수
주어진 문자열에 지정한 부분 문자열이 포함되어 있으면 TRUE 반환
CONTAINS
CONTAINS
텍스트 문자열의 시작 부분부터 지정된 문자 수 반환
LEFT
LEFT
텍스트 문자열의 끝부분부터 지정된 문자 수 반환
RIGHT
RIGHT
지정한 위치에서 지정된 문자 수 반환
MID
MID
지정한 문자 수에 따라 텍스트 문자열의 일부를 다른 텍스트 문자열로 전환
SUBSTITUTE
REPLACE
텍스트 문자열의 문자 수 반환
LEN
LEN
문자열 앞/뒤의 공백 제거
TRIM
TRIM
소문자를 모두 대문자로 변환
UPPER
UPPER
논리함수
조건을 확인하여 True면 첫번째 값, 그렇지 않으면 두번째 값 반환
IF
IIF
두 인수 중 하나 이상 True인지 확인
OR
OR
일련의 식을 테스트하여 True인 경우 Then 값 반환
-
IF THEN (ELSE ) END
논리 테스트를 수행하여 적합한 값 반환
-
CASE WHEN
THEN ELSE END
날짜함수
지정된 간격 수만큼 정방향 또는 뒤로 이동한 날짜 열이 포함된 테이블을 반환
DATEADD
DATEADD
두 날짜 사이의 간격(월, 일 등) 반환
DATEDIFF
DATEDIFF
날짜에 대한 반올림(가까운 월, 일, 주, 요일 등)
-
DATETRUNC
주어진 날짜의 연도를 정수로 반환
YEAR
YEAR
주어진 날짜의 분기를 정수로 반환
QUARTER
QUARTER
주어진 날짜의 월을 정수로 반환
MONTH
MONTH
주어진 날짜의 주를 정수로 반환
WEEKNUM
WEEKNUM
주어진 날짜의 일자(1~31)를 정수로 반환
DAY
DAY
지정된 년, 월, 일로 구성된 날짜 값을 반환
DATE
MAKEDATE
현재 로컬 시스템 날짜 반환
TODAY
TODAY
테이블
계산 함수
테이블 인수의 각 행에 대한 숫자 목록의 숫자 순위
RANKX
RANK
지정된 테이블 또는 테이블식에 계산 열 추가
ADDCOLUMNS
-
다른 테이블에서 관련 값을 반환
RELATED
-

 

Section 03 시각화요소 디자인

1. 차트 디자인

1) 수량 시각화

  • 정량적 변수(수량, 숫자 값)의 시각화
  • 종류 : 막대차트, 묶은막대차트, 누적막대차트, 히트맵차트, 롤리팝(막대사탕)차트, 레이더차트, 워터폴차트

 

2) 비율 시각화

  • 비율(전체 중 부분)의 시각화
  • 종류 : 원형(파이)차트, 막대차트, 묶은누적막대차트, 모자이크차트, 트리맵, 도넛차트, 와플차트(그리드플롯), 워터폴차트
  • 모자이크차트, 트리맵
    • 음수 값을 표현하기 어려움
    • 이웃하지 않은 사각형 사이의 비교는 어려움
    • 범주는 시각화 프로그램이 제공하는 알고리즘으로 자동으로 배치되므로 보통은 제어하기 어려움
    • 비율 데이터를 범주의 내포 형태로 표현할 수 있어 2개 이상의 범주가 계층구조를 가질 때 적합

 

3) 분포 시각화

  • 데이터의 분포와 통계량의 시각화
  • 종류 : 히스토그램, 밀도분포, 도트플롯, 박스플롯, 누적밀도, QQ도표, 박스플롯, 바이올린차트, 스트립차트, 시나플롯, 누적히스토그램, 중첩밀도분포
  • 박스플롯
    • 최솟값1사분위값2사분위값(중앙값), 3사분위값최댓값 등을 표현

 

4) 관계 시각화

  • 두 개 이상의 정량적 변수의 관계를 시각화
  • 종류 : 분산형차트(산점도, 산포도), 버블차트, 경사차트, 밀도등고선, 2차원 상자, 상관도표, 연결산점도

 

5) 공간 시각화

  • 지도로 표현하는 시각화, 데이터에 위도, 경도 정보가 포함되어야 함
  • 종류 : 지도, 단계구분도, 카토그램, 카토그램히트맵
  • 카토그램(왜상통계지도)
    • 면적을 수치형 자료의 측정값에 맞춰 변형한 지도
    • 핵심 데이터를 강조하기 위해 지도의 한 측면을 왜곡
  • 카토그램 히트맵
    • 같은 면적의 배경을 병렬적으로 사용

 

6) 시간 시각화

  • 시간 변화에 따른 추이를 나타내는 시각화
  • 종류: 라인차트, 막대차트, 경사차트, 영역차트(누적밀도) 등
  • 선 그래프
    • 추세적, 계절적, 순환적, 불규칙 요인의 시계열 데이터
  • 경사차트
    • 시간 추이 중 특별히 ‘두 점 사이’의 추이를 비교

 

7) 불확실성 시각화

  • 오차 표현을 포함하는 시각화
  • 종류 : 오차막대, 단계별오차막대, 신뢰도스트랩, 신뢰대역, 분위수점도표 
  • 오차막대
    • 표준편차, 표본오차 등 통계량 필요, 90%, 95%, 99% 신뢰 구간 표시 필요

  • 데이터 혹은 통계 분야와의 연관 : 모집단, 표본, 추정, 표본분포, 표준오차, 신뢰수준, 신뢰구간, 상관계수

 

8) 기타 시각화

  • 흐름을 표현하는 시각화 : 생키(산키)차트
  • 순위 표시 시각화 : 경사차트, 범프(혹)차트

 

2. 테이블 디자인

1) 테이블(Table, 표)

  • 행과 열의 2차원 구조로 구성됨
    • : 테이블의 가로 방향으로, 데이터베이스에서는 레코드(Record), 튜플(Tuple)이라고도 함
    • : 테이블의 세로 방향으로, 데이터베이스에서는 속성(Attribute), 필드(Field), 변수(Variable) 등으
      로 불림
  • 테이블 중 커다란 테이블을 요약하는 통계표를 피벗 테이블(Pivot Table)이라고 함

 

2) 캘린더차트

 

 

자료 출처: 경영정보시각화능력 필기 수험 가이드북

 

728x90