Tableau

[Tableau]데이터 변형 및 정리

Genie Lee 2021. 11. 25. 17:37
728x90
반응형

[빅스데이터]실습4일차

https://public.tableau.com/app/profile/.50465279

 

안녕하세요.

오늘은 월간 출국인원 데이터를 활용해 날짜 기준 불연속형과 연속형으로 추이를 살펴보는 것을 배웠습니다.

그리고 IF 함수를 활용한 간단한 계산식을 활용해 2019년 대비 2020년 각 월별 출국인원이 얼마 정도 감소했는지 알아보았어요.

함께 볼까요?

 

#추세선(Trend Line) #데이터해석기 #피벗 #데이터 사용자 분할 #null값 제거 

#성장률(+/-) #통화변경 #숫자형식

 

데이터 연결하기

데이터 원본 - 연간 출국 인원.xlsx (출처 - tourgo(관광지식정보시스템))

 

데이터 정리하기


데이터 원본을 연결한 후에 데이터 원본 페이지에서 좌측 상단에 있는 '데이터 해석기 사용'을 선택합니다.
어떤 변화가 생겼나요? 

 

피벗


데이터 해석기 사용 후 열 방향으로 되어 있는 2011년 01월 ~ 계 까지 열을 모두 선택한 다음에 피벗 적용합니다.
피벗을 적용하는 이유가 무엇일까요?

>>옆으로 열이 너무 길기 때문에, 데이터 해석이 어려우므로 피벗을 진행해 준다.

그럼 이렇게 행으로 변환된다.

사용자 지정 분할

 

[피벗 필드명]을 사용자 지정 분할 기능을 활용해 [연월] 필드를 생성합니다.

필드명 변경[피벗 필드값]은 [출국 인원]으로 이름 변경합니다.

계산식으로 하면 이렇게

 

NULL값 제거

강승일 강사님의 설명: https://youtu.be/dxItpU9Bcuk?t=471(7:50~)

 

 

실습 1.
월간 평균 출국 인원이 가장 높은 달은 1월에서 12월 중 몇 월인가요? 그리고 3번째로 높은 달은 몇 월인가요?
HINT) 불연속형 ‘월’

연속형 VS 불연속형 선택방법
측정값 기준 변환
퀵 테이블 계산 > 순위

 

출국 인원 평균 (순위)

 

 

실습 2.
월간 출국 인원이 가장 많았던 달은 정확히 OOOO년 OO월인가요? 그리고 추세선을 적용해봅시다. 
HINT) 연속형 ‘월’
HINT) 분석 패널(Analytics) > 추세선(Trend Line) > 다항식

 

TIP! 그래프에 '최대값' 레이블만 표시하는 방법

레이블 > 최소/최대/ 레이블 최소값 체크 해제

 

추세선을 옆으로 끌어오면 모양을 선택할 수 있음

 

추세선 적용

 

 

실습 3.
월간 출국인원을 2019년과 2020년과 비교를 하겠습니다. 각 월별로 2020년 대비 2019년 월간 출국 인원이 얼마 정도 감소했나요?

 

1. 계산식을 사용합니다.

HINT) SUM(IF YEAR([연월])=2019 THEN [출국 인원] END)
또는 SUM(IIF(YEAR([연월])=2020,[출국 인원],NULL)

 

2. 행을 나란히 놓으면 이렇게 두개의 그래프가 위 아래로 보여집니다.

3. 이중축 설정

이중축 설정하여 두 그래프가 겹쳐 보이도록 함

 

4.  레이블 달기

 

5. 전년대비(%) 구하기

1) 계산식 적용 >>  ([2020 출국 인원]-[2019 출국 인원])/[2019 출국 인원]

2) 퍼센트 속성 설정 (기본 속성->숫자형식)

 

 

3) 백분율

4) +0.00%;-0.00%  전년 대비 성장했으면 +, 아니면-

 

 

레이블 명 편집방법

 

도구설명 제거

ㅇㄷㄷㄷㄷㄷㄷㄷㄷ

 

728x90
반응형