홍동이의 성장일기

[👩‍💻TIL 20일차 ] 유데미 스타터스 취업 부트캠프 4기 본문

교육/유데미 스타터스 4기

[👩‍💻TIL 20일차 ] 유데미 스타터스 취업 부트캠프 4기

홍동2 2023. 3. 6. 18:51

목차

 

[섹션4] Tableau의 고급 데이터 준비 + 분석

[섹션5] Tableau에서 애니메이션 만들기

[섹션6] 세부 수준 계산 (LOD)

 


[섹션4] Tableau의 고급 데이터 준비 + 분석

프로젝트 개요: 소매 부문 전망

 

 

Tableau에서 상자 그림 작성하기

기계 친화적인 형식으로 피벗하기

 

📍 분석 > 박스플롯 

 

 

상자 그림 분석하기

➡️ NSW, QLD, VIC에는 특정 주에서 전반적인 성과 측면에서 실적이 저조한 회사가 있다. 그리고 QLD에는 실적을 초과하는 회사가 있다. VIC는 박스 부분이 위쪽에 있는 것을 볼 수 있는데 이것은 이 비즈니스 환경 설정이 꽤 좋다는 의미이다. (순이익이 높다는 것이기 때문에) 또한 박스 부분이 조밀하기 때문에 순이익률 측면에서 임의의 회사의 위치에 대한 불확실성이 적다. 중앙값 또한 다른 주에 비해 높다.  

 

 

대용량 데이터 소스 작업하기

📍 Ctrl + - 로 불필요한 행 제거

📍 Tip: 데이터를 복사한 후 사본을 아카이브 폴더로 이동시켜 놓는다. 향후 언제든지 원본으로 되돌릴 수 있다.

 

1️⃣ 데이터 집합을 수정하는 방법

: 비어있는 열은 문자열로 처리된다 → 숫자열과 피벗 시 텍스트로 설정된다.

➡️ [해결방법] 해당 열 숨기기

 

2️⃣ 대용량 데이터 집합을 처리하는 방법

➡️ 데이터 소스 필터 사용 > F1 > 날짜 범위 > 시작범위: 2010-01-01 

※ 데이터 소스 필터는 데이터 집합의 연결 수준에서 적용된다. 

 

 

피벗 및 분할

 

 

실제 소매업은 어떤 모습인가?

📍 축 편집 > 각 행 또는 열에 독립적인 축 범위

 

필터 제거하기

 

➡️ 12월마다 피크가 발생한다. 가장 최악의 달은 2월이다. 거의 다 비슷한 패턴을 보인다.

 

➡️ 신문과 책은 최근들어 하향세를 띄고 있다.

 

 

데이터 소스 필터의 주요 활용 사례

데이터 소스 필터의 주요 목적: 분석에 사용하지 않을 카테고리나 행을 완전히 제거하는 것 

➡️ 우리가 관심있는 것은 의류 소매업이기 때문에 차트에 있는 다른 모든 정보가 필요하지 않다.  

 

※ 데이터 소스 수준에 필터 추가하기

➡️ 새 탭에 산업을 드래그하면 다른 옵션과 필터가 없다. 데이터 소스 수준에서 필터링되었기 때문이다.

: 분석하는 데이터를 줄여나가는 것을 가능하게 한다. 

 

 

추세선

➡️ But 인구 수가 고려되지 않았음 (인구 수로 데이터 정규화를 해야한다) → 1인당 소비 변화율을 알 수 있다

 

 

시계열 고급 혼합

데이터 > 혼합 관계 편집 

 

➡️ 선이 끊어져보일 수 있는 단점이 있다. 

 

➡️ 혼합 관계 편집에서 분기 제거

 

➡️ 데이터 원본 > 필터 편집 > F1 > 개월 > 3월 선택 

 

 

1인당 매출 계산하기

회전율 / 인구 = 1인당 매출

 

📍 혼합 전체에 계산 필드 만들기

➡️ 태블로는 두 데이터 집합에 쿼리를 보낸 다음 뷰의 집계 수준으로 데이터를 집계하도록 데이터 집합에 요청한다. 그런 다음 데이터가 반환되면 두 데이터 집합에만 혼합이라고 하는 결합이 설정된다. 따라서 집계가 반드시 있어야 한다.

 

 

정규화 차트

➡️ Queensland와 Western Australia는 지출이 아니라 인구 증가가 상승 트렌드에 기인했음을 알 수 있다. 

➡️ New South Wales와 Victoria는 인구 규모에 관계없이 산업 자체가 성장하고 있다.  

따라서 New South Wales와 비즈니스 환경이 가장 유사한 곳은 Victoria이다. 

 

 

Tableau에서 예측하기

분석 > 예측

예측 1️⃣ 트렌드 2️⃣ 계절성

 

📍 옵션 설정

➡️ 무시되는 값 없도록 하기

 

 

 

스토리라인을 제시하는 방법

➡️ 빅토리아로 가야한다!

 

 

퀴즈

 

 

오답 정리 

허허 중간이라는 말에 냅다 골라버렸다🥲

 


[섹션5] Tableau에서 애니메이션 만들기

프로젝트 개요: 세계 보건 동향

 

 

The best stats you've ever seen

You've never seen data presented like this. With the drama and urgency of a sportscaster, statistics guru Hans Rosling debunks myths about the so-called "developing world."

www.ted.com

📍 이번 시간에는 위 동영상의 2분부터 약 2분간 진행되는 애니메이션 자료를 만들어본다.

 

 

혼합 관계 편집하기

 

 

시각화 구축하기

📍 Population 기준으로 데이터 블렌딩하기

 

 

애니메이션 추가하기

Year을 필터에서 페이지로 옮기기

➡️ 이 과정에서 오류가 발생했는데 도움을 받아 무사히 해결하였다! 

 

 

[오류 해결] 태블로 오류 코드:6EA18A9E

태블로에 애니메이션 기능을 주기 위해 Year을 페이지로 옮겼는데 다음과 같은 오류가 발생했다. 아래와 같이 페이지 기능이 막힌것을 볼 수 있다. 구글링을 해도 마땅한 해결책이 나오지 않았다

hungdung99.tistory.com

 

 

혼합 데이터 수동 정렬하기

서식 > 상자없음

 

보조 데이터 원본에서 가져온 필드를 기준으로 정렬하는 방법 

📍 해당 열과 관련된 시각화에서 우선 적용할 정렬을 수동으로 지정할 수 있다. 

 

 

애니메이션에 흔적 남기기

📍 기록 표시 체크 후 원을 클릭하면 히스토리를 보여준다.

📍 Ctrl + A > 페이지 기록 > 자동

 

 

대시보드 마무리하기

 

 

퀴즈

 

 

오답 정리

 쉐브론의 뜻을 찾아보니 갈매기형 브이자라는데, 기록 표시 어디에 있는지 모르겠다🤔

 

 


[섹션6] 세부 수준 계산 (LOD)

프로젝트 개요: 지역 이익 분석

 

 

통합 문서 준비하기

지리적 계층 만들기

 

 

집계 및 세분성 (새로 고침)

세분성 ⬆️ 집계 ⬇️ (by 차원)

 

 

LOD 계산 직관

 

📍 세가지 유형의 세부 수준 계산

  1. 포함하기(상대경로)
    - 계산에 추가 차원을 포함할 수 있다 = 더 높은 수준의 세분성으로 이동할 수 있다 
    - 시각화는 차원 주 수준을 유지한다 
  2. 제외하기
    - 더 높은 집계 수준으로 이동해야 하거나 세분성을 낮추고자 하는 경우 
  3. 고정하기(절대경로)
    - 계산을 수행할 세분성 수준을 명시적으로 지정하기만 하면 된다. 

 

 

LOD 유형 1: 포함

📍 주의 도시에서 발생한 이익의 합계를 평균화 

 

 

Tableau의 ATTR(특) 이해하기

ATTR: 모든 역할에 대해 단일값이 있으면 표현식의 값을 반환하고 그렇지 않으면 *(Asterix)을 반환

➡️ ATTR은 기본적으로 값이 고유한 경우 집계되는 모든 행에 대해 하나의 값만 있는 경우, 값이 다른 경우에 해당 값을 사용한다. 집계행에 대해 서로 다른 값이 두 개 이상 있는 경우, 기능을 제대로 적용할 수 없음을 나타내는 *만 표시된다.

 

 

 

LOD 유형 2: 제외 (1부)

📍 개별 주에 대한 모든 수익의 모든 판매 합계 추출하기

📍 ATTR이 적용된 이유

  • 레벨이 필요하며 집계가 발생해야 되기 때문에
  • 이 값은 더 높은 수준의 집계에서 오기 때문에

 

 

LOD 유형 2: 제외 (2부)

  • SUM([Profit])/ATTR([LOD EXCLUDE State Profit]) * SIGN(ATTR([LOD EXCLUDE State Profit]))
  • 크기에 절댓값 취하기 (ABS) → 색상이 양수인지 음수인지를 알려준다

 

 

LOD 계산의 다중 필드

 

 

LOD 유형 3: 고정 

 

 

시각화 마무리하기

 

 

퀴즈

 

와 LOD 역대급 어려웠는데 그래도 기억해야 하는 개념은 다 익혔나보다.. ㅋㅋ ㅜㅜ 아니면 저같은 중생을 위해 문제를 쉽게 내주신건가요 강사님 🥲

 


✍️ 마무리하며

고급 강의답게 태블로의 기능을 1000% 활용할 수 있는 강의들이었다. 특히 애니메이션 기능을 이용한 TED 강의는 정말 인상깊었다. 태블로로 프로젝트를 진행하게 된다면 애니메이션 기능은 꼭 넣고싶다고 생각했다🤭 세부 표현식은 정말정말 어려웠다. 들으면서도 사실 잘 이해가 안가서 슬펐다 🥲 그래도 강사님이 하시는대로 차례차례 따라하니 결과물을 만들 수 있었고 퀴즈도 다 맞아서 나아름 선방했다고 생각한다. 오프라인에서 진행되는 태블로 수업 때 더 열심히 들어보아야겠다💪

 


* 유데미 큐레이션 바로가기 : https://bit.ly/3HRWeVL

* STARTERS 취업 부트캠프 공식 블로그 : https://blog.naver.com/udemy-wjtb

📌 본 후기는 유데미-웅진씽크빅 취업 부트캠프 4기 데이터분석/시각화 학습 일지 리뷰로 작성되었습니다.

728x90
Comments