홍동이의 성장일기
[👩💻TIL 20일차 ] 유데미 스타터스 취업 부트캠프 4기 본문
목차
[섹션4] Tableau의 고급 데이터 준비 + 분석
프로젝트 개요: 소매 부문 전망
Tableau에서 상자 그림 작성하기
기계 친화적인 형식으로 피벗하기
📍 분석 > 박스플롯
상자 그림 분석하기
➡️ NSW, QLD, VIC에는 특정 주에서 전반적인 성과 측면에서 실적이 저조한 회사가 있다. 그리고 QLD에는 실적을 초과하는 회사가 있다. VIC는 박스 부분이 위쪽에 있는 것을 볼 수 있는데 이것은 이 비즈니스 환경 설정이 꽤 좋다는 의미이다. (순이익이 높다는 것이기 때문에) 또한 박스 부분이 조밀하기 때문에 순이익률 측면에서 임의의 회사의 위치에 대한 불확실성이 적다. 중앙값 또한 다른 주에 비해 높다.
대용량 데이터 소스 작업하기
📍 Ctrl + - 로 불필요한 행 제거
📍 Tip: 데이터를 복사한 후 사본을 아카이브 폴더로 이동시켜 놓는다. 향후 언제든지 원본으로 되돌릴 수 있다.
1️⃣ 데이터 집합을 수정하는 방법
: 비어있는 열은 문자열로 처리된다 → 숫자열과 피벗 시 텍스트로 설정된다.
➡️ [해결방법] 해당 열 숨기기
2️⃣ 대용량 데이터 집합을 처리하는 방법
➡️ 데이터 소스 필터 사용 > F1 > 날짜 범위 > 시작범위: 2010-01-01
※ 데이터 소스 필터는 데이터 집합의 연결 수준에서 적용된다.
피벗 및 분할
실제 소매업은 어떤 모습인가?
📍 축 편집 > 각 행 또는 열에 독립적인 축 범위
➡️ 12월마다 피크가 발생한다. 가장 최악의 달은 2월이다. 거의 다 비슷한 패턴을 보인다.
➡️ 신문과 책은 최근들어 하향세를 띄고 있다.
데이터 소스 필터의 주요 활용 사례
데이터 소스 필터의 주요 목적: 분석에 사용하지 않을 카테고리나 행을 완전히 제거하는 것
➡️ 우리가 관심있는 것은 의류 소매업이기 때문에 차트에 있는 다른 모든 정보가 필요하지 않다.
※ 데이터 소스 수준에 필터 추가하기
➡️ 새 탭에 산업을 드래그하면 다른 옵션과 필터가 없다. 데이터 소스 수준에서 필터링되었기 때문이다.
: 분석하는 데이터를 줄여나가는 것을 가능하게 한다.
추세선
➡️ But 인구 수가 고려되지 않았음 (인구 수로 데이터 정규화를 해야한다) → 1인당 소비 변화율을 알 수 있다
시계열 고급 혼합
데이터 > 혼합 관계 편집
➡️ 선이 끊어져보일 수 있는 단점이 있다.
➡️ 혼합 관계 편집에서 분기 제거
➡️ 데이터 원본 > 필터 편집 > F1 > 개월 > 3월 선택
1인당 매출 계산하기
회전율 / 인구 = 1인당 매출
📍 혼합 전체에 계산 필드 만들기
➡️ 태블로는 두 데이터 집합에 쿼리를 보낸 다음 뷰의 집계 수준으로 데이터를 집계하도록 데이터 집합에 요청한다. 그런 다음 데이터가 반환되면 두 데이터 집합에만 혼합이라고 하는 결합이 설정된다. 따라서 집계가 반드시 있어야 한다.
➡️ Queensland와 Western Australia는 지출이 아니라 인구 증가가 상승 트렌드에 기인했음을 알 수 있다.
➡️ New South Wales와 Victoria는 인구 규모에 관계없이 산업 자체가 성장하고 있다.
따라서 New South Wales와 비즈니스 환경이 가장 유사한 곳은 Victoria이다.
Tableau에서 예측하기
분석 > 예측
예측 1️⃣ 트렌드 2️⃣ 계절성
📍 옵션 설정
➡️ 무시되는 값 없도록 하기
스토리라인을 제시하는 방법
➡️ 빅토리아로 가야한다!
![](https://t1.daumcdn.net/keditor/emoticon/niniz/large/023.gif)
퀴즈
오답 정리
허허 중간이라는 말에 냅다 골라버렸다🥲
[섹션5] Tableau에서 애니메이션 만들기
프로젝트 개요: 세계 보건 동향
The best stats you've ever seen
You've never seen data presented like this. With the drama and urgency of a sportscaster, statistics guru Hans Rosling debunks myths about the so-called "developing world."
www.ted.com
📍 이번 시간에는 위 동영상의 2분부터 약 2분간 진행되는 애니메이션 자료를 만들어본다.
혼합 관계 편집하기
시각화 구축하기
📍 Population 기준으로 데이터 블렌딩하기
애니메이션 추가하기
Year을 필터에서 페이지로 옮기기
➡️ 이 과정에서 오류가 발생했는데 도움을 받아 무사히 해결하였다!
[오류 해결] 태블로 오류 코드:6EA18A9E
태블로에 애니메이션 기능을 주기 위해 Year을 페이지로 옮겼는데 다음과 같은 오류가 발생했다. 아래와 같이 페이지 기능이 막힌것을 볼 수 있다. 구글링을 해도 마땅한 해결책이 나오지 않았다
hungdung99.tistory.com
혼합 데이터 수동 정렬하기
📍 해당 열과 관련된 시각화에서 우선 적용할 정렬을 수동으로 지정할 수 있다.
애니메이션에 흔적 남기기
📍 기록 표시 체크 후 원을 클릭하면 히스토리를 보여준다.
📍 Ctrl + A > 페이지 기록 > 자동
대시보드 마무리하기
퀴즈
오답 정리
쉐브론의 뜻을 찾아보니 갈매기형 브이자라는데, 기록 표시 어디에 있는지 모르겠다🤔
[섹션6] 세부 수준 계산 (LOD)
프로젝트 개요: 지역 이익 분석
통합 문서 준비하기
집계 및 세분성 (새로 고침)
세분성 ⬆️ 집계 ⬇️ (by 차원)
LOD 계산 직관
📍 세가지 유형의 세부 수준 계산
- 포함하기(상대경로)
- 계산에 추가 차원을 포함할 수 있다 = 더 높은 수준의 세분성으로 이동할 수 있다
- 시각화는 차원 주 수준을 유지한다 - 제외하기
- 더 높은 집계 수준으로 이동해야 하거나 세분성을 낮추고자 하는 경우 - 고정하기(절대경로)
- 계산을 수행할 세분성 수준을 명시적으로 지정하기만 하면 된다.
LOD 유형 1: 포함
📍 주의 도시에서 발생한 이익의 합계를 평균화
Tableau의 ATTR(특) 이해하기
ATTR: 모든 역할에 대해 단일값이 있으면 표현식의 값을 반환하고 그렇지 않으면 *(Asterix)을 반환
➡️ ATTR은 기본적으로 값이 고유한 경우 집계되는 모든 행에 대해 하나의 값만 있는 경우, 값이 다른 경우에 해당 값을 사용한다. 집계행에 대해 서로 다른 값이 두 개 이상 있는 경우, 기능을 제대로 적용할 수 없음을 나타내는 *만 표시된다.
LOD 유형 2: 제외 (1부)
📍 개별 주에 대한 모든 수익의 모든 판매 합계 추출하기
📍 ATTR이 적용된 이유
- 레벨이 필요하며 집계가 발생해야 되기 때문에
- 이 값은 더 높은 수준의 집계에서 오기 때문에
LOD 유형 2: 제외 (2부)
- SUM([Profit])/ATTR([LOD EXCLUDE State Profit]) * SIGN(ATTR([LOD EXCLUDE State Profit]))
- 크기에 절댓값 취하기 (ABS) → 색상이 양수인지 음수인지를 알려준다
LOD 계산의 다중 필드
LOD 유형 3: 고정
시각화 마무리하기
퀴즈
와 LOD 역대급 어려웠는데 그래도 기억해야 하는 개념은 다 익혔나보다.. ㅋㅋ ㅜㅜ 아니면 저같은 중생을 위해 문제를 쉽게 내주신건가요 강사님 🥲
✍️ 마무리하며
고급 강의답게 태블로의 기능을 1000% 활용할 수 있는 강의들이었다. 특히 애니메이션 기능을 이용한 TED 강의는 정말 인상깊었다. 태블로로 프로젝트를 진행하게 된다면 애니메이션 기능은 꼭 넣고싶다고 생각했다🤭 세부 표현식은 정말정말 어려웠다. 들으면서도 사실 잘 이해가 안가서 슬펐다 🥲 그래도 강사님이 하시는대로 차례차례 따라하니 결과물을 만들 수 있었고 퀴즈도 다 맞아서 나아름 선방했다고 생각한다. 오프라인에서 진행되는 태블로 수업 때 더 열심히 들어보아야겠다💪
* 유데미 큐레이션 바로가기 : https://bit.ly/3HRWeVL
* STARTERS 취업 부트캠프 공식 블로그 : https://blog.naver.com/udemy-wjtb
📌 본 후기는 유데미-웅진씽크빅 취업 부트캠프 4기 데이터분석/시각화 학습 일지 리뷰로 작성되었습니다.
'교육 > 유데미 스타터스 4기' 카테고리의 다른 글
[👩💻TIL 22일차 ] 유데미 스타터스 취업 부트캠프 4기 (0) | 2023.03.09 |
---|---|
[👩💻TIL 21일차 ] 유데미 스타터스 취업 부트캠프 4기 (0) | 2023.03.08 |
[오류 해결] 태블로 오류 코드:6EA18A9E (0) | 2023.03.06 |
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 4주차 학습 일지 (0) | 2023.03.04 |
[👩💻TIL 19일차 ] 유데미 스타터스 취업 부트캠프 4기 (0) | 2023.03.03 |