홍동이의 성장일기
[👩💻TIL 36일차 ] 유데미 스타터스 취업 부트캠프 4기 본문
태블로 평가판이 끝났었는데 새로운 버전을 다운받으니 다시 평가판 2주를 받았다! 🙌
1. LOD 날짜 함수
❓{} 쓰는 이유: 가장 큰 연도로 전체 행에 고정해준다.
내년이 2024년으로 바꾸면 자동으로 업데이트 된다.
= 데이터가 자동으로 업데이트 되어도 식을 바꾸지 않아도 된다.
recent/last year을 불연속형으로 변경
➡️ 이 식을 datediff 식에 넣으면 된다.
2. 심화 그래프 만들기
📍와플 차트
🔎 구간차원?
불연속형 필드는 구간 차원의 집합이라고 말할 수 있다. (ex. Central, East, South, West)
그렇다면 연속형 측정 값에서 구간 차원 추가는? 히스토그램? 최적의 bin 수?
Number of Bins = 3 + log2(n) * log(n) 수식에서 n은 테이블의 불연속형 행 수이다.
➡️ 이론적으로 존재는 하지만 사용하기는 어렵다.
1. INDEX 필드 생성
2. 정수 매개변수 만들기:10
(사람이 10x10 = 100명이라서)
3. path 생성
path 구간차원 생성
4. TC_sales, TC_totalsales, TC_percentage, TC_color 만들기
➡️ TC_sales와 TC_totalsales의 식은 동일하다.
5. cols, rows 만들기
- path(구간차원) > 누락된 값 표시 체크해주기
- path(구간차원) 세부정보에 놓기'
6. cols, rows 구간차원 추가
다음을 사용하여 계산 > path(구간차원)
➡️ Rows도 같은 방법으로 선택하기
TC_color을 색상에 드래그 앤 드롭해주기
다음을 사용하여 계산 > path(구간차원)
테이블 계산 편집 > 중첩된 계산: TC_totalsales로 변경 > 특정차원: Region도 선택
- Rows > 축 편집 > 반전
- TC_percentage 넣고 불연속형으로 변경
마크 > 모양 > 추가 모양에서 모양 할당 후 확인
원하는대로 각종 서식을 지정해주면 완료!
회사에서는 거의 사용하지 않는다
⭐ 게이지차트
- 비율 지표
- 게이지 부분이 될 1,2,4,5 반원과 사용하지 않는 3 반원에 대한 계산식
- Slice 1: IF 비율 > .5 THEN 비율 -.5 ELSE 0 END
- Slice 2: IF 비율 > .5 THEN 1 - 비율 ELSE .5 END
- Slice 3: 1 (하얀색, 안보이게)
- Slice 4: IF 비율 < .5 THEN 비율 ELSE .5 END
- Slice 5: IF 비율 < .5 THEN .5 - 비율 ELSE 0 END - 이중축을 이용한 도넛 차트 (중간에 하얀색 넣기)
1. 비율 지표
WINDOW_SUM을 이용해 전체 Sales 누적 합계에서 sales의 비율을 구하는 식
2. 앞서 만든 Sales 비율을 이용해 범위 자르기
3. 이중 축을 이용한 도넛 차트
열 선반에 0축 2개를 만들어 뒤축 우클릭 > 이중축 선택
원이 안뜨면 마크 > 전체 > 파이차트로 변경
4. 날짜 필터 설정
- 도넛차트 생성 후 데이터를 년, 월 별 세세하게 구별하기 위함
- 년, 월 별로 보기 위한 date 매개변수 생성 및 날짜 필터 계산식 만들기
- 매개변수 표시하고 날짜 필터(True) 걸기
5. 그래프 만들기
- Category 별로 비율을 확인하기 위해 열 선반에 Category 추가
- 앞서 만들어 놓은 날짜 필터를 필터 선반에 올려 년, 월 구분
6. Gauge chart 그리기
첫번째 합계(0) 설정
측정값이름 > 색상
- 1, 4는 같은 색을 주어 비율에 따라 보이게 표현 (특별한 색)
- 2, 5는 회색으로 색을 주어 원하는 비율만 눈에 띄도록 표현
- 3은 보이지 않게 흰색으로 표현
- 두번째 0축 Sales(%)에 레이블 추가
측정값 > 필터 > slice 1-5만 선택
🔎응용: 비율 별 색 구분
➡️ % 범위 별 색을 지정해주기 위한 계산식 생성 (비율을 0~20, 20~40, 40~100 단위로 보기 위한 Sales 범위 계산식)
세부정보에 넣은 후 색상으로 변경하기
색상이 15개가 떠야한다. 나는 날짜를 2021년 1월 27일로 해주니 해결되었다.
- 영(0) 기준선, 격자선: 없음 설정
- 머리글 표시 없애주기
- 열에 대한 필드 레이블 숨기기
✔️ 카테고리에 따라 값이 변하는 것이 아니라 우리가 설정해준 범위대로 색깔이 변하는 것이다.
jitter bar 차트
난수 사용: Random() 공식 함수 아니므로 중단 가능성 있음
- 세부정보에 product name 넣기
- Region을 색상으로
- fix_region_sum(sales)를 불연속형으로 바꾸면 차원으로 바뀌면서 위에 숫자를 텍스트로 내보낸다.
✔️ 고차원이면서 계층화가 되어있는 차원이어야 좋다.
✔️ Row 데이터 까보는 습관 가지기~
개인 숙제
대시보드 1개에 3개의 시트
매개변수는 해당 차트에만 적용 가능하게
- 시트1:
게이지 차트 카테고리 말고 다른 차원 매개변수 등록
- 시트2:
와플 차트 first class 대체하여서 매개변수 등록 - 시트3:
Jitter bar chart - 매개변수 등록 sum/avg 변환
- 자격증 Test2 1-20까지 풀고 점수 매겨서 틀린 문제 대시보드 뒷장에 텍스트로 삽입
와플 차트에 매개변수를 등록할때 어려움을 겪었다. first class를 대체하여 매개변수를 등록해야했는데 first class가 쓰인 path식을 아무리 바꾸어도 값이 잘 변경되지 않았던 것..! 내 롤모델 하영언니가 완벽하게 해결해주었다⭐
일단 path식은 구간을 설정해주는 용도로 사용된 것이기 때문에 iif문에 무엇을 넣어도 크게 상관이 없는 것 같다. 그보다 뒤에 쓰인 1, 100이 해당 구간을 100개로 쪼개주는 역할을 하는 것 같다.
변경해준 식은 TC_sales와 TC_totalsales이다.
원래 만들었던 그래프는 ship mode별 합계가 아니었다! sum([Sales])가 통째로 들어있어서 전체 Sales에 대한 그래프가 만들어졌었던 것이다. 이 부분이 SUM(IF [class] = [Ship Mode] THEN [Sales] END)로 변경되었다. 이 식을 해석하면 매개변수로 설정한 class가 ship mode와 같다면 sales의 합을 구하라는 것이다. 이렇게 하면 매개변수에 해당하는 sales만 합해지게 되어 매개변수를 변경할 때마다 결과가 변하게 된다.
* class는 매개변수로 따로 만들어주었다.
* 또 하나 알게된점은 '다음에서 값 추가'로 매개변수를 만들었다면 알맹이를 만들어주지 않아도 된다는 것이다!
남은 시간에는 태블로 자격증 시험을 대비할 수 있는 문제를 풀어보았다. 20문제중에 11문제 맞췄다🥲 모르는 문제가 넘 많았다.. 시험보기 전까지 최대한 익혀서 들어갈 수 있도록 하잣💪
오늘의 방과후 태블로 공부! 아직 모호한 기본기를 잡기 좋은 강의인것 같다.
특히 날짜 필터로 캘린터 차트를 만드는 과정이 재미있었다🙂
* 유데미 큐레이션 바로가기 : https://bit.ly/3HRWeVL
* STARTERS 취업 부트캠프 공식 블로그 : https://blog.naver.com/udemy-wjtb
📌 본 후기는 유데미-웅진씽크빅 취업 부트캠프 4기 데이터분석/시각화 학습 일지 리뷰로 작성되었습니다.
'교육 > 유데미 스타터스 4기' 카테고리의 다른 글
[👩💻TIL 38일차 ] 유데미 스타터스 취업 부트캠프 4기 (0) | 2023.03.30 |
---|---|
[👩💻TIL 37일차 ] 유데미 스타터스 취업 부트캠프 4기 (0) | 2023.03.29 |
[👩💻TIL 35일차 ] 유데미 스타터스 취업 부트캠프 4기 (0) | 2023.03.27 |
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 7주차 학습 일지 (0) | 2023.03.26 |
[👩💻TIL 34일차 ] 유데미 스타터스 취업 부트캠프 4기 (0) | 2023.03.24 |