홍동이의 성장일기
[👩💻TIL 37일차 ] 유데미 스타터스 취업 부트캠프 4기 본문
PPT 10-20장
발표 30분
자유주제 (데이터만 주어짐)
임원분들은 화려한걸 은근 좋아하신다.
대시보드 2개
- 메인은 하나 (시트가 들어가있는 것)
- 나머지 하나는 버튼 넣어서 만들어보기 (화려해보인다, 보는맛, summery)
1) 매출 2) 순이익
꼭 LOD가 들어갔으면 좋겠다.
색깔은 단조롭되, 그래프 (6개라고 치면) 하나정도만 화려하게 하면된다. (있어보이게)
데이터셋을 엄청 크게 주고 원하는 컬럼만 뽑아서 쓰기
필요없는 컬럼 ex. Null값 많은 것
잘 주제를 선택하여 SQL로 잘 추출하고 태블로로 연결하여 시각화
실제 해커톤에서는 10장 이상 나와야한다.
이번에는 4장
심화 그래프 만들기
*생키차트(사용하지 말기)
🔎 라운드 바 차트
- 막대사탕 차트랑 똑같다.
- 있어보이는 그래프
🔎 간트(Gantt)차트 - waterfall 차트
- 연속적으로 누적해가면서 증가, 감소하는 것을 한 눈에 표현하기 위한 목적으로 사용 (회계, 컨설팅 임원👍)
- 어느 필드가 자신의 역할을 제대로 못하고 있는지 알 수 있다.
- -인 경우 그래프가 내려감
profit에는 -가 있기 때문에 사용할 수 없다.
Region: 열, Sales: 행 > 마크를 간트로 변경 > 합계를 누계로 변경
🔎 막대 게이지
- 자동차 대시보드에 있는 계기판 형태로 시각화하여 현재의 상태가 어떤지 한눈에 파악하기 위한 목적으로 사용
- 원래 게이지 차트는 자리를 많이 차지하기 때문에
ZN([profit]/[Sales])
➡️ null이 아니면 식을 반환하고, null이면 0을 반환한다. 이 함수를 통해 Null값 대신 0값을 사용할 수 있다.
이중축 사용 여부확인하는 방법
- 색깔 부분이 둥그렇다.
- 막대그래프에 색깔이 끝까지 채워져있고 다른색으로 또 채워져있다.
- 막대그래프인데 선이 있다.
차원을 항상 생각한다.
게이지차트는 %였다.
열에 1만들고 차원으로 변경
득점(평균)을 옆에 놓고 이중축 > 축 동기화 > Region: 행
항상 축 동기화 후 축 편집하기
🔎 벤다이어그램
- 각 영역에 포함된 정보와 두 영역에 모두 포함되는 정보를 한 눈에 표현하기 위한 목적으로 사용
- 발표할때는 사용해도 좋다. (한 번 보여줄 때)
- 할때마다 매번 조정해야 한다. (교집합 - 특수문자 줄바꿈)
1. 벤다이어그램은 태블로에서 제공하는 시각화가 아니기 때문에 이를 만들기 위해서는 두 원의 위치 좌표가 필요하다. 그리고, 도 원과 교집합에 해당하는 위치의 텍스트를 입력하기 위해서 마찬가지로 텍스트의 좌표가 필요하다. 'Circle_locate'는 핫 음료와 콜드 음료의 집합을 분류하고 각각의 위치를 -1과 1로 표현한 것이다.
2. 'text_locate'는 핫 음료와 콜드 음료 집합 그리고 교집합에 각각의 매출액을 표현하기 위한 좌표이며 이를 -1, 0, 1로 표현하였다.
3. 'text_label'의 경우 일종의 트릭을 활용한 것인데, 교집합 사이에 값이 너무 크기 때문에 표현하기 위해서 교집합에 해당하는 값의 레이블을 특수문자와 줄바꿈으로 해결했다.
* 자신의 그래프 상황에 맞추어 조절해야한다.
전체: 원으로 변경
두 개 다 차원으로 변경
text locate는 텍스트로 변경 > 이중축 > 축동기화 > 원 크기 키우기 (축 범위 -6,6으로 변경)
type: circle locate 색상, text label: tect locate 텍스트, 넣고 싶은 값: text locate 텍스트에 넣기
🔎 불릿차트
- 불릿 그래프는 실적 데이터를 표현하기위한 그래프로 목표 달성 대비 실적 결과를 보여주기 위한 목적으로 사용 (전략팀에서 사용)
- measure가 2개 이상 필요하다.
✔️ AVG대신 SUM을 넣어도 동일한 결과
profit, target 함수 열에 놓은 후 표현 방식 > 불릿 그래프
Order date: 행으로 넣기 > 마크: 막대
단위: 텍스트 부동으로 해서 우측 상단에 넣기
🔎 캘린더 시각화
*어제 들었던 태블로 기본 강의에서 캘린더 시각화가 나왔는데 오늘 수업시간에도 나와서 반가웠다🖐️
- 주차별로 데이터의 변화를 손쉽게 파악할 수 있으며, 요일별로 함께 교차분석으로 활용하기 적절한 시각화 기법
- Tableau에서 달력을 구현하기 위해서는 모든 해당하는 날의 날짜 데이터가 반드시 있어야 한다.
- 테이블 중 모든 date가 다 있는 열이 있다. LEFT JOIN으로 다 엮는다.
샘플스토어에는 날짜가 다 들어있는 데이터가 없기 때문에 빈 값 발생!
주말에 색깔을 지정해주어야 한다. (필드만 나누고 색상표에서 색정하기)
토,일을 숫자로 나타내는 weekend 함수
- ordar date (일): 텍스트
- weekend 함수: 색상
- order date (년/월): 필터
- 주는 머리글 표시 지우기
화, 목에 주문이 없는 날이 많다.
날짜 서식 변경 가능
: 요일(Order Date) > 서식 > 기본값 > 날짜
※ 태블로 기초 과정에 나오는 캘린더 차트 만드는 방법
열: 주문 날짜 (년월), 주문 날짜 (요일)
행: 주문 날짜 (주)
텍스트: 주문 날짜 (일)
필터: 주문 날짜 (연도/월) > 없음 > 맨 밑 날짜 선택
- 타겟: 웅진 임원/실무진, 태블로 강사님
- 구글 리뷰 csv파일 조인 시킨 후 사용
- 자유주제: KPI 말고, 회사에서 더 원하는 것은 어떻게해야 돈을 더 벌 수 있느냐이다.
- '필드에' 가설 세우기 (price가 없는 경우, 굿이라면 수수료를 깎아준다, 배드면 수수료를 늘린다. 등 수수료율을 필드로 산정해도 된다.)
if rating > 40% then 수수료 80% 어쩌구저쩌구 - 시나리오, 레이아웃 제대로 짜기
우리 조에서 정한 주제는 카테고리별로 잠재력 가진 App과 현재 잘나가는 App들을 구글플레이스토어에 메인베너광고로 띄우는 것이다. 매개변수로 연령 등급과 카테고리를 주기로 하였다.
본격적인 대시보드를 만들기 전 원본 데이터 파일에 중복이 있다는 것을 발견하였다.
import pandas as pd
df = pd.read_csv('C:/Users/neulu/OneDrive/바탕 화면/태블로 데이터셋/오프라인 수업/data/googleplaystore.csv', encoding='utf-8-sig')
df.head()
df1 = df.drop_duplicates(['Category','Genres','App'], keep='first')
print(df1[df1['App']=='Accounting App - Zoho Books'])
태블로로 중복 제거를 해보려고 너무 많은 시간을 소요했다🥲
파이썬이나 SQL로 하면 금방하게 될 것 같아서 내일 여쭤보려고 한다..
세미 헤커톤 화이팅..!
* 유데미 큐레이션 바로가기 : https://bit.ly/3HRWeVL
* STARTERS 취업 부트캠프 공식 블로그 : https://blog.naver.com/udemy-wjtb
📌 본 후기는 유데미-웅진씽크빅 취업 부트캠프 4기 데이터분석/시각화 학습 일지 리뷰로 작성되었습니다.
'교육 > 유데미 스타터스 4기' 카테고리의 다른 글
[👩💻TIL 39일차 ] 유데미 스타터스 취업 부트캠프 4기 (0) | 2023.03.31 |
---|---|
[👩💻TIL 38일차 ] 유데미 스타터스 취업 부트캠프 4기 (0) | 2023.03.30 |
[👩💻TIL 36일차 ] 유데미 스타터스 취업 부트캠프 4기 (0) | 2023.03.28 |
[👩💻TIL 35일차 ] 유데미 스타터스 취업 부트캠프 4기 (0) | 2023.03.27 |
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 7주차 학습 일지 (0) | 2023.03.26 |