홍동이의 성장일기

[👩‍💻TIL 37일차 ] 유데미 스타터스 취업 부트캠프 4기 본문

교육/유데미 스타터스 4기

[👩‍💻TIL 37일차 ] 유데미 스타터스 취업 부트캠프 4기

홍동2 2023. 3. 29. 19:03

 

PPT 10-20장
발표 30분
자유주제 (데이터만 주어짐)

임원분들은 화려한걸 은근 좋아하신다.

 

대시보드 2개

  • 메인은 하나 (시트가 들어가있는 것)
  • 나머지 하나는 버튼 넣어서 만들어보기 (화려해보인다, 보는맛, summery)
    1) 매출 2) 순이익

 

꼭 LOD가 들어갔으면 좋겠다.

 

색깔은 단조롭되, 그래프 (6개라고 치면) 하나정도만 화려하게 하면된다. (있어보이게)

데이터셋을 엄청 크게 주고 원하는 컬럼만 뽑아서 쓰기

필요없는 컬럼 ex. Null값 많은 것

잘 주제를 선택하여 SQL로 잘 추출하고 태블로로 연결하여 시각화

 

실제 해커톤에서는 10장 이상 나와야한다.

이번에는 4장


심화 그래프 만들기

*생키차트(사용하지 말기)

 

🔎 라운드 바 차트

  • 막대사탕 차트랑 똑같다.
  • 있어보이는 그래프

🔎 간트(Gantt)차트 - waterfall 차트

  • 연속적으로 누적해가면서 증가, 감소하는 것을 한 눈에 표현하기 위한 목적으로 사용 (회계, 컨설팅 임원👍)
  • 어느 필드가 자신의 역할을 제대로 못하고 있는지 알 수 있다.
  • -인 경우 그래프가 내려감

 

profit에는 -가 있기 때문에 사용할 수 없다.

 

Region: 열, Sales: 행 > 마크를 간트로 변경 > 합계를 누계로 변경

 

Region: 색상, waterfall: 크기

 

분석 > 총계 > 행 총합계 표시
완성👍

 


🔎 막대 게이지 

  • 자동차 대시보드에 있는 계기판 형태로 시각화하여 현재의 상태가 어떤지 한눈에 파악하기 위한 목적으로 사용 
  • 원래 게이지 차트는 자리를 많이 차지하기 때문에
ZN([profit]/[Sales])

 

➡️ null이 아니면 식을 반환하고, null이면 0을 반환한다. 이 함수를 통해 Null값 대신 0값을 사용할 수 있다.

 

이중축 사용 여부확인하는 방법

  • 색깔 부분이 둥그렇다.
  • 막대그래프에 색깔이 끝까지 채워져있고 다른색으로 또 채워져있다. 
  • 막대그래프인데 선이 있다.

차원을 항상 생각한다.

게이지차트는 %였다.

 

 

열에 1만들고 차원으로 변경

 

득점(평균)을 옆에 놓고 이중축 > 축 동기화 > Region: 행 

 

항상 축 동기화 후 축 편집하기

 


🔎 벤다이어그램

  • 각 영역에 포함된 정보와 두 영역에 모두 포함되는 정보를 한 눈에 표현하기 위한 목적으로 사용
  • 발표할때는 사용해도 좋다. (한 번 보여줄 때)
  • 할때마다 매번 조정해야 한다. (교집합 - 특수문자 줄바꿈)

 

1. 벤다이어그램은 태블로에서 제공하는 시각화가 아니기 때문에 이를 만들기 위해서는 두 원의 위치 좌표가 필요하다. 그리고, 도 원과 교집합에 해당하는 위치의 텍스트를 입력하기 위해서 마찬가지로 텍스트의 좌표가 필요하다. 'Circle_locate'는 핫 음료와 콜드 음료의 집합을 분류하고 각각의 위치를 -1과 1로 표현한 것이다.

 

2. 'text_locate'는 핫 음료와 콜드 음료 집합 그리고 교집합에 각각의 매출액을 표현하기 위한 좌표이며 이를 -1, 0, 1로 표현하였다.

3. 'text_label'의 경우 일종의 트릭을 활용한 것인데, 교집합 사이에 값이 너무 크기 때문에 표현하기 위해서 교집합에 해당하는 값의 레이블을 특수문자와 줄바꿈으로 해결했다. 

* 자신의 그래프 상황에 맞추어 조절해야한다.

 

전체: 원으로 변경

 

두 개 다 차원으로 변경 

 

text locate는 텍스트로 변경 > 이중축 > 축동기화 > 원 크기 키우기 (축 범위 -6,6으로 변경)

type: circle locate 색상, text label: tect locate 텍스트, 넣고 싶은 값: text locate 텍스트에 넣기

 


🔎 불릿차트

  • 불릿 그래프는 실적 데이터를 표현하기위한 그래프로 목표 달성 대비 실적 결과를 보여주기 위한 목적으로 사용 (전략팀에서 사용)
  • measure가 2개 이상 필요하다.

✔️ AVG대신 SUM을 넣어도 동일한 결과 

profit, target 함수 열에 놓은 후 표현 방식 > 불릿 그래프

 

 

Order date: 행으로 넣기 > 마크: 막대

단위: 텍스트 부동으로 해서 우측 상단에 넣기


🔎 캘린더 시각화

*어제 들었던 태블로 기본 강의에서 캘린더 시각화가 나왔는데 오늘 수업시간에도 나와서 반가웠다🖐️

 

  • 주차별로 데이터의 변화를 손쉽게 파악할 수 있으며, 요일별로 함께 교차분석으로 활용하기 적절한 시각화 기법
  • Tableau에서 달력을 구현하기 위해서는 모든 해당하는 날의 날짜 데이터가 반드시 있어야 한다.
  • 테이블 중 모든 date가 다 있는 열이 있다. LEFT JOIN으로 다 엮는다.

샘플스토어에는 날짜가 다 들어있는 데이터가 없기 때문에 빈 값 발생!

주말에 색깔을 지정해주어야 한다. (필드만 나누고 색상표에서 색정하기)

 

토,일을 숫자로 나타내는 weekend 함수

 

캘린더 시각화 전체 레이아웃

 

  • ordar date (일): 텍스트
  • weekend 함수: 색상
  • order date (년/월): 필터
  • 주는 머리글 표시 지우기

 

화, 목에 주문이 없는 날이 많다.

 

날짜 서식 변경 가능

: 요일(Order Date) > 서식 > 기본값 > 날짜


※ 태블로 기초 과정에 나오는 캘린더 차트 만드는 방법

열: 주문 날짜 (년월), 주문 날짜 (요일)

행: 주문 날짜 (주)

텍스트: 주문 날짜 (일)

필터: 주문 날짜 (연도/월) > 없음 > 맨 밑 날짜 선택

 


  • 타겟: 웅진 임원/실무진, 태블로 강사님
  • 구글 리뷰 csv파일 조인 시킨 후 사용
  • 자유주제: KPI 말고, 회사에서 더 원하는 것은 어떻게해야 돈을 더 벌 수 있느냐이다. 
  • '필드에' 가설 세우기 (price가 없는 경우, 굿이라면 수수료를 깎아준다, 배드면 수수료를 늘린다. 등 수수료율을 필드로 산정해도 된다.)
    if rating > 40% then 수수료 80% 어쩌구저쩌구
  • 시나리오, 레이아웃 제대로 짜기

 

우리 조에서 정한 주제는 카테고리별로 잠재력 가진 App과 현재 잘나가는 App들을 구글플레이스토어에 메인베너광고로 띄우는 것이다. 매개변수로 연령 등급과 카테고리를 주기로 하였다.

 

본격적인 대시보드를 만들기 전 원본 데이터 파일에 중복이 있다는 것을 발견하였다.

import pandas as pd
df = pd.read_csv('C:/Users/neulu/OneDrive/바탕 화면/태블로 데이터셋/오프라인 수업/data/googleplaystore.csv', encoding='utf-8-sig')
df.head()

df1 = df.drop_duplicates(['Category','Genres','App'], keep='first')
print(df1[df1['App']=='Accounting App - Zoho Books'])

태블로로 중복 제거를 해보려고 너무 많은 시간을 소요했다🥲

파이썬이나 SQL로 하면 금방하게 될 것 같아서 내일 여쭤보려고 한다..

세미 헤커톤 화이팅..!


* 유데미 큐레이션 바로가기 : https://bit.ly/3HRWeVL

* STARTERS 취업 부트캠프 공식 블로그 : https://blog.naver.com/udemy-wjtb

📌 본 후기는 유데미-웅진씽크빅 취업 부트캠프 4기 데이터분석/시각화 학습 일지 리뷰로 작성되었습니다.

728x90
Comments