홍동이의 성장일기

[👩‍💻TIL 38일차 ] 유데미 스타터스 취업 부트캠프 4기 본문

교육/유데미 스타터스 4기

[👩‍💻TIL 38일차 ] 유데미 스타터스 취업 부트캠프 4기

홍동2 2023. 3. 30. 18:44

 

  • 남들이 생각하지 않는 point of view에서 바라보아야 한다. 
  • 발표할때는 배경이 하얀색이거나 연한 파란색이여야 한다. (파스텔톤으로 보기 쉽게)
  • 말을 천천히 하는 것이 좋다.
  • 조 소개, 턴이 돌아갈때 자기소개 해야한다.
  • 기능 실수는 있어도 되지만 숫자 실수는 절대 🙅‍♀️

목차

심화 그래프

  • 바벨 차트
  • 깔대기 퍼넬 차트
  • 워드 클라우드

 

레이아웃

  • 컨테이너 설정 (부동 → 바둑판)
  • 주석으로 레이아웃 잡기
  • min(1) 원 활용해서 대시보드 구성하기

📍레이아웃 이쁘게 만드는 법

마크 더블클릭 > ' '  > 텍스트 > 표준: 전체보기

아무것도 쓰지 않고 ok 

 

모퉁이: 매우 둥근 모양, 음영: 파스텔톤 

계속 주석 추가 > 영역 추가해서 먼저 레이아웃을 잡은 모양대로 만들기 

 

이름을 '레이아웃'으로 설정해 준 뒤 대시보드에 추가하기 

 

컨테이너 박스 사용

부동 > 가로 or 세로 컨테이너를 만든 박스 사이즈에 맞게 지정

 

바둑판식 > 만들어놓은 차트 넣기 

차트의 배경을 투명으로 놓으면 깔끔하게 들어간다.

높이 고정해주면 어그러지지 않는다.


📍리스트 예쁘게 만들기 

  • 인사팀 대시보드에서 유용하다. (벤다이어그램 만들때와 유사하게 만든다.)
  • 상세 리스트를 만들기 좋음

 

무슨 차원으로 나누고 싶은지 생각하기 (행) > 전체: 원으로 변경 > 원을 없애고 싶으면 하얀색으로 변경하면 된다.

 

깔끔하게 완성!

  • 제품을 한 번만 구매한 것이 아니기 때문에 Order date를 넣으면 안된다. 값이 나온다고 무조건 맞는 것이 아님!
  • 색상으로 인사이트를 바로 뽑을 수 있는 것 추가하기 (앱 업데이트 1년안에 되었는지 등) 
  • Region: 중복된 값 있어서 정렬이 잘 안맞는다.
  • 레이블이 다른 마크와 겹치도록 허용하여 크기 조절해주기 

📍워드클라우드 

 

대시보드 > 이미지 내보내기 > svg(스케일러블 벡터 그래픽): 디자이너가 얘로 다시 만들 수 있는 것

➡️ 태블로로 유일하게 만들 수 있음

 

프레젠테이션 첫 화면에 쓰인다.

 


  • 이뻐보이는 대시보드에 스포이드로 따서 색상 사용하기 (영감받아서) 
  • 색상표를 적어놓는 사람들도 있음!
  • 웅진 아이콘 따서 넣기

깔때기

  • A/B테스트, 프로젝트 매니저로 들어갈 경우 깔때기 차트가 중요하다.
  • 온라인 사업하는 회사는 다 사용한다!
  • 필드를 잘 설정해야 한다 (절차가 있어야함)

 

합계(Count): 행 > Process를 색상으로 구분 > Count를 크기로 설정 > 앞 두가지 텍스트 레이블에 추가

*정렬을 잘 맞춰주어야 한다.

*깔때기 값은 주로 count를 사용한다 (모든 Value)


🔎 중복데이터 해결 방법: 조인이나 관계를 맺을 때 카더널리티를 일:다 또는 일:일로 변경하면 왼쪽 테이블에 대해서 중복이 사라진다. 그치만 우리는 조인, 관계를 맺지 않아서 SQL을 사용하기로 했다.

* Sentiment 파일을 사용하지 않기로 한 이유: 전체 app의 수는 9661인데 Sentiment 정보가 있는 app은 1075로 두 데이터셋을 동시에 사용하기에는 정보의 손실률이 매우 크기 때문이다.

 

데이터 전처리

1. 중복행 제거

SELECT DISTINCT App, Category, Rating, max(Reviews) as Reviews, Size, Installs, Type, ContentRating, Genres, LastUpdated, CurrentVer, AndroidVer
FROM googleplaystore
group by Category, Genres, App;
  •  Life Made WI_FI Touchscreen Photo Frame 제거
    총 행 개수: 9746개

 

2. 필드 변경

  • Installs의 + 분리
  • Rating: 실수형

 

표준화
# 1.카테고리의 install수에 대한 점수화 진행 (install 대비 reviews)
{ FIXED [Category],[Installs]: AVG([Reviews])}

# 2.표준화
{ FIXED [App],[Category]: SUM([Reviews]/[install 대비 reviews]*[Rating])}

# 3.점수 100점으로 환산
AVG([표준화])/AVG({ FIXED [Category]:MAX([표준화])})*100

 

잠재력 있는 Installs 기준 설정

테이블 계산의 보조 계산 기능을 사용하여 각 Installs에 대한 구성 비율을 확인해 보았을 때 25%~75%내에 있는 Intalls를 잠재력 있는 App으로 보기로 하였다.

 

그리고 우리는 카테고리에 따라 100점을 만점으로 주기로 하였다. 전체로 놓으면 점수의 차이가 너무 커지기 때문이다.

이에 따른 별점을 표현해주기 위해 와플차트를 만들기로 하였다. 와플차트의 식은 다음과 같이 구성하였다.

# TC_Score: 
WINDOW_SUM(SUM(IF [Category] = [Category Parameter] THEN [Score] END))

# TC_TotalScore: 
WINDOW_MAX(MAX(IF [Category] = [Category Parameter] THEN [Score] END))

# TC_Percentage
ROUND([TC_sales]/[TC_totalsales],1)

# TC_Color
IF [TC_percentage]=0 THEN 'grey'
ELSEIF [index] / WINDOW_MAX([index]) <= [TC_percentage] THEN WINDOW_MAX(MAX([Category]))
ELSE "grey"
END

# Columns
[index]%[@columns]

# Rows
INT([index]/[@columns])

#path
IIF(CONTAINS([App],'s'), 1, 10)

* path 식을 작성하는 과정에서 한가지 이상이 참이면서 또 모든 것을 만족하면 작동하지 않는 아주 불편한 기능을 마주하였다.. 그리고 이렇게 만든 와플차트를 다른 차원, 측정값들과 하나의 리스트를 넣는것에 어려움이 있다.

 

우선 10점 만점으로 표시해줄 수 있는 와플차트가 완성되었다.


* 유데미 큐레이션 바로가기 : https://bit.ly/3HRWeVL

* STARTERS 취업 부트캠프 공식 블로그 : https://blog.naver.com/udemy-wjtb

📌 본 후기는 유데미-웅진씽크빅 취업 부트캠프 4기 데이터분석/시각화 학습 일지 리뷰로 작성되었습니다.

 

728x90
Comments