홍동이의 성장일기

[👩‍💻TIL 31일차 ] 유데미 스타터스 취업 부트캠프 4기 본문

교육/유데미 스타터스 4기

[👩‍💻TIL 31일차 ] 유데미 스타터스 취업 부트캠프 4기

홍동2 2023. 3. 21. 17:33

 

1. 태블로 함수, 테이블 계산 모음

차원 집계, 측정값 집계, primary 함수, partition, Rank 함수

  • window -1, 1에 first, last 넣으면 처음부터 끝까지 (전체 포괄)
  • RANK, RANK_DENSE, RANK_UNIQUE 

2. 자주 나오는 질문

  • 퀵테이블은 꼭 나쁜것일까?
    • 데이터가 모두 vlod에 나열되어있는 경우 퀵테이블 사용 권함 BUT 텍스트 테이블에 하나의 텍스트로 보여지거나 다양한 동작, 차원 고정, 필터링이 필요한 경우는 사용X
    • 제3자가 보았을 때 계산된 식보다는 해석이 어렵다는 단점이 있다. (세모를 잘 보지 않는다.)

  • 테이블 계산에서 '옆으로', '아래로'는 정확하게 무엇인가요?
    • 테이블 계산 추가 

 

  • 계산된 필드 오류 예시 및 해결방법
    • sum(profit) / sales
      : 집계된 것과 집계되지 않은 것의 혼합으로 오류 발생
      sum(profit) / sum(sales) or profit / sales로 수정   
      * avg로 묶을 때는 조심하기: avg(profit) / avg(sales) vs avg(profit / sales) 

    • if [region] = "west" then sum([sales]) end
      sum(if [region] = "west" then sum([sales]) end)

    • if [order date] = #2022-06-27# then countd([customername]) end
      집계되지 않은 주문일자와 집계된 고객명 결과 혼합으로 에러 발생
      → if ATTR([order date]) = #2022-06-27# then countd([customername]) end

3. ATTR란? (특성)

 

ATTR은 함수이다. 함수에는 로직이 존재한다. y = ax+b

ATTR에는 * 이 항상 뜬다. *은 함수의 결과값 중 하나이다.

 

ATTR의 정의는

  • if min(차원) = max(차원) then 차원 else * end
    • 하나의 속한 차원에 하나의 값이 있지 않고 다중 값이 있는 경우 *을 놓는다.
    • ex) central에는 여러 개의 도시가 있고 South에는 USA하나만 있다면 South에만 올바른 값이 나오고 나머지 도시에는 *이 나온다.
  • ATTR은 집계 함수이다. 그 결과가 VLOD에서 결정된다.
    현재 VLOD에서 이 필드가 단 하나의 값을 가지느냐 복수의 값을 가지느냐?
    단, 하나의 값을 가지면 그것을 가지고 오고 아니면 *을 가지고 오라

  • ATTR 남발하지 않기: 두번 집계하므로 퍼포먼스에 영향을 미친다. 

  • 차원을 측정값으로 바꿀 때, 집계를 연속으로 하면 ATTR로 바뀐다. 혼합 편집에서도 ATTR로 변경된다. 

[사용법]

country 우클릭한채로 텍스트에 드래그 > 특성


4. 날짜 필터링

4-1. 문자열 매개변수를 이용한 필터링

4-2. 필터를 이용한 날짜 필터링

4-3. 날짜 매개변수 이용한 필터링

4-4. MoM, YoY, MTD 

  • MTD (Month To Date)
    : 오늘이 2023-03-21이면 3월 1일부터 3월 21일까지 합계/나열 등등
    • 불연속 나열 형식 사용: 합계로 보면 언제 판매가 낮아졌는지 알 수 없다.
      ex) 판매업의 경우 월~금요일 중 언제 가장 안팔리는지 or 시간
    • 조절: 실무진에게 쓰인다. 
      자동화: 경영진에게 쓰인다. 


[만들어야 할 것]

 

date_parameter로 들어가기 > 다음에서 값 추가: 원하는 날짜 선택하기 

 

전체적인 매개변수 (뭐를 위한 껍데기X)

 

매개변수 표시할 때 '입력'으로 바꿔주기

 

Order Date 우클릭해서 가져오기 (날짜 - 불연속형)

서식에서 요일 추가하기

 

  • 날짜 매개변수 합계로 보는 방법
    • 대신 매개변수를 하나 더 만들어야 한다. 

➡️ sales에 sum하면 오류 발생하기 때문에 전체에 sum해줌

고민해보기: Sales 자리에 매개변수를 사용하여 profit, quantity같은 값으로 대체할 수 있을까?

 

📍하영언니가 알려준 방법

 

MTD는 현재를 볼때 사용하고

MoM은 결산이 난 달 = m, 결산 나기 전달 = m-1 결산이 두 번은 나야 mom을 구할 수 있다.

 

semi 자동화 [date_parameter]가 들어갔기 때문에 완전 자동화는 아니다.

 

자동화하려면 today()로 변경

파라미터 조절해도 변하지 않지만 자동화에 유용하다.
row 데이터의 행끼리 나눈 값을 avg


⭐ 엉키지 않도록 조심해야한다!


[오늘의 숙제]

  • 데이터셋의 날짜 매개변수 이용해서 대시보드 만들기
  • 디자인보다 기능 신경쓰기
  • 날짜 매개변수가 전체 대시보드를 작동시킬 수 있어야 한다.
  • 그래프 3개 만들기
  • 주제: 그래프 3개를 잘 융합할 수 있으면됨
  • 매개변수가 2- 3개있어야한다. (1. 내가 날짜를 정할 수 있는 날짜 매개변수, 2. 처음에는 현황만 보여줌(숫자), 매출에서 % 누르면 순이익 %만 보여준다 (옵션), 3. M-1, M-2, MTD, YTD)
  • 시트 1-3의 계산식이 매개변수와 연결되어있어야 한다.
  • 필터 연동하는 방법: 각각의 시트에 필터 적용 > 필터 우클릭 > 워크시트에 적용 > 선택한 워크시트에서 > 원하는 워크시트 선택 

 

  1. 시트 매개변수 대시보드에 연동되게 만들기 (날짜 / 문자열 매개변수)
  2. 과거 데이터이므로 today()는 작동이 안된다. 현재를 x라고 지정 후 MoM, YoY, MTD, YTD 만들기
  3. 기부받은 숫자, 전체 기부받은 숫자 중 몇 % 인지 매개변수 이름: 기부금액, %로 정해서 만들기
  4. 최대한 동작, 집합 피해서 만들기

 

 

혼자서 대시보드를 처음부터 끝까지 만들어보면서 사소한 기능이라도 직접 만져보면 꽤나 까다롭다는 것을 알게 되었다.


섹션 7: 데이터 관리 리터리시

 

  • 파일과 데이터베이스
    • Database와 CRUD (Create, Read, Update, Delete) 

  • 데이터 모델과 데이터베이스
    • power pivot > 데이터 모델에 추가 > 보기 > 다이어그램 보기 
    • 이 데이터를 아우르는 하나의 논리 마스터가 만들어진다.

엑셀 데이터 모델 (ERD)

 

  • 데이터 모델과 데이터 모델링
    • 데이터 모델에 해당하는 실제 정보를 담아 내는 공간을 데이터 베이스라고 한다.
    • 개념적 설계(개념적 스키마) > 논리적 설계(데이터 모델) > 물리적 설계(데이터 베이스) 
    • 데이터 모델의 종류: 관계형 / 계층형 / 네트워크 / 객체 지향 / 객체-관계

섹션 8: 데이터 처리 리터리시

 

  • 테이블
    • 더블헤더X
    • 입력방향: 위 → 아래여야 함 (왼 → 오X)
    • 셀 병합되어있는 경우 처리 어려움
    • 날짜 구분 포멧: - 
      엑셀에서 날자 포멧 바꾸는 법: 날짜 블락 씌운 후 데이터 > 텍스트 나누기 > 열 데이터 서식: 날짜

* 유데미 큐레이션 바로가기 : https://bit.ly/3HRWeVL

* STARTERS 취업 부트캠프 공식 블로그 : https://blog.naver.com/udemy-wjtb

📌 본 후기는 유데미-웅진씽크빅 취업 부트캠프 4기 데이터분석/시각화 학습 일지 리뷰로 작성되었습니다.

728x90
Comments