홍동이의 성장일기
[👩💻TIL 33일차 ] 유데미 스타터스 취업 부트캠프 4기 본문
LOD를 할 때 row 데이터를 모두 확인해야 한다.
- 3, 4개 랜덤으로 뽑아서 확인하기
- rowcount
- 앞에 index 삽입하여 필터링 되었는지 확인하기
1. LOD Include, Exclude 예제
: 필터의 영향을 받는다. (Order of Operation)
📍Include
- Include를 사용하려면 데이터의 깊이가 상대적으로 깊어야 한다.
- 집계를 2번해야할 때 유용하다. (평균의 최대값, 최소값)
- VLOD에 설정한 차원의 영향을 include한 차원을 기준으로 결과 출력
State별 city들의 평균의 최대, 최소를 선택해서 표시한다.
Include에서 고정해야하는 차원: city
뒷단에서 city에 대한 sales의 평균을 만든다.
LOD는 남을 이해시켜야 한다. 설명이 구구절절 나오면 LOD를 사용하면 안된다.
Exclude
Exclude에 설정된 차원이 반드시 LOD에 들어가 있어야 한다. 안들어가 있다면 사용하는 이유가 없다. LOD값은 row level로 집계를 해주어야한다. sum([profit]) / {Exclude : sum() } 하면 오류가 난다. 집계되지 않았기 때문에. 한번 더 뭐든 씌워주어야 한다. sum([profit]) / ATTR({Exclude : sum() })
* avg/sum/attr을 해도 값이 모두 똑같다. 강사님은 불안해서 attr 사용
- 특성으로 설정됨
- exclude LOD에 명시된 차원을 제외한 후 집계가 이루어지고, Vlod에 맞춰 표현하기 위해 첫번째 단계 결과를 복제함
city를 exclude 해주기
sum(profit)
- 앞: city의 profit 합계
- 뒤: state의 profit
끌어오는 100%는 이미 VLOD에 있다. 필터에 무언가를 넣는 순간 include, exclude의 결과가 달라진다. 자유도가 떨어진다.
같은 차원이 있는 것을 비교하는 것도 exclude로 사용할 수 있다. 차원을 속이는 것이다.
나머지것들이 Binder보다 큰지 작은지 확인하고 싶다.
매개변수로 기준 변경 가능하다.
차원이 달라지면 안된다. 같은 차원에서 보고 있는 것.
LOD는 정제되고 깔끔한 데이터에서만 사용가능하다. 회사에서도 검증된 테이블에서만 사용 가능하다.
2. LOD Fixed 이론 & 예제
Fixed: 내가 원하는 특정차원으로 화면을 고정시키는 것
- 화면 VLOD를 고려하지 않고 내가 선언한 그 차원으로 집계하는 것
- 유연함
- 결과의 종류는 include, exclude는 측정값만 결과로 나오는데, 디멘션 필터의 영향을 받음. 필터가 들어가면 계산 결과가 바뀌게 된다.
- fixed는 차원도 나온다. 특히 날짜 최근 한 달 등등
- 작동 순서에서 fixed는 상위에 위치하고 제어하는 개념으로는 컨텍스트 필터가 있다.
몇가지 예외상황을 제외하고는 fixed를 사용하면 된다.
기능적으로는 I,E와 똑같다. VLOD의 하위범주가 보이고 있다. 동일한 평균값이 나온다.
sub-category를 제외하면 I와 같은 기능. 집계의 재구성?
manufacturer을 보면 똑같이 값이 복제된다. E와 같은 기능.
sub-category를 고정시키지만 vlod에 설정할 차원은 도시와 시도이다. 이럴 때 sub-category의 fixed가 작용되는 방법
fixed + t/f 필터 = 집합
테이블 계산 옆으로 해야 100%로 설정이 된다.
조건을 주어야 t/f가 적용이 된다.
레이블이 다른 마크와 겹치도록 허용
T누르면 바로 텍스트 레이블 뜬다.
0이 넘는 주문id의 매출의 합계의 퍼센티지
참의 비율이 적을 경우 신경쓰기에는 비용이 더 많이 든다.
- row데이터로 뜯어서 보는법
3. LOD Fixed, Include 어떻게 다른가
Include는 차원이 있어도 vlod에 다른 차원을 넣어놓은 경우 고려한다. (시도 & 도시)
서울 광주, 전라도 광주를 보고 싶어도 광주의 평균만 보여준다.
하나의 카테고리를 만들어줌으로써 Max, Min이 의미있는 값으로 전달되도록 도움을 준다.
픽스드는 차원 신경X
- 차이점
- fixed
- 결과가 측정값 또는 차원으로 나옴
- 뷰에 있는 차원과 상관없음
- I/E
- 항상 측정값으로 나옴 (차원으로 만들지 못함)
- 뷰에 있는 차원에 영향을 받음
- I:vlod에 포함하지 않고 있을 때 어떤 특정 차원을 끌어들여서 함께 고려하고 싶을 때
- E:vlod에 특정 차원이 들어가 있는데 그 차원을 제외하고 계산하고 싶을 때 (더하거나 빼거나)
- fixed
kota가 A 시/도, B시/도에 모두 들어있다. fixed는 A인지 B인지 상관없이 그냥 kota의 평균을 계산한다. 이때는 include를 사용해야 한다.
- 데이터: 샘플 슈퍼 스토어(영어)
- 숙제: 대시보드 2개 만들고 대시보드 1개에 대해서만 파워포인트 슬라이드 한 장으로 대시보드가 무엇을 나타내려 했는지 목표 및 설명 (시트는 1-3개) (설명하기 쉬운거, 원하는거 파워포인트로 만들기)
- 주제: 나는 회사의 상품 세일즈 트래킹 팀에서 일하고 있습니다. LOD + 그동안 배운 방법을 사용해서 다양한 뷰포인트로 어느 sub-category/category/product가 잘하고 있는지 어디서 어떻게 집중해야 하는지 알고 싶다.
대표주제 1개 -> 2개로 나누기?
아예 다른 주제로 해도 된다.
간단하게 주제 먼저 정하기
fixed: 다중 필드 잡아낼 때도 사용된다.
이걸로 뭐를 얻을 수 있었는지 -> 기능이 간단해야 한다. (동작 최대한 넣지 말기)
시트 3개 중 하나만 LOD여도 가능하다.
* 유데미 큐레이션 바로가기 : https://bit.ly/3HRWeVL
* STARTERS 취업 부트캠프 공식 블로그 : https://blog.naver.com/udemy-wjtb
📌 본 후기는 유데미-웅진씽크빅 취업 부트캠프 4기 데이터분석/시각화 학습 일지 리뷰로 작성되었습니다.
'교육 > 유데미 스타터스 4기' 카테고리의 다른 글
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 7주차 학습 일지 (0) | 2023.03.26 |
---|---|
[👩💻TIL 34일차 ] 유데미 스타터스 취업 부트캠프 4기 (0) | 2023.03.24 |
[👩💻TIL 32일차 ] 유데미 스타터스 취업 부트캠프 4기 (0) | 2023.03.22 |
[👩💻TIL 31일차 ] 유데미 스타터스 취업 부트캠프 4기 (0) | 2023.03.21 |
[👩💻TIL 30일차 ] 유데미 스타터스 취업 부트캠프 4기 (0) | 2023.03.20 |