목록전체 글 (177)
홍동이의 성장일기
태블로 평가판이 끝났었는데 새로운 버전을 다운받으니 다시 평가판 2주를 받았다! 🙌 1. LOD 날짜 함수 ❓{} 쓰는 이유: 가장 큰 연도로 전체 행에 고정해준다. 내년이 2024년으로 바꾸면 자동으로 업데이트 된다. = 데이터가 자동으로 업데이트 되어도 식을 바꾸지 않아도 된다. recent/last year을 불연속형으로 변경 ➡️ 이 식을 datediff 식에 넣으면 된다. 2. 심화 그래프 만들기 📍와플 차트 🔎 구간차원? 불연속형 필드는 구간 차원의 집합이라고 말할 수 있다. (ex. Central, East, South, West) 그렇다면 연속형 측정 값에서 구간 차원 추가는? 히스토그램? 최적의 bin 수? Number of Bins = 3 + log2(n) * log(n) 수식에서 n은..
📍 우리조 피드백 잘한점: 실무에 가까운 대시보드, 디자인 아쉬운점: 마지막 그래프의 시선 처리 어려움, 의미가 딱히 없다고 느껴진다. 사용하려면 의미를 더하기 Sales 파악할 때 환불율 파악하는 것이 중요하다. 가설에 데이터를 맞추지 말자! - 머리속으로 가설맞추고 대시보드 만들지 말기: 하다가 한가지만 말이 안될때 - 데이터가 이상한가? 생각X, 데이터 애널리스트는 이걸 만들고 본 팀이 알아서 이유를 가져온다. (정부 법, 어디 걸리지 않기 위해 지정해놓은 것, 가격 담합, 업계가 망하는 경우) 가설만들지 말고 객관적으로 보여주기. 저희가 서브카테고리로 할인율을 지정했는데 supplies는 이렇게 나왔다. sales팀 매니저님이 와서 설명해주실수있나요? 우리는 그저 인사이트를 뽑는 것(suppile..
💭 이번주 회고 이번주 월-수는 개인과제를 진행하고 목-금은 저번주와 마찬가지로 팀 프로젝트를 했다. 혼자 대시보드를 만들어내는 과제는 처음이었는데 청사진 제작부터 모든 것을 혼자 힘으로 완성시켜야하다보니 태블로에 더 집중할 수 있는 시간이었던 것 같다. 팀프로젝트는 주어진 기능을 모두 활용하면서 맥락에 맞춘 대시보드를 두가지나 만들어야해서 전체적인 흐름을 잡는것에 어려움이 있었다. 그래도 팀원분들과 함께 이야기하며 큰 틀을 정하고, 대시보드를 완성할 수 있었다. 그 과정에서 회사에서 중요하게 쓰인다는 코호트나 리텐션이라는 용어에 대해서도 알게 되었다. 시트 하나하나를 만들어가면서도 난관에 부딪히고 그것을 다같이 해결하는 과정에서 많은 것을 배웠다. 그리고 이번주에는 오랜만에 개별 면담도 하게 되었다. ..
오늘은 하루종일 팀 프로젝트를 하는 날이다. 먼저 ROW 데이터를 이리저리 살펴보며 인사이트가 나오는 정보에 대해 대시보드 청사진을 마저 만들어보았다. 대시보드를 만드는 과정에서 궁금한 점이 있었다. Profit < 0 인 매출 비중 그래프를 작성하는 과정에서 그래프 정렬이 우리가 원하는대로 되지 않았다. 개별 그래프에서 우리가 원하는 부분을 각각 선택해준 후 오름차순, 내림차순으로 정렬하면 얼추 해결은 되었다. 나중에 알고보니 ATTR에 문제가 있었다. ATTR을 AVG로 바꾸자 우리가 원하는 모습으로 정렬이 되었다. 수업시간에는 Fixed를 사용할 때 앞에 붙는 집계함수는 아무의미가 없다고 배웠는데 정렬하는 과정에서는 영향을 미치는 것인지 궁금하다 c.sub/state를 정렬할 때 하단의 정렬식을 사..
LOD를 할 때 row 데이터를 모두 확인해야 한다. 3, 4개 랜덤으로 뽑아서 확인하기 rowcount 앞에 index 삽입하여 필터링 되었는지 확인하기 1. LOD Include, Exclude 예제 : 필터의 영향을 받는다. (Order of Operation) 📍Include Include를 사용하려면 데이터의 깊이가 상대적으로 깊어야 한다. 집계를 2번해야할 때 유용하다. (평균의 최대값, 최소값) VLOD에 설정한 차원의 영향을 include한 차원을 기준으로 결과 출력 State별 city들의 평균의 최대, 최소를 선택해서 표시한다. Include에서 고정해야하는 차원: city 뒷단에서 city에 대한 sales의 평균을 만든다. LOD는 남을 이해시켜야 한다. 설명이 구구절절 나오면 LO..
1. ATTR 간단 예제 단일값만 존재하는 행 찾기: 한번만 팔린 제품 구하기 [이커머스에서 많이 활용] 하나만 팔린 경우, 한번도 팔리지 않은 경우(공간을 차지하기 때문에 삭제) 트래킹하기 ➡️ 두번부터는 괜찮다고 본다. order Id 특성으로 설정 > 필터에서 * 삭제 (다중값 = 한번 이상 팔린 것이기 때문에) * order id를 특성으로 집어넣는다 → 한번만 팔린 것만 볼 수 있다. 문자열에 대한 집계를 수행: 같은 차원 다른 집계 central은 합계 east, south, west는 평균으로 보고 싶음 쪼개지지 않은 필드라는 것을 알 수 있다. 2. 결합된 필드 - 차원 정렬 nested setting 결합된 필드를 사용하는 경우: 정렬했을때 그래프가 통째로 움직일 때 * 텍스트 테이블에 ..
1. 태블로 함수, 테이블 계산 모음 차원 집계, 측정값 집계, primary 함수, partition, Rank 함수 window -1, 1에 first, last 넣으면 처음부터 끝까지 (전체 포괄) RANK, RANK_DENSE, RANK_UNIQUE 2. 자주 나오는 질문 퀵테이블은 꼭 나쁜것일까? 데이터가 모두 vlod에 나열되어있는 경우 퀵테이블 사용 권함 BUT 텍스트 테이블에 하나의 텍스트로 보여지거나 다양한 동작, 차원 고정, 필터링이 필요한 경우는 사용X 제3자가 보았을 때 계산된 식보다는 해석이 어렵다는 단점이 있다. (세모를 잘 보지 않는다.) 테이블 계산에서 '옆으로', '아래로'는 정확하게 무엇인가요? 테이블 계산 추가 계산된 필드 오류 예시 및 해결방법 sum(profit) /..
차원을 하나 생성하고 서브 카테고리 붙이듯이 붙이기 이커머스는 데이터가 가장 많고 지저분하다. 아마존은 모든 것이 자동화되어있지만 너무 밑단까지 사람이 하면 트래킹이 불가능하다. NULL값이 많음 목요일에 프레젠테이션: 피드백 화, 수 보고서 피드백 목표 / 현황 중요, 납득만 시켜도 공격X 덱 하나로 줄이기? TopDown: 결론부터 이야기하는 것 (전략적으로 어떻게 갈까 → ex) 블랙리스트 제거하는 방안) [우리 조] topdown의 형식이 아닌 나열이다. 윗부분만 봤을 때도 이해가 가야한다. 그래프를 보여주기 보다는 말로만 하거나 숫자를 자세히 써주어야한다. (데이터를 유리한 쪽으로 끌고가기, 책잡힐 그래프 쓰지 않기 (우리 것도 숫자로만 제시했으면 책잡히지 않음!)) 이제부터 ~ 보고를 시작하겠..
💭 이번주 회고 [Tableau] 이번주부터는 태블로 오프라인 강의가 진행된다🙌 수업의 전체적인 흐름을 살펴보면 오전에는 실제 Data Analyst 업계 및 업무를 파악할 수 있는 이야기를 듣고 간단한 실습을 진행한다. 오후에는 태블로를 활용하여 조별 프로젝트를 진행한다. 일주일간 수업을 들어보니 태블로 신병훈련소 및 유데미 등의 온라인 수업과 이번 오프라인 수업의 상호보완적인 부분이 명확히 느껴졌다. (주관적인 의견입니다.) 먼저 온라인 강의는 태블로의 전반적인 사용법에 대해 빠르게 배울 수 있는 장점이 있다. 또한 혼자서 수업 템포 조절이 가능하다. 하지만 기능을 따라하는 것에 급급하다보니 수업시간에 사용되는 row 데이터에 대한 이해가 부족한 상태로 실습을 진행하게 되었고, 이로 인해 전반적인 데..
애매한거 X, 데이터를 모르는 사람에게 설명할 수 없으면 X [우리조 피드백] 제출하기 전 몇가지 오류를 발견하여 수정하였다. Good 에어비앤비 로고 대시보드 사용 타겟을 명확히 정한 것 실무에서 쓰이는 대시보드 csv로 다운로드 가능하다 Bad 근거로 사용한 데이터, 그래프에 대한 설명이 명확하지 않았다. → 그래프를 잘라서 필요한 부분만 보여주는 것이 좋았다. 지역명 띄우기 +) 점수제 쓰는 것이 좋다 row데이터에 대한 이해가 충분해야 한다. 매출, 순위 같은 전체적인 숫자는 적어놓아야 한다. or 외우고 있어야한다. → 결론이 있는 것이 좋다. 이러이러한 기준으로 이 사람들을 자르면 이만큼의 매출이 늘어난다. make function [프로젝트 과정] 위에서 ~하고 싶다 → 제안서 작성 → 보여..