목록교육/유데미 스타터스 4기 (67)
홍동이의 성장일기
1. 해커톤 예습 자유주제 데이터양 많음 데이터 sql 전처리 이후 태블로 시각화 가설은 어디까지? 데이터가 메인 사이드로 내가 어디까지 만들 수 있느냐를 보여주는 용도로 사이드 가설은 가능 상황을 가설로 세우는 건 가능하지만 데이터의 추세를 가설로 세우지는 말 것 → 공격이 많이 들어온다. ex) 이 앱은 사용량이 없으니까 광고료가 쌀 것이다. ex) 할인율이 낮을수록 수익이 커진다. 아이디어 & 기술 모두 위주: 뜬구름 잡는 아이디어면 마이너스 아이디어가 평범하면 지루해한다. 일단 대시보드에 기본은 들어있어야 한다. (sales, profit 등) 그 후 응용하기. 그렇다고 기본적인 것으로만 대시보드를 모두 채우면 안된다. 기술로 만든 것과 데이터가 같아야함. 필드를 x로 정했다면 x가 보이기는 해야..
남들이 생각하지 않는 point of view에서 바라보아야 한다. 발표할때는 배경이 하얀색이거나 연한 파란색이여야 한다. (파스텔톤으로 보기 쉽게) 말을 천천히 하는 것이 좋다. 조 소개, 턴이 돌아갈때 자기소개 해야한다. 기능 실수는 있어도 되지만 숫자 실수는 절대 🙅♀️ 목차 심화 그래프 바벨 차트 깔대기 퍼넬 차트 워드 클라우드 레이아웃 컨테이너 설정 (부동 → 바둑판) 주석으로 레이아웃 잡기 min(1) 원 활용해서 대시보드 구성하기 📍레이아웃 이쁘게 만드는 법 마크 더블클릭 > ' ' > 텍스트 > 표준: 전체보기 아무것도 쓰지 않고 ok 모퉁이: 매우 둥근 모양, 음영: 파스텔톤 계속 주석 추가 > 영역 추가해서 먼저 레이아웃을 잡은 모양대로 만들기 이름을 '레이아웃'으로 설정해 준 뒤 대..
PPT 10-20장 발표 30분 자유주제 (데이터만 주어짐) 임원분들은 화려한걸 은근 좋아하신다. 대시보드 2개 메인은 하나 (시트가 들어가있는 것) 나머지 하나는 버튼 넣어서 만들어보기 (화려해보인다, 보는맛, summery) 1) 매출 2) 순이익 꼭 LOD가 들어갔으면 좋겠다. 색깔은 단조롭되, 그래프 (6개라고 치면) 하나정도만 화려하게 하면된다. (있어보이게) 데이터셋을 엄청 크게 주고 원하는 컬럼만 뽑아서 쓰기 필요없는 컬럼 ex. Null값 많은 것 잘 주제를 선택하여 SQL로 잘 추출하고 태블로로 연결하여 시각화 실제 해커톤에서는 10장 이상 나와야한다. 이번에는 4장 심화 그래프 만들기 *생키차트(사용하지 말기) 🔎 라운드 바 차트 막대사탕 차트랑 똑같다. 있어보이는 그래프 🔎 간트(Ga..
태블로 평가판이 끝났었는데 새로운 버전을 다운받으니 다시 평가판 2주를 받았다! 🙌 1. LOD 날짜 함수 ❓{} 쓰는 이유: 가장 큰 연도로 전체 행에 고정해준다. 내년이 2024년으로 바꾸면 자동으로 업데이트 된다. = 데이터가 자동으로 업데이트 되어도 식을 바꾸지 않아도 된다. recent/last year을 불연속형으로 변경 ➡️ 이 식을 datediff 식에 넣으면 된다. 2. 심화 그래프 만들기 📍와플 차트 🔎 구간차원? 불연속형 필드는 구간 차원의 집합이라고 말할 수 있다. (ex. Central, East, South, West) 그렇다면 연속형 측정 값에서 구간 차원 추가는? 히스토그램? 최적의 bin 수? Number of Bins = 3 + log2(n) * log(n) 수식에서 n은..
📍 우리조 피드백 잘한점: 실무에 가까운 대시보드, 디자인 아쉬운점: 마지막 그래프의 시선 처리 어려움, 의미가 딱히 없다고 느껴진다. 사용하려면 의미를 더하기 Sales 파악할 때 환불율 파악하는 것이 중요하다. 가설에 데이터를 맞추지 말자! - 머리속으로 가설맞추고 대시보드 만들지 말기: 하다가 한가지만 말이 안될때 - 데이터가 이상한가? 생각X, 데이터 애널리스트는 이걸 만들고 본 팀이 알아서 이유를 가져온다. (정부 법, 어디 걸리지 않기 위해 지정해놓은 것, 가격 담합, 업계가 망하는 경우) 가설만들지 말고 객관적으로 보여주기. 저희가 서브카테고리로 할인율을 지정했는데 supplies는 이렇게 나왔다. sales팀 매니저님이 와서 설명해주실수있나요? 우리는 그저 인사이트를 뽑는 것(suppile..
💭 이번주 회고 이번주 월-수는 개인과제를 진행하고 목-금은 저번주와 마찬가지로 팀 프로젝트를 했다. 혼자 대시보드를 만들어내는 과제는 처음이었는데 청사진 제작부터 모든 것을 혼자 힘으로 완성시켜야하다보니 태블로에 더 집중할 수 있는 시간이었던 것 같다. 팀프로젝트는 주어진 기능을 모두 활용하면서 맥락에 맞춘 대시보드를 두가지나 만들어야해서 전체적인 흐름을 잡는것에 어려움이 있었다. 그래도 팀원분들과 함께 이야기하며 큰 틀을 정하고, 대시보드를 완성할 수 있었다. 그 과정에서 회사에서 중요하게 쓰인다는 코호트나 리텐션이라는 용어에 대해서도 알게 되었다. 시트 하나하나를 만들어가면서도 난관에 부딪히고 그것을 다같이 해결하는 과정에서 많은 것을 배웠다. 그리고 이번주에는 오랜만에 개별 면담도 하게 되었다. ..
오늘은 하루종일 팀 프로젝트를 하는 날이다. 먼저 ROW 데이터를 이리저리 살펴보며 인사이트가 나오는 정보에 대해 대시보드 청사진을 마저 만들어보았다. 대시보드를 만드는 과정에서 궁금한 점이 있었다. Profit < 0 인 매출 비중 그래프를 작성하는 과정에서 그래프 정렬이 우리가 원하는대로 되지 않았다. 개별 그래프에서 우리가 원하는 부분을 각각 선택해준 후 오름차순, 내림차순으로 정렬하면 얼추 해결은 되었다. 나중에 알고보니 ATTR에 문제가 있었다. ATTR을 AVG로 바꾸자 우리가 원하는 모습으로 정렬이 되었다. 수업시간에는 Fixed를 사용할 때 앞에 붙는 집계함수는 아무의미가 없다고 배웠는데 정렬하는 과정에서는 영향을 미치는 것인지 궁금하다 c.sub/state를 정렬할 때 하단의 정렬식을 사..
LOD를 할 때 row 데이터를 모두 확인해야 한다. 3, 4개 랜덤으로 뽑아서 확인하기 rowcount 앞에 index 삽입하여 필터링 되었는지 확인하기 1. LOD Include, Exclude 예제 : 필터의 영향을 받는다. (Order of Operation) 📍Include Include를 사용하려면 데이터의 깊이가 상대적으로 깊어야 한다. 집계를 2번해야할 때 유용하다. (평균의 최대값, 최소값) VLOD에 설정한 차원의 영향을 include한 차원을 기준으로 결과 출력 State별 city들의 평균의 최대, 최소를 선택해서 표시한다. Include에서 고정해야하는 차원: city 뒷단에서 city에 대한 sales의 평균을 만든다. LOD는 남을 이해시켜야 한다. 설명이 구구절절 나오면 LO..
1. ATTR 간단 예제 단일값만 존재하는 행 찾기: 한번만 팔린 제품 구하기 [이커머스에서 많이 활용] 하나만 팔린 경우, 한번도 팔리지 않은 경우(공간을 차지하기 때문에 삭제) 트래킹하기 ➡️ 두번부터는 괜찮다고 본다. order Id 특성으로 설정 > 필터에서 * 삭제 (다중값 = 한번 이상 팔린 것이기 때문에) * order id를 특성으로 집어넣는다 → 한번만 팔린 것만 볼 수 있다. 문자열에 대한 집계를 수행: 같은 차원 다른 집계 central은 합계 east, south, west는 평균으로 보고 싶음 쪼개지지 않은 필드라는 것을 알 수 있다. 2. 결합된 필드 - 차원 정렬 nested setting 결합된 필드를 사용하는 경우: 정렬했을때 그래프가 통째로 움직일 때 * 텍스트 테이블에 ..
1. 태블로 함수, 테이블 계산 모음 차원 집계, 측정값 집계, primary 함수, partition, Rank 함수 window -1, 1에 first, last 넣으면 처음부터 끝까지 (전체 포괄) RANK, RANK_DENSE, RANK_UNIQUE 2. 자주 나오는 질문 퀵테이블은 꼭 나쁜것일까? 데이터가 모두 vlod에 나열되어있는 경우 퀵테이블 사용 권함 BUT 텍스트 테이블에 하나의 텍스트로 보여지거나 다양한 동작, 차원 고정, 필터링이 필요한 경우는 사용X 제3자가 보았을 때 계산된 식보다는 해석이 어렵다는 단점이 있다. (세모를 잘 보지 않는다.) 테이블 계산에서 '옆으로', '아래로'는 정확하게 무엇인가요? 테이블 계산 추가 계산된 필드 오류 예시 및 해결방법 sum(profit) /..