목록교육 (90)
홍동이의 성장일기
📍 발표 피드백 쿼리 결과 테이블, 바 차트같은 간단한 차트까지 나타내주면 이해하기 쉽다 결론도 중요한 부분은 색깔을 다르게 하거나 두껍게 해주기 코드, 결과 테이블, 차트, 설명까지 한번에 넣어주기 주제, 목표 -> 전체에서 부분으로 가는 흐름 사진 첨부로 이해하기 좋았다. 📍 제품/카테고리 매출 지표 분석 전체 제품 매출 순위 및 매출 비율 카테고리별 제품 매출 순위 및 매출 비율 ➡️ orders, order_details(unit_price: 판매될 당시의 단가), products(unit_price: 현재 절대적 단가), categories, suppliers cte로 임시테이블 만들기 with cte_products_sale as( select o.order_id , o.customer_id ..
복잡한 데이터셋: 가독성↓, 재사용성↓, 유지보수성↓, 실수↑ 복잡한 데이터셋을 다루기 위한 방법 ETL 스냅샷테이블 쿼리 결과를 테이블에 저장 예약된 시간에 백그라운드에서 실행 장점: 복잡한 로직 없이 테이블에서 원하는 쿼리 바로 실행 VIEW: 쿼리 결과를 가상테이블로 생성하여 사용 장점: 실시간성 보장 단점 데이터베이스 쓰기 권한 필요 유지보수 필요 임시테이블 temporary table 현재 세션동안 유지되는 테이블 → 데이터베이스에서 나오면 테이블 없어짐 create, insert 구문을 통해 생성 장점: 복잡한 로직 없이 테이블에서 원하는 쿼리 바로 실행, 성능 단점: 데이터베이스 쓰기권한 필요 공통테이블 표현식 CTE: 쿼리 결과에 이름을 붙여 테이블처럼 사용 장점: 쿼리를 간결하게 작성할 ..
태블로에 PostgreSQL 연결하는 방법 1. 위 파일을 압축해제 하지 않고 C:\Program Files\Tableau\Drivers에 담는다. 2. dbeaver에서 edit connection 3. 입력창에 나오는 정보들을 참고하여 태블로 연결창에 입력 4. 연결 완료! sql을 태블로에 연결해서 다양한 시각화를 해봅시다~ [더 보면 좋았을 것] orders date 기간 (언제 쉬는날인지 등) 제품은 뭐가 있는지 select 구문 키워드 distinct: 중복 추출 제거 * alias 테이블명 where 조건(condition) order by: asc(생략), desc -- 전체 데이터 추출 -- select * from customers c ; -- country 컬럼만 추출 -- selec..
이번 SQL 수업은 Postgresql과 dbeaver로 진행된다. 프로그램 설치 샘플 DB 설치 select count(*) from northwind.customers; 분석 목적 설정 → 지표 설정 및 분석 계획 → 데이터 추출/정제/가공/분석 → (BI 도구, python, R, Excel과 연동하여 작업) → 리포트 작성 및 발표 조직마다 다르는 데이터 및 분석 목표가 다르다. 도메인 지식, 데이터 특성을 이해하는 것이 중요하다. 분석 업무는 질문에서 시작한다 → 질문에 답하기 위한 분석 지표 설정 ex) 월별 판매 추이가 어떠한가? → 월별 매출액, 판매 건수 변화 질문에 답하기 위한 데이터는 어디에서 나오고 어디에 저장되는가? 기업에는 여러 데이터 베이스가 있고 이것을 통합해서 관리하는 것이..
💭 이번주 회고 이번주는 태블로 오프라인 수업 마지막주였다. 미니 해커톤을 마무리하고 태블로 자격증을 준비하는 시간을 가졌다. 조원이 바뀌면 프로젝트의 전체적인 스타일이 달라지는 것 같아서 신기했다. 이번 프로젝트에서는 점수화를 하고 이에 대한 근거를 세우는 것에 초점을 맞추었다. 이렇게 수치에 대한 논리에 집중하다보니 식을 확실히 이해하고 작성하게 되어서 많이 성장할 수 있었다. 그래서 저번 프로젝트에서 받았던 근거에 대한 부정적인 피드백은 받지 않을 수 있었다👍 아쉬웠던 점은 처음에 그래프가 복잡하다는 피드백을 받아서 거기에 너무 함몰되다 보니 전반적인 대시보드가 조금 단조로워진 것이다. 다른 조처럼 우리의 결과가 실제로 어떻게 실현될 수 있을지 상황을 제시했다면 조금 더 풍성한 발표가 되었을 것 같..
[이론] 날짜 디폴트 line discrete: month 선택하면 year 알 수 없음, weeknumber 없음 continuous: month를 선택해도 year과 함께 뜬다. scatter plot 세부사항으로 쪼개기 가능 trend line 추가 가능 dual axis = combined axis 자주하는 실수: 축 동기화를 하지 않아서 숫자 실수를 한다, 이해를 어렵게 한다. symbol map: color로 조정 가능 + size가 추가되어있음 Field map: color로만 조정할 수 있다. 지오코딩: Map > Geocoding > Import custom geocoding 신도시는 위도, 경도로 채워넣기 차원 계층화가 맵에서 줄 수 있는 장점: 다른 나라에 같은 도시 이름이 있을 때 ..
[시험 5] When you drag additional tables to the logical layer canvas, Tableau automatically attempts to create the relationship based on existing key constraints and matching fields to define the relationship. If it can't determine the matching fields, then relating these tables is not possible. 추가 테이블을 논리 계층 캔버스로 끌면 Tableau는 기존 키 제약 조건과 일치하는 필드를 기반으로 관계를 자동으로 생성하여 관계를 정의합니다. 일치하는 필드를 확인할 수 없는 경우 ..
오늘부터는 계속 자격증 대비를 위한 문제를 푼다! 정확히 알지 못한 채로 감으로 맞힌 문제도 있기 때문에 모든 선지에 대해 다시 공부해 보았다. [시험 1] Most viewers scan content starting at the top left of a page. If you use a percent difference Quick Table Calculation, what value will be the first data value? 백분율 차이 퀵테이블 계산을 사용할 경우 첫 번째 데이터 값은 얼마가 됩니까? ➡️ null By default, what does Tableau do when you connect to a data source? 기본적으로 데이터 소스에 연결할 때 Tableau는 무..
오늘은 저번주부터 진행된 프로젝트에 대해 발표하는 날이다! 최종적으로 완성된 대시보드는 다음과 같다. 저번에 발표에 대한 피드백을 받아서 이번에는 발표 연습을 위해 서보지 않은 자리에도 서보고, 저번보다 발표의 분량도 길게 가져보았다. 대본도 최대한 보지 않으려고 노력했다. 우리조 피드백 대시보드가 단조롭다. 해커톤에서는 좀 더 다채롭게 하면 좋을 것 같다. 수식 설명이나 정의, 근거가 좋았다. 목차는 천천히 톺아주기 기준 설정에 Install 크기 키우기 대시보드 설명할 때 왼쪽 상단, 중앙 하단 등 위치를 자세하게 이야기하면서 설명하기. 듣는 사람이 따라오기 쉽도록 '차원을 ~~로 고정시키고'와 같은 표현 Good Top down 구조 Good 우리도 시뮬레이션 같은것이 있었으면 좋았겠다는 생각을 했..
오늘은 내일 있을 미니 해커톤을 마무리하는 시간을 가졌다. 주말에 시트들은 얼추 완성해놓아서 오전에는 대시보드 디자인을 하고 오후에는 PPT와 대본을 만들었다. 어렵다고 생각되는 부분은 다같이 대본의 키워드를 만들어놓고 나머지 부분은 각자 만들어오기로 했다. 분업이 잘 되어서 빠르게 마무리 할 수 있었다🙂 Install 수를 기준으로 사분위수를 구한 것으로 잠재력 여부를 판단. Install이 너무 많거나(이미 인기있음) 적은 경우(신뢰X) 잠재력이 있다고 하기 어려움. 날짜 매개변수, 버튼 설명 & 제목만 설명 무슨 단위를 썼는지는 설명되어있다. LOD를 사용하여 ~ 와플차트(표준화점수 사용), 동작, 탑 카테고리 부연 설명 모든 것이 잠재력이 있다는 가정 하에 이루어짐 (카테고리별 평균 이상인거) 제..