홍동이의 성장일기

[👩‍💻TIL 28일차 ] 유데미 스타터스 취업 부트캠프 4기 본문

교육/유데미 스타터스 4기

[👩‍💻TIL 28일차 ] 유데미 스타터스 취업 부트캠프 4기

홍동2 2023. 3. 16. 17:32

 

 

📍 피드백

태블로 사용 시 고려해야 할 점: 확실히 이해하고 기능 사용하기!

 

[우리조 피드백] 

변경 전 → 변경 후

 

  • 클릭하면 info 나오는 것 좋다. 
  • 맵에 색칠 대신 원으로 변경
  • 방이 1개인데 300만원 버는 사람이랑 방 3개인 사람이 벌어들이는 수익이 다를 수 있다. (방이 적으면 불리하다)

→ 실무에서 쓰이기 좋은 대시보드!

 

최종 피드백 반영 대시보드

 

➡️ 있어보이는 대시보드보다 이것을 보는 사람이 이해하기 쉬운 대시보드를 만드는 것이 중요하다는 것을 몸소 느낄 수 있는 과제였다.

 

 


[추가 피드백]

  • 대소문자 통일하기
  • 동작이 복잡한 경우 사용방법 기재하기 (뭐뭐를 누르면 뭐뭐가 바뀝니다)
  • 대시보드를 설명 잘하는 것이 중요하다. 
  • 보고서에 대시보드 캡쳐 후 설명하기

태블로의 집계하려는 특성 → HostId가 중복되면 더해버린다. (중복 없애기),  SQL에서 데이터 잘못 추출되는 경우 심각한 문제 발생 ➡️ count와 countd 수가 다르면 중복 데이터가 존재하는 것이다!  


UNION

데이터를 추출할 때 회사가 DB가 1개가 아닌 경우: DB1과 DB2를 조인시켜서 가져올 수 없다. 이관시켜야 한다. 이관시키는 권한은 데이터 엔지니어의 권한이다. 

 

권한이 있다는 하에 두 개를 연결시킬수 있다.

 

 

DB1에서 뽑아온 Data set (1~10)

DB2에서 뽑아온 Data set (1~10)

동일해야 가져올 수 있다. 

  • UNION ALL: DB1과 DB2를 통째로 붙이는 것 (100 + 120 = 220) ➡️ 데이터를 쌓아야 하기 때문에 사용한다. (누적) 중복 고려X
  • UNION 어쩌고: 중복된거 제거하고 붙인다. (100 + 120 = 200)  ➡️ 태블로에서는 중복이 없는 것이 좋음.

바로 중복 없애준다.


JOIN

회사에서 INNER JOIN을 사용하는 경우는 많이 없다. LEFT JOIN을 가장 많이 사용한다.

 


관계

 

DB랑 CSV같이 쓰는 경우

아예 다른 파일에서 가져오는 경우

 


혼합 관계 편집

이미 있는 데이터의 컬럼과 다른 데이터의 컬럼을 함께 사용하려면 혼합 관계 편집을 사용하여 연결하기

* 하나를 DB로 뽑아놓고 서버에 연결로 또 뽑기

 

렉이 많이 걸리기 때문에 정말 필요하지 않은 이상 많이 사용하지는 않지만 언젠가는 사용하게 된다.

 

컬럼 이름이 달라도 안에 내용이 똑같은 것이 하나 이상이 있어야 한다. 지정하면 링크(연결) 모양이 주황색으로 뜬다. 그걸 끄고 킬 수 있다. 생성됐을 때 차원이 정확히 연결되어야만 작동한다. 측정값으로는 확인할 수 없다.

 

행(ID)가 같은 경우는 오류가 발생하지 않는다.


탐색(버튼)

공식 대시보드(메인 요약): 버튼을 누르면 설정된 대시보드로 이동한다.

시트는 publish하지 않는 것이 좋다.

 

윈도우는 Alt + 클릭으로 이동


도구설명에 그래프 넣기

삽입 > 시트

 

  • 텍스트 시트에 막대그래프를 넣는 것이 가장 좋다.
  • 필터도 함께 걸려서 나온다.
  • 보충설명할 수 있는 테이블을 넣어주는 것이 좋다.


대시보드 상단 or 하단에 기입

  • 데이터 원본 이름
  • 데이터 업데이트 시간: DB 연결 유무, 보고서 작성 유무를 판단할 수 있음, 내 확인용으로도 사용할 수 있다.

날짜 함수 연습

 

1. DATEADD(date_part, interval, date)
date 에 date_part 단위의 interval을 더함

ex) DATEADD('year', 2, #2021–08–02#)

= 2023–08–02 12:00:00AM

 


2. DATEDIFF(date_part, date1, date2, [start_of_week])
date1(시작일)과 date2(종료일) 사이의 간격을 date_part 단위로 구함
* 이때 [start_of_week]는 선택사항이며, 'sunday' 로 지정 시, 일요일이 주의 첫번째 요일로 고려함

ex) DATEDIFF('week', #2021–08–04#,#2021–08–07#)

= 월요일을 주의 첫 번째 요일로 고려한 것 → 4일(수)와 8일(일)은 같은 주 = 0


ex) DATEDIFF('week', #2021–08–04#,#2021–08–07#, 'saturday')

= 토요일을 주의 첫 번째 요일로 고려한 것 → 수요일과 토요일은 다른 주 = 1


3. DATENAME(date_part, date, [start_of_week])
date의 date_part를 문자열로 반환

ex) DATENAME('month', #2021–08–04#) 

= "August"

 


4. DATEPART(date_part,date,[start_of_week]
date의 date_part를 정수형으로 반환

ex) DATEPART('month', #2021–08–04#) 

= 8

 


5. DATEPARSE(date_format, [date_string])
date_string(문자열)을 date_format의 형태(날짜형)로 반환

ex) DATEPARSE('yyyy-MM-dd', 'STR(TODAY())')

=2023-03-16

 


6. DATETRUNC(date_part, date, [start_of_week])
date 기준 date가 속한 date-part 의 첫째 날 반환

ex) DATETRUNC('quarter',#2021–08–04#)

= 2021–07–01

ex) DATETRUNC('month',#2021–08–04#)

= 2021–08–01

 


7. ISDATE(string)
string(문자열)이 유효한 날짜면 true 반환

ex) ISDATE('August 4,2021')

=true

 


8. MAKETIME(hour, minute, second)
시,분,초로 구성된 날짜값 반환

ex) MAKETIME(16,24,00) 

= #16:24:00#

 


9. MAX(expr1, expr2)
a와 b의 최대값 반환

(동일한 유형이어야 함, 둘 중 하나라도 Null 이면 Null 반환)

ex) MAX(#2021–01–01# ,#2021–03–01#) 

= 2021–03–01 12:00:00 AM

 


10. MIN(expr1, expr2)
a와 b의 최소값 반환

(동일한 유형이어야 함, 둘 중 하나라도 Null 이면 Null 반환)

ex) MIN(#2021–01–01# ,#2021–03–01#) 

= 2021–01–01 12:00:00 AM

 


11. YEAR(date)
주어진 날짜의 연도를 정수로 반환

ex)YEAR(#2021–08–15#) 

= 2021

 


12. MONTH(date)
주어진 날짜를 월의 정수로 반환

ex) MONTH(#2021–08–15#) 

= 8

 


13. WEEK(date)
date의 날짜 주를 정수로 반환

ex) WEEK(#2021–04–15#)

= 16

 


14. DAY(date)
date의 날짜 일을 정수로 반환

ex) DAY(#2021–08–04#)

= 4

 


15. QUARTER(date)
date의 분기를 정수로 반환

ex) QUARTER(#2021–08–04#)

= 3

 


16. TODAY()
현재 날짜 반환

ex) TODAY()

= 2023-03-16


SQL로 날짜 데이터를 뽑았을 때

  1. 20210321
  2. 2021-03-21
  3. 202 201321
  4. 21/03/21

→ 모두 숫자로 인식

Date는 String으로 바꿔주는 것이 깔끔하다. 


[오늘의 숙제]

보고서  2장 (타겟: airbnb 뉴욕 지사장)

  1. 목표
  2. 현황: 대시보드에 꼭 없어도된다.
  3. 대시보드 추가 설명 요소

*대시보드는 스크린샷해서 덱? (파워포인트)에 넣기

*서비스 개선 → 제안 

 

완성 대시보드

 

230316_4조팀프로젝트_04.pdf
0.76MB
230316_4조_태블로_04.twbx
1.44MB

 

📍 다음 시간에 질문할 것 : 컨텍스트 필터 사용하는 방법 (지역별로 상위 20% 보고 싶음)

 


[금요일 숙제]

여태까지 만든 대시보드 개인적으로 연습하기 

 

 

 

 

Crazy for Detail 😎

 

 


* 유데미 큐레이션 바로가기 : https://bit.ly/3HRWeVL

* STARTERS 취업 부트캠프 공식 블로그 : https://blog.naver.com/udemy-wjtb

📌 본 후기는 유데미-웅진씽크빅 취업 부트캠프 4기 데이터분석/시각화 학습 일지 리뷰로 작성되었습니다.

728x90
Comments