목록분류 전체보기 (177)
홍동이의 성장일기
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/qYdnc/btr4hyrF80W/2BGqSLQVA3MQ9AtMQmt731/img.png)
📍 피드백 태블로 사용 시 고려해야 할 점: 확실히 이해하고 기능 사용하기! [우리조 피드백] 클릭하면 info 나오는 것 좋다. 맵에 색칠 대신 원으로 변경 방이 1개인데 300만원 버는 사람이랑 방 3개인 사람이 벌어들이는 수익이 다를 수 있다. (방이 적으면 불리하다) → 실무에서 쓰이기 좋은 대시보드! ➡️ 있어보이는 대시보드보다 이것을 보는 사람이 이해하기 쉬운 대시보드를 만드는 것이 중요하다는 것을 몸소 느낄 수 있는 과제였다. [추가 피드백] 대소문자 통일하기 동작이 복잡한 경우 사용방법 기재하기 (뭐뭐를 누르면 뭐뭐가 바뀝니다) 대시보드를 설명 잘하는 것이 중요하다. 보고서에 대시보드 캡쳐 후 설명하기 태블로의 집계하려는 특성 → HostId가 중복되면 더해버린다. (중복 없애기), SQL..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/PwMjU/btr37vuLEUW/o96EvRGwbUtDScQaVxjWl1/img.png)
앞으로의 과제 진행 칠판에 적은거 찍어서 보내기 (제안) 레이아웃만 짜기 (청사진) 대시보드 만들기 전략 대시보드: 제안 80% 디자인 20% 실무 대시보드(=내가 쓰는것) 과제 피드백 전 달보다 크게 수익이 늘어난 호스트 오래되었지만 수익이 안나거나 리뷰가 떨어진 호스트 집중 관리 첫 두 달은 리뷰에서 제외하기 리뷰 비율 살펴보기 매출 10% 미만 중 리뷰가 있는 Data 가장 최근을 기준으로 잘하고 있는 호스트가 가장 중요하다. score 만들기: 100점 만점으로 어디있는지 직관적으로 볼 수 있는 것이 좋다. 이중축 사용시 하단에 텍스트로 부가설명이 필요하다. 더보기 먼저 저희는 에어비앤비의 연도별 host 수의 추이를 직관적으로 확인할 수 있도록 상단에 그래프를 만들었습니다. 이에 대한 해결 방안..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/c1Giry/btr3J3AaPbq/8dUpA6TO2nKSsvnkEEsoMk/img.png)
📌 지난 시간 팀 과제 피드백 Q. 지역 매니저와 임원이 보고 싶은 데이터의 차이점 ➡️ 임원 현재 재무 상황(전략팀, 재무Finance팀 승진 와따) 절대적&상대적 숫자 비교 시장에서의 입지 (=점유율) -> 통계청에 전화하기, 뉴스 찾아보기(이데일리 뉴스) 컨설턴트 회사가 기자에게 뿌리는 것이다, 점유율 아는 사이트: 방문자 수 트래킹하여 파는 것 - 마켓의 총 GMV: 시장이 전체적으로 떨어졌나? 불경기인가? 확인하기 또는 발명, 발견 (ex. 조선업) = 나만 줄었나? 다 줄었나 확인해야함. 다 줄었으면 시장을 탈출해야 한다. - 큰그림(Profit만 잘나오면된다) - 구체적으로 물어보지 않는다 (애매하게) - 숫자 크게 하기 - 그래프에 숫자 표현하기(단위) - 색상 테마 정하기(알록달록하게X)..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/mb2J1/btr3JYKGBGq/ckhkymIPmK2yMb2TxGoxIk/img.png)
태블로란? 데이터를 사용해 문제를 해결하는 방식에 혁신을 가져온 시각적 분석 플랫폼으로, 사람(의사결정권자)과 조직이 데이터를 최대한 활용하도록 지원 태블로 데스크탑 프로 -> 보안 but 비쌈 태블로 퍼블릭 Data Analyst가 실무에서 하는 업무 데이터 추출: 70% 데이터 분석: 10% 기획 → tool은 side로 / yoy, mom 대시보드 시각화: 15% → 간단하고 빠르게 만들기 / DB는 매일 업데이트 된다 = 자동화되어야함 / 인수인계를 할 수 있어야함 기획 및 제안: 5% → 모두가 이해할 수 있는 기획을 해야한다 = 숫자는 5개 이하로, 전문용어(한 시트에 30초안에 설명할 수 있어야함), 어떻게 회사에 이득을 줄건지 기획과 제안을 잘하는 데이터 분석가가 없는 이유: 전문용어를 사..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/dUTrXW/btr3ftrOh4O/KHLTnFPOFXhJjzsiwPpMc0/img.png)
💭 이번주 회고 [Tableau] 이번주는 태블로를 사용하여 고급 데이터를 분석하는 법, 애니메이션을 만드는 법, 세부 수준 계산 (LOD), 고급 매핑 기술 구현에 대해 학습했다. 애니메이션 기능을 이용한 TED 강의를 시청했는데 정말 인상깊었고, 강의를 보며 따라 만들어보니 더더욱 재미있었다. 추후 진행될 프로젝트에서 애니메이션 기능을 사용할 수 있다면 꼭 사용해보고 싶다고 생각했다. LOD는 강의를 들어도 정말 어려운 파트였다. 완전히 이해되지는 않았지만 강의를 차근차근 따라하다보니 원하는 결과물을 만들어낼 수 있었고 퀴즈도 다 맞아서 나름 선방했다고 생각하는 시간이었다🥲 오프라인으로 진행되는 태블로 강의에서 더욱 꼼꼼하게 다뤄주신다고 하니 이번 고급 수업은 이런 기능이 있구나~를 알아가는 시간이라..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/FNobG/btr3dTqZKWE/AWEjrTKPGDfHykkk5eR0X1/img.png)
목차 [섹션 9] 시계열 예측을 위한 딥러닝 [섹션 10] 페이스북의 Prophet 예측 라이브러리 [섹션 9] 시계열 예측을 위한 딥러닝 [섹션 10] 페이스북의 Prophet 예측 라이브러리 ✍️ 마무리하며 * 유데미 큐레이션 바로가기 : https://bit.ly/3HRWeVL * STARTERS 취업 부트캠프 공식 블로그 : https://blog.naver.com/udemy-wjtb 📌 본 후기는 유데미-웅진씽크빅 취업 부트캠프 4기 데이터분석/시각화 학습 일지 리뷰로 작성되었습니다.
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/n1xX1/btr3dTdsbb6/D4g41ueCw3qTo3Gukb46yK/img.png)
목차 섹션 8: 일반 예측 모델 예측 모델 소개 Part1 예측 평가 예측 모델 소개 Part2 자기상관 함수와 부분 자기상관 함수 아리마의 개요 자기 회귀 모델 개요 자기 회귀 모델을 Statsmodel로의 구현 기술 통계학과 검정 ARIMA 이론 개요 ARIMA 차수 선택 ARIMA와 ARIMA 모델 자기회귀 통합 이동평균 SARIMA - 계절성 자기회귀 통합 이동평균 SARIMA - 계절성 자기회귀 통합 이동평균 외생 변수 벡터 자기 회귀 모델 벡터 자기 회귀 이동 평균 예측 연습 예측 모델 소개 Part1 ➡️ 홀트-윈터스 계절성 기법 모델을 사용하여 미래 날짜를 예측하는 방법 살펴보기 시계열의 테스트 데이터셋: 가장 최근 데이터 → 예측 모델을 훈련 데이터에 피팅한 다음 훈련 데이터를 기반으로 ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bkceZQ/btr2YhxzvU4/RDaS3Wk2ErNjkpUktjgzs0/img.png)
목차 [섹션6] Pandas를 사용한 시계열 [섹션7] Statsmodels를 이용한 시계열 자료 분석 [섹션6] Pandas를 사용한 시계열 DateTime 인덱스 - Part 1 & 2 ➡️ 대부분의 데이터에는 데이터 시간 인덱스가 있을 것이므로, 이러한 종류의 데이터를 다루는 방법을 배워보았다. Python Datetime Review from datetime import datetime 원하는 날짜/시간 개체의 모든 부분을 가져올 수 있다. Numpy Datetime 배열 : Numpy는 Python의 datetime 형식보다 날짜를 더 효율적으로 처리한다. Numpy 데이터 유형은 파이썬의 데이터 시간과 구별하기 위해 datetime64라고 부른다. dtype = datetime64[ ] 원하는..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bDjNfX/btr2H5jYsLq/Okt2bchf8e3HHQ50RJBDt1/img.png)
목차 [섹션7] 고급 매핑 기술 구현 시계열 데이터 분석 with 파이썬 [섹션2] 강의 Set up 및 Install [섹션3] Numpy [섹션4] Pandas 개요 [섹션5] Pandas를 사용한 데이터 시각화 [섹션7] 고급 매핑 기술 구현 다각형으로 모양 만들기 Polygon(다각형): 각이 많은 도형 Points: X및 Y좌표 Direction: 경로의 방향 Unique Identifier: 모양 ID 배경 지도 측정값으로 연결되어있는 Path를 차원으로 옮기기: 경로를 사용하여 계산을 수행하지 않을 것이라는 것을 알고 있기 때문에 필터로 1, 2층 구분 📍 배경 이미지 넣기 ➡️ 시각화된 자료에 따르면 대부분의 룸이 예약이 꽉 찬 것을 볼 수 있다. 비즈니스 과제 해결하기 📍두 층 사이에 토..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/dUT9Og/btr2tnyNGIQ/EiQYhNEnTDKGmnC0YFl4QK/img.png)
목차 [섹션4] Tableau의 고급 데이터 준비 + 분석 [섹션5] Tableau에서 애니메이션 만들기 [섹션6] 세부 수준 계산 (LOD) [섹션4] Tableau의 고급 데이터 준비 + 분석 프로젝트 개요: 소매 부문 전망 Tableau에서 상자 그림 작성하기 기계 친화적인 형식으로 피벗하기 📍 분석 > 박스플롯 상자 그림 분석하기 ➡️ NSW, QLD, VIC에는 특정 주에서 전반적인 성과 측면에서 실적이 저조한 회사가 있다. 그리고 QLD에는 실적을 초과하는 회사가 있다. VIC는 박스 부분이 위쪽에 있는 것을 볼 수 있는데 이것은 이 비즈니스 환경 설정이 꽤 좋다는 의미이다. (순이익이 높다는 것이기 때문에) 또한 박스 부분이 조밀하기 때문에 순이익률 측면에서 임의의 회사의 위치에 대한 불확실..