목록교육/유데미 스타터스 4기 (67)
홍동이의 성장일기
차원을 하나 생성하고 서브 카테고리 붙이듯이 붙이기 이커머스는 데이터가 가장 많고 지저분하다. 아마존은 모든 것이 자동화되어있지만 너무 밑단까지 사람이 하면 트래킹이 불가능하다. NULL값이 많음 목요일에 프레젠테이션: 피드백 화, 수 보고서 피드백 목표 / 현황 중요, 납득만 시켜도 공격X 덱 하나로 줄이기? TopDown: 결론부터 이야기하는 것 (전략적으로 어떻게 갈까 → ex) 블랙리스트 제거하는 방안) [우리 조] topdown의 형식이 아닌 나열이다. 윗부분만 봤을 때도 이해가 가야한다. 그래프를 보여주기 보다는 말로만 하거나 숫자를 자세히 써주어야한다. (데이터를 유리한 쪽으로 끌고가기, 책잡힐 그래프 쓰지 않기 (우리 것도 숫자로만 제시했으면 책잡히지 않음!)) 이제부터 ~ 보고를 시작하겠..
💭 이번주 회고 [Tableau] 이번주부터는 태블로 오프라인 강의가 진행된다🙌 수업의 전체적인 흐름을 살펴보면 오전에는 실제 Data Analyst 업계 및 업무를 파악할 수 있는 이야기를 듣고 간단한 실습을 진행한다. 오후에는 태블로를 활용하여 조별 프로젝트를 진행한다. 일주일간 수업을 들어보니 태블로 신병훈련소 및 유데미 등의 온라인 수업과 이번 오프라인 수업의 상호보완적인 부분이 명확히 느껴졌다. (주관적인 의견입니다.) 먼저 온라인 강의는 태블로의 전반적인 사용법에 대해 빠르게 배울 수 있는 장점이 있다. 또한 혼자서 수업 템포 조절이 가능하다. 하지만 기능을 따라하는 것에 급급하다보니 수업시간에 사용되는 row 데이터에 대한 이해가 부족한 상태로 실습을 진행하게 되었고, 이로 인해 전반적인 데..
애매한거 X, 데이터를 모르는 사람에게 설명할 수 없으면 X [우리조 피드백] 제출하기 전 몇가지 오류를 발견하여 수정하였다. Good 에어비앤비 로고 대시보드 사용 타겟을 명확히 정한 것 실무에서 쓰이는 대시보드 csv로 다운로드 가능하다 Bad 근거로 사용한 데이터, 그래프에 대한 설명이 명확하지 않았다. → 그래프를 잘라서 필요한 부분만 보여주는 것이 좋았다. 지역명 띄우기 +) 점수제 쓰는 것이 좋다 row데이터에 대한 이해가 충분해야 한다. 매출, 순위 같은 전체적인 숫자는 적어놓아야 한다. or 외우고 있어야한다. → 결론이 있는 것이 좋다. 이러이러한 기준으로 이 사람들을 자르면 이만큼의 매출이 늘어난다. make function [프로젝트 과정] 위에서 ~하고 싶다 → 제안서 작성 → 보여..
📍 피드백 태블로 사용 시 고려해야 할 점: 확실히 이해하고 기능 사용하기! [우리조 피드백] 클릭하면 info 나오는 것 좋다. 맵에 색칠 대신 원으로 변경 방이 1개인데 300만원 버는 사람이랑 방 3개인 사람이 벌어들이는 수익이 다를 수 있다. (방이 적으면 불리하다) → 실무에서 쓰이기 좋은 대시보드! ➡️ 있어보이는 대시보드보다 이것을 보는 사람이 이해하기 쉬운 대시보드를 만드는 것이 중요하다는 것을 몸소 느낄 수 있는 과제였다. [추가 피드백] 대소문자 통일하기 동작이 복잡한 경우 사용방법 기재하기 (뭐뭐를 누르면 뭐뭐가 바뀝니다) 대시보드를 설명 잘하는 것이 중요하다. 보고서에 대시보드 캡쳐 후 설명하기 태블로의 집계하려는 특성 → HostId가 중복되면 더해버린다. (중복 없애기), SQL..
앞으로의 과제 진행 칠판에 적은거 찍어서 보내기 (제안) 레이아웃만 짜기 (청사진) 대시보드 만들기 전략 대시보드: 제안 80% 디자인 20% 실무 대시보드(=내가 쓰는것) 과제 피드백 전 달보다 크게 수익이 늘어난 호스트 오래되었지만 수익이 안나거나 리뷰가 떨어진 호스트 집중 관리 첫 두 달은 리뷰에서 제외하기 리뷰 비율 살펴보기 매출 10% 미만 중 리뷰가 있는 Data 가장 최근을 기준으로 잘하고 있는 호스트가 가장 중요하다. score 만들기: 100점 만점으로 어디있는지 직관적으로 볼 수 있는 것이 좋다. 이중축 사용시 하단에 텍스트로 부가설명이 필요하다. 더보기 먼저 저희는 에어비앤비의 연도별 host 수의 추이를 직관적으로 확인할 수 있도록 상단에 그래프를 만들었습니다. 이에 대한 해결 방안..
📌 지난 시간 팀 과제 피드백 Q. 지역 매니저와 임원이 보고 싶은 데이터의 차이점 ➡️ 임원 현재 재무 상황(전략팀, 재무Finance팀 승진 와따) 절대적&상대적 숫자 비교 시장에서의 입지 (=점유율) -> 통계청에 전화하기, 뉴스 찾아보기(이데일리 뉴스) 컨설턴트 회사가 기자에게 뿌리는 것이다, 점유율 아는 사이트: 방문자 수 트래킹하여 파는 것 - 마켓의 총 GMV: 시장이 전체적으로 떨어졌나? 불경기인가? 확인하기 또는 발명, 발견 (ex. 조선업) = 나만 줄었나? 다 줄었나 확인해야함. 다 줄었으면 시장을 탈출해야 한다. - 큰그림(Profit만 잘나오면된다) - 구체적으로 물어보지 않는다 (애매하게) - 숫자 크게 하기 - 그래프에 숫자 표현하기(단위) - 색상 테마 정하기(알록달록하게X)..
태블로란? 데이터를 사용해 문제를 해결하는 방식에 혁신을 가져온 시각적 분석 플랫폼으로, 사람(의사결정권자)과 조직이 데이터를 최대한 활용하도록 지원 태블로 데스크탑 프로 -> 보안 but 비쌈 태블로 퍼블릭 Data Analyst가 실무에서 하는 업무 데이터 추출: 70% 데이터 분석: 10% 기획 → tool은 side로 / yoy, mom 대시보드 시각화: 15% → 간단하고 빠르게 만들기 / DB는 매일 업데이트 된다 = 자동화되어야함 / 인수인계를 할 수 있어야함 기획 및 제안: 5% → 모두가 이해할 수 있는 기획을 해야한다 = 숫자는 5개 이하로, 전문용어(한 시트에 30초안에 설명할 수 있어야함), 어떻게 회사에 이득을 줄건지 기획과 제안을 잘하는 데이터 분석가가 없는 이유: 전문용어를 사..
💭 이번주 회고 [Tableau] 이번주는 태블로를 사용하여 고급 데이터를 분석하는 법, 애니메이션을 만드는 법, 세부 수준 계산 (LOD), 고급 매핑 기술 구현에 대해 학습했다. 애니메이션 기능을 이용한 TED 강의를 시청했는데 정말 인상깊었고, 강의를 보며 따라 만들어보니 더더욱 재미있었다. 추후 진행될 프로젝트에서 애니메이션 기능을 사용할 수 있다면 꼭 사용해보고 싶다고 생각했다. LOD는 강의를 들어도 정말 어려운 파트였다. 완전히 이해되지는 않았지만 강의를 차근차근 따라하다보니 원하는 결과물을 만들어낼 수 있었고 퀴즈도 다 맞아서 나름 선방했다고 생각하는 시간이었다🥲 오프라인으로 진행되는 태블로 강의에서 더욱 꼼꼼하게 다뤄주신다고 하니 이번 고급 수업은 이런 기능이 있구나~를 알아가는 시간이라..
목차 [섹션 9] 시계열 예측을 위한 딥러닝 [섹션 10] 페이스북의 Prophet 예측 라이브러리 [섹션 9] 시계열 예측을 위한 딥러닝 [섹션 10] 페이스북의 Prophet 예측 라이브러리 ✍️ 마무리하며 * 유데미 큐레이션 바로가기 : https://bit.ly/3HRWeVL * STARTERS 취업 부트캠프 공식 블로그 : https://blog.naver.com/udemy-wjtb 📌 본 후기는 유데미-웅진씽크빅 취업 부트캠프 4기 데이터분석/시각화 학습 일지 리뷰로 작성되었습니다.
목차 섹션 8: 일반 예측 모델 예측 모델 소개 Part1 예측 평가 예측 모델 소개 Part2 자기상관 함수와 부분 자기상관 함수 아리마의 개요 자기 회귀 모델 개요 자기 회귀 모델을 Statsmodel로의 구현 기술 통계학과 검정 ARIMA 이론 개요 ARIMA 차수 선택 ARIMA와 ARIMA 모델 자기회귀 통합 이동평균 SARIMA - 계절성 자기회귀 통합 이동평균 SARIMA - 계절성 자기회귀 통합 이동평균 외생 변수 벡터 자기 회귀 모델 벡터 자기 회귀 이동 평균 예측 연습 예측 모델 소개 Part1 ➡️ 홀트-윈터스 계절성 기법 모델을 사용하여 미래 날짜를 예측하는 방법 살펴보기 시계열의 테스트 데이터셋: 가장 최근 데이터 → 예측 모델을 훈련 데이터에 피팅한 다음 훈련 데이터를 기반으로 ..