홍동이의 성장일기

[👩‍💻TIL 6일차 ] 유데미 스타터스 취업 부트캠프 4기 본문

교육/유데미 스타터스 4기

[👩‍💻TIL 6일차 ] 유데미 스타터스 취업 부트캠프 4기

홍동2 2023. 2. 13. 11:16

목차

 

[80차시]그래프에 수직선, 수평선 그리기

[81차시]그래프에 설명적기

[82차시]2중y축 표시하기

[83차시]seaborn-막대그래프

[84차시]데이터의 관계파악을 위한 scatterplot

[85차시]데이터의 추세를 표현하는 lineplot

[86차시]데이터의 분포를 나타내는 여러가지 그래프

 

[서울시 연간 기온변화 분석 및 시각화]

[87차시]전국 기온 데이터 수집

[88차시]전국 기온 데이터 확인

[89차시]서울시 연간 기온변화 분석 및 시각화

[90차시]서울시 연간 평균기온,최저기온,최고기온 변화 시각화

[91차시]서울시 연간 평균기온,최고기온,최저기온 한눈에보기

 

[전국 지점별 기온 분석]

[92차시]데이터 추출 및 전처리

[93차시]지점별 연 평균기온 시각화

[94차시]지점별 연 최저기온,최고기온 시각화

[95차시]지점별 기온분포 시각화


[80차시]그래프에 수직선, 수평선 그리기

 

 

 

 

 

위 그래프에 따르면 주말과 목요일의 테이블 수가 많은 것을 알 수 있다.

 

추가분석을 통해 요일에 따른 시간대를 살펴보니 주말은 모두 저녁식사였고 목요일은 점심 식사가 이루어지는 것을 알 수 있었다. 해당 식당은 목요일 점심과 주말 저녁 장사에 집중해야함을 확인했다.


[81차시]그래프에 설명적기

 


[82차시] 2중y축 표시하기

 

[83차시]seaborn-막대그래프

 


[84차시] 데이터의 관계파악을 위한 scatterplot

 

 

 


[85차시]데이터의 추세를 표현하는 lineplot

 

 

 


[86차시]데이터의 분포를 나타내는 여러가지 그래프

 

 

 

➕) 러그 플롯은 처음 들어봤는데 무슨 용도인지 잘 이해가 가지 않아서 조금 더 알아보았다.

러그 플롯(rug plot)이란, xy 평면에서 x축 방향, y축 방향 두 개의 1차원 주변 분포를 나타내어 2차원 도표를 보완하도록 설계된 컴팩트한 시각화 방법입니다. 러그 플롯은 개별 사례를 표시하므로 작은 규모의 데이터 세트에 적합합니다.

 

 

[R] ggplot(), geom_rug() : 러그 플롯(rug plot) 그리기, 그래프에 두 변수의 marginal distribution 시각화하기

주변 분포(marginal distribution) 확률 변수들의 부분 집합의 주변 분포란, 그 부분 집합에 속한 확률 변...

blog.naver.com


[87차시]전국 기온 데이터 수집

csv파일 다운로드 후 바로 파일명을 변경해주는 것이 좋다.

[88차시]전국 기온 데이터 확인

[89차시]서울시 연간 기온변화 분석 및 시각화

[90차시]서울시 연간 평균기온,최저기온,최고기온 변화 시각화

[91차시]서울시 연간 평균기온,최고기온,최저기온 한눈에보기

 

 

 


[92차시]데이터 추출 및 전처리

[93차시]지점별 연 평균기온 시각화

[94차시]지점별 연 최저기온,최고기온 시각화

[95차시]지점별 기온분포 시각화

09 전국 지점별 기온 분석_실습

 

 


새로 알게된 점

다른분들의 TIL을 둘러보다가 주피터 노트북을 티스토리로 가져올 수 있다는 것을 알게 되었다. (감사합니다☺️)

 

[참고링크]

 

Jupyter Notebook에서 처리한 작업을 Tistory로 손쉽게 가져오기

주피터 노트북에서 작업한 내용을 깔끔하게 티스토리에 정리하는 노하우를 공개하겠다. (1) 주피터 노트북에서 File 탭에서 Print Preview를 누른다. (2) 새로운 창이 열리면서 주피터에서 작업한 내

jfun.tistory.com

[적용방법]

 

  1. 주피터 노트북 File > Print Preview
  2. 새로운 창이 열리면 Ctrl + U
  3. 작업한 내용이 html로 보이게 되는데 Ctrl + A로 전체 선택 후, Ctrl + C로 복사
  4. 티스토리 화면 우측 상단 기본모드 > HTML로 들어간 후 원하는 위치에 붙여넣기

위 링크에 5번은 각 셀의 크기를 조정하는 것이라 굳이 바꾸지 않아도 괜찮다.

+) 한두개 올리는게 아니라면 주피터 노트북 여러개를 티스토리로 가져오는 것은 추천하지 않는다. 여러개를 가져오다보니 자꾸 깨진다...🥲 해당 기능은 분석 파트 정도에서 사용하면 좋을 것 같다.

 

 

[파트너간 상보적 학습 및 강의 내용 리뷰]

 

이번 시간에는 각자 멘토링 시간에 질문할 거리를 생각해보았다. 우리끼리 고민해본 후 해결하지 못한 문제는 질문하기로 했다. 우리조의 질문은 첫째, 러그 플롯의 의미와 활용방법. 둘째, 여러 개의 데이터프레임 쉽게 불러오는 법. 셋째, 데이터 인사이트 잘찾는법. 넷째, 데이터를 잘 표현할 수 있는 그래프 찾는법이었다.

 

그리고 주피터 노트북을 티스토리에서 불러오는 과정에서 자꾸 깨지는 오류가 발생했는데 마침 우리 조에 티스토리로 주피터 노트북을 옮기신 분이 계셔서 여쭤봤더니 html을 기본모드로 바꾸면 주피터 노트북이 깨진다고 한다‼️ 다음 글부터는 주피터노트북을 한번에  html형태로 가져와서 업로드해야겠다. 그리고 한분은 코드를 깃허브에 관리한다고 하셔서 나도 깃허브에 코드를 올려야겠다고 생각했다.

 

 

멘토링 시간 질문 및 답변

 

1️⃣ 러그 플롯의 의미와 활용방법

x축의 분포를 확인할 수 있다. 그런데 정말 y축은 왜나오는걸까?

 

2️⃣ 여러 개의 데이터프레임 쉽게 불러오는 법

같은 조 분이 알려주셨다..! 완전 코딩 천재!!!

df = pd.read_csv('C:/code/data/1911-1920 일별 기온.csv, encoding = 'cp949') # 처음(1911-1920년) 데이터 프레임 
for i in range(1921, 2021, 10) : # 1921년부터 10년 단위로 반복해줌
    df1 = pd.read_csv(f'C:/code/data/{i}-{i + 9} 일별 기온.csv', encoding = 'cp949') # 더할 데이터프레임
    df = pd.concat([df, df1], axis = 0) # 기존 데이터프레임과 더하기

df.to_csv('1911-2020 일별 기온.csv', encoding = 'cp949') # 전체 데이터프레임 저장

잘 이해가 안가서 설명해주실 수 있냐고 여쭤보니 친절하게 설명도 해주셨다👼 감사합니다💕

 

3️⃣ 데이터 인사이트 잘찾는법

도메인 지식(배경 지식)이 중요하다.

기술적 역량

 

4️⃣ 데이터를 잘 표현할 수 있는 그래프 찾는법

Matplotlib 공식 홈페이지 참고

 

Examples — Matplotlib 3.6.3 documentation

Examples This page contains example plots. Click on any image to see the full image and source code. For longer tutorials, see our tutorials page. You can also find external resources and a FAQ in our user guide. Lines, bars and markers Images, contours an

matplotlib.org

Seaborn 공식 홈페이지 참고

 

Example gallery — seaborn 0.12.2 documentation

 

seaborn.pydata.org

 

우리 조 질문 모두 해결!

 


* 유데미 큐레이션 바로가기 : https://bit.ly/3HRWeVL

* STARTERS 취업 부트캠프 공식 블로그 : https://blog.naver.com/udemy-wjtb

💡본 후기는 유데미-웅진씽크빅 취업 부트캠프 4기 데이터분석/시각화 학습 일지 리뷰로 작성되었습니다.

 

 

 

728x90
Comments