서울시 자전거 데이터 분석 MaTableau | Matplotlib에서 Tableau로 시각화 업그레이드
이번에는 서울시 자전거 데이터셋을 활용해 자전거 대여 패턴을 분석하고, Matplotlib으로 시작한 시각화를 Tableau로 업그레이드해보았습니다. 데이터 분석을 통해 하루 중 가장 자전거 대여가 활발한 시간대를 파악하고, 주중과 주말, 계절별 차이 등 다양한 요인이 대여에 미치는 영향을 살펴보겠습니다. 이번 게시글에서는 활발한 시간대를 파악해보겠습니다.
Matplotlib
Matplotlib는 파이썬에서 데이터 시각화를 위한 강력한 라이브러리입니다. 과학 계산 및 데이터 분석 분야에서 널리 사용되며, 다양한 종류의 그래프와 차트를 생성할 수 있습니다. Matplotlib는 특히 NumPy, pandas, SciPy 등 다른 과학 계산 라이브러리와 잘 통합되어 있어 데이터 분석 작업에 매우 유용합니다.
Tableau
Tableau는 데이터 시각화 및 비즈니스 인텔리전스(BI) 도구로, 복잡한 데이터를 쉽게 이해할 수 있는 시각적 형태로 변환해 줍니다. Tableau는 사용자 친화적인 인터페이스와 강력한 기능을 통해 데이터 분석가, 비즈니스 전문가, 개발자 등 다양한 사용자가 데이터를 탐색하고 인사이트를 도출할 수 있도록 지원합니다.
Matplotlib
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
먼저 기본적으로 불러와야할 모듈들 입니다.
이 모듈들을 사용해서 excel 형식의 파일을 불러오고 자전거 대여 수를 시간 별에 맞춰 필터링 해봤습니다.
data = pd.read_excel(my_path)
l=[]
for i in range(24):
l.append(np.sum(data[data['Hour']==i]['Rented Bike Count']))
data에서 Hour가 0~23까지 Rented Bike Count 만 필터링후 모두 합하였습니다.
그렇다먄 L이라는 리스트에는 0시부터 23시까지의 자전거 대여 수를 확인할 수 있습니다.
그런 다음 0시부터 23시까지를 X변수로 설정 후 L을 Y변수로 설정하여 bar그래프를 그렸습니다. 그러면 다음과 같은 결과가 나옵니다.
fig=plt.figure(figsize=(8,4), dpi=200)
ax=fig.subplots()
ax.bar(np.arange(24),l)
별다른 레이블 설정 x,y축 설정은 하지 않았습니다. 기본 막대 그래프를 표현하였을 때 tableau와 차이를 보기 위해서 입니다.
시각화 하여서 얻을 수 있는 인사이트는 08시와 18시가 가장 많은 자전거 대여 수를 가지고 있는데, 이는 출근, 퇴근시간과 연관이 있다고 생각합니다.
Tableau
Tableau로 이 파일을 시각화 하는 것은 매우 간단한 일입니다.
먼저 Tableau에 가입 하시고 desktop에 설치하셔야 합니다.
비즈니스 인텔리전스 및 분석 소프트웨어 | Tableau
Tableau: 비즈니스 인텔리전스 및 분석 소프트웨어
Tableau는 비즈니스 인텔리전스를 위한 시각적 분석 소프트웨어입니다. Tableau를 통해 어떤 데이터든 보고 이해할 수 있습니다.
www.tableau.com
Tableau를 실행하셔서 캔버스에서 파일을 연결 하시면 시트창이 생깁니다.
맨 왼쪽에는 가장 먼저 페이지 창이 있습니다. 이는 차원값, 측정값으로 나누워져있습니다.
오른쪽에는 색상, 크기, 레이블, 세부 정보 등과 같은 다양한 세부 설정 기능이 있습니다.
그래프를 시각화 하기 위해서 Matplotlib으로는 원하는 변수만 직접 필터링하여 나타냈지만 여기서는 단순하게 테이블에서 행과 열을 지정할 수 있습니다.
상단에 열, 행 칸에 테이블에 있는 변수를 Scratch 처럼 올리면 Tableau에서 먼저 자동으로 어울리는 형태의 그래프로 표현해줍니다. 이 데이터에는 적합한 그래프가 막대그래프라 생각하여 Automatic으로 자동 설정 됐습니다.
Matplotlib가 달리 Tableau라는 이름 자체는 정형된 데이터이며 전처리 하는 것이 아닌 오직 시각화를 위해 전처리 된 데이터를 시각화하기 매우 좋은 툴인 거 같습니다. 단순한 클릭 3번으로 막대그래프를 표현할 수 있었고 세부 정보를 통해서 레이블, 혹은 색상을 지정할 수 있었습니다.
다음 게시글에서는 다른 변수에 영향이 가는지에 대해 알아보겠습니다.
'Matplotlib → Tableau' 카테고리의 다른 글
Seoul Cycle Dataset Analyze IlI (1) | 2025.02.06 |
---|---|
Seoul Cycle Dataset Analyze | discovering error point (0) | 2025.02.04 |
Seoul Cycle Dataset Analyze Il (0) | 2025.02.04 |
Matplotlib에서 Tableau로: 데이터 시각화의 새로운 차원 (0) | 2025.02.02 |