본문 바로가기
반응형

pandas3

[Python 데이터 분석 프로젝트]광주 지역 상권 데이터를 활용한 시각화 분석 이번 포스트에서는 파이썬(Python)과 Jupyter Notebook, 그리고 pandas, matplotlib, numpy 등의 데이터 분석 도구를 활용하여 광주광역시의 상권 데이터를 시각화한 프로젝트 내용을 정리하였습니다. 데이터는 광주 지역 상권정보를 기반으로 하며, 업종 분류별 및 지역구별로 시각화하여 인사이트를 얻는 것이 주요 목적입니다. 1. 사용한 데이터 및 라이브러리import csvimport numpy as npimport matplotlib.pyplot as pltimport pandas as pdplt.rc('font', family='Malgun Gothic')pandas: 데이터프레임 생성 및 처리matplotlib: 그래프 시각화numpy: 수치 계산 (비율 계산 등)csv:.. 2024. 6. 20.
[Pandas 기초 실습] 웹 데이터를 불러와 엑셀로 저장하는 방법 – 하계 올림픽 메달 데이터 분석 이번 포스트에서는 Pandas 라이브러리를 사용하여 위키백과에 등록된 하계 올림픽 메달 집계 데이터를 불러오고, 이를 정렬 및 가공하여 엑셀 파일로 저장하는 방법을 소개합니다. 1. Pandas 라이브러리란?Pandas는 파이썬에서 데이터를 다루기 위한 가장 강력한 라이브러리 중 하나입니다. 표 형태의 데이터를 효율적으로 처리하고 분석할 수 있도록 다양한 기능을 제공합니다. 2. 웹페이지 데이터 불러오기 및 데이터프레임 출력import pandas as pddf = pd.read_html('https://ko.wikipedia.org/wiki/올림픽_메달_집계')print(df)df[1] 설명:read_html() 함수는 웹 페이지의 HTML 테이블을 자동으로 찾아서 리스트 형태로 불러옵니다.df[1]처.. 2024. 6. 19.
[Python 데이터분석] 파이썬 데이터 분석 프로젝트 정리 (지하철·상권·인구·Numpy) Python을 활용하여 서울 지하철 승하차 분석, 광주 상권 분석, 인구통계 분석 등을 진행한 과정을 정리하였습니다. Pandas, Matplotlib, Numpy 등을 활용한 실습 예제와 그래프 출력 결과를 통해 데이터 분석의 흐름을 체계적으로 기록하였습니다. 1. 서울 지하철 데이터 분석1) 출근시간대 최다 승하차 역 찾기subwaytime.csv 파일을 분석하여 출근 시간대(오전 7시~9시) 승하차 인원이 가장 많은 지하철역을 찾았습니다.리스트로 결과를 정렬하고 막대 그래프로 시각화하였습니다.최다 승하차 역, 최소 승하차 역, 특정 시간대 하차량이 많은 역 등 다양한 조건을 설정하여 결과를 출력하였습니다.row[10:15:2] # 07~09시 승차 인원 2) 시간대별 승하차 분석24시간 승하차 데.. 2024. 6. 18.
반응형