Python 13

[Pandas 데이터 전처리 100문제 실습] (Grouping part) #44~55

저번 Pivot에 이어서 오늘은 판다스 전처리 Grouping에 대한 문제를 풀어보려고 한다. 문제를 제공해 주시는 분은 동일하게 Data Manin분의 데이터 학습 자료를 이용하겠다. (앞서 피벗 테이블에 대해 배웠다. 동일하게 그룹바이도 하나의 데이터 프레임이다. 식이 길어 어렵게 느껴지지만, 피벗과 동일하게 하나씩 인자를 정해주면 쉽게 해결 할 수 있을거 같다.) Grouping 문제풀이 [사용 데이터: 뉴욕 airBnB : https://www.kaggle.com/ptoscano230382/air-bnb-ny-2019 DataUrl = ‘https://raw.githubusercontent.com/Datamanim/pandas/main/AB_NYC_2019.csv’] #44 문제풀이: 실행 전에 ..

[Pandas 데이터 전처리 100문제 실습] (Pivot part) #83~86

이번 카테고리는 데이터 분석 중 80%시간 과정을 차지하는 판다스 데이터 전처리 연습을 할 것이다. 시작 전, 구글링을 통해 전처리 100문제를 올려놓은 좋은 사이트를 들어간다. (제 자료는 아니고, DataManin분께서 직접 만드신 자료입니다.) 이번 전처리 100문제 실습 파트에서는 위의 링크에서 문제들을 직접 풀어보고, 설명하는 내용이 될 거 같다. 코딩을 잘하지 않아서, 비효율적이고, 오류가 발생할 수 있으니, 직접 링크를 들어가서 공부하는 것을 추천한다. 먼저, 최근에 배운 Pivot에 대한 문제를 먼저 풀겠다. Pivot 문제 풀이 [사용 데이터 : 국가별 5세이하 사망비율 통계 : https://www.kaggle.com/utkarshxy/who-worldhealth-statistics-2..

[파이썬 머신러닝 판다스 데이터 분석] part 1(시리즈와 데이터 프레임)

얼마 전, "파이썬 머신러닝 판다스 데이터 분석" 에서 데이터 전처리 부분 공부를 완료했다. 유튜브(나도코딩 등)와 패스트 캠퍼스와 함께 개념을 하나씩 잡으니 입문 과정까지는 어느 정도 익숙해질 수 있었다. 처음에는 저 두꺼운 책을 사용하여 공부를 하려고 했는데, 입문자가 보기에는 너무 어려워, 먼저 이 책을 끝내고 보기로 결정했다. 목차 이번 글은 글은 그 중 [판다스 입문]에 대한 내용을 담고 있다. 많은 내용을 담고 싶지만, 시간이 부족해. 자주 쓰일거 같거나, 인상 깊은 내용을 기준으로 설명을 하겠다. 판다스 입문은 1. 시리즈,2. 데이터 프레임으로 내용이 구성되어 있다. part 1 1. 시리즈 먼저 시리즈에 대해 배우기 전 import pandas as pd로 판다스 라이브러리를 호출한다.시..