pandas를 이용하여 간단한 데이터 분석을 해보았다.
센트럴파크에 살고있는 다람쥐의 데이터 표이다.
https://data.cityofnewyork.us/Environment/2018-Central-Park-Squirrel-Census-Squirrel-Data/vfnx-vebw
2018 Central Park Squirrel Census - Squirrel Data | NYC Open Data data.cityofnewyork.us
import pandas
# csv 데이터 pandas로 읽기
data = pandas.read_csv("squirrel_count.csv")
# 색상별로 데이터 찾기
grey = len(data[data["Primary Fur Color"] == "Gray"])
red = len(data[data["Primary Fur Color"] == "Cinnamon"])
black = len(data[data["Primary Fur Color"] == "Black"])
# 딕셔너리 지정
data_dict = {
"Fur Color" : ["Gray", "Cinnamon", "Black"],
"Count" : [grey, red, black]
}
# 데이터 프레임 변환
data = pandas.DataFrame(data_dict)
data.to_csv("squirrel.csv")
# 결과값
,Fur Color,Count
0,Gray,2473
1,Cinnamon,392
2,Black,103