데이터 분석을 위한 데이터는 어디서 얻을까? 공공데이터포털에 접속하면, 여러 가지 데이터를 얻을 수 있다. 그렇다면, 데이터를 얻고 이를 불러오는 방법은 없을까? 파이썬을 활용해 데이터를 불러오는 방법을 설명한다.
공공데이터포털 사이트에 접속해, 검색창에 원하는 데이터를 검색하면 위와 같은 페이지가 등장한다. 오픈 API를 선택 후, 원하는 자료가 있다면, 활용 신청을 클릭한다. 승인 신청은 바로 얻을 수 있지만, API를 사용할 수 있는 것은 1~2 시간정도 후이다.

그리고, 위와 같이 마이페이지에서 해당 데이터에 일반 인증키를 발급받을 수 있다.
상세 설명을 클릭하면 요청 변수, 출력 결과, 샘플 코드 등을 알 수 있다. 이제 파이썬 코드를 작성하여 보자.

위의 코드는 필자가 작성한 코드이다. 우선 해당 데이터에서 제공한 URL를 이용하여 파이썬 내에서 검색이 가능하도록 queryParams라는 변수에 제공받은 서비스키와 검색할 기간범위를 입력한다.

코드를 실행하면 위와 같이 나온다. 데이터 형식은 헤더와 바디가 있고 바디에 우리가 써야 할 데이터들이 나열되어 있다.
#pandas.DataFrame 만들기
df= pd.DataFrame(dict['response']['body']['items']['item'])
위의 코드를 통해 표 형식으로 만들고 csv 파일형식으로 저장하면 한 눈에 보기 편하게 표 형식으로 정리된다.

이와 같은 방법으로 파이썬에서 오픈 API를 이용해 공공데이터를 분석할 수 있다. 파이썬 활용법이 데이석 작업에 도움이 되기를 바란다.
[ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]