데이터 가져오기 - 2
파워 쿼리를 활용해서 데이터를 가져오는 방법이다.
엑셀 2016 부터는 파워 쿼리가 내장되어 있으므로 사용하는 데 큰 무리가 없다.
그 이전 버전(excel 2013 부터 그 이전 버전)은 MS 사이트에서 파워 쿼리를 다운받아서 설치해야 한다. 이부분에 대한 내용은 생략한다.
참고할 사이트는 아래와 같다.
https://www.microsoft.com/en-us/download/details.aspx?id=39379
Download Microsoft Power Query for Excel from Official Microsoft Download Center
Important! Selecting a language below will dynamically change the complete page content to that language. ArabicBasqueBulgarianCatalanChinese (Simplified)Chinese (Traditional)CroatianCzechDanishDutchEnglishEstonianFinnishFrenchGalicianGermanGreekHebrewHind
www.microsoft.com
파워 쿼리가 필요한 이유는
1. 데이터의 행 크기가 엑셀 허용 범위를 초과한 경우 : 약 1백만 행 이상
2. 데이터에서 원하는 행만 필터하는 경우 : 데이터를 가져올 때 원하는 행만 필터 가능
3. 데이터가 정리되지 않은 경우 : 데이터가 세로 표 형식이 아니면 분석할 수 없으므로 전처리가 필요함
---> 파워 쿼리가 필요한 절대적 이유
이 포스트는 1번과 2번에 해당하는 경우에 대한 내용이다.
실습은 백만 행을 초과하는 데이터를 사용하기 어려우므로, 초과했다는 가정하에 원하는 데이터 행만 필터해서 가져온다.
왜냐하면, 백만 행이 초과된 파일은 엑셀에서 데이터를 볼 수 없고(워크 시트로 가져오는 것은 불가능, 파워 쿼리에 모델링 상태로 존재), 이 경우는 엑셀의 피벗 테이블만 작업이 가능하기 때문이다.
---> 이 부분은 나중에 포스트할 예정
1. 데이터를 가져온다.
파워 쿼리를 사용해야 하므로 텍스트 마법사를 이용하여 데이터를 가져오면 안 된다.
2. 미리보기 창에서 하단의 [데이터 변환] 단추를 클릭한다.
단추 이름은 버전에 따라 조금씩 차이가 있다.
3. 파워 쿼리 창이 열린다.
엑셀 창과 변환되지 않는다. 파워 쿼리 창을 닫은 경우에만 엑셀 창을 볼 수 있다.
4. 500 개의 행 중 매출액 값이 있는 경우와 대표 국적이 [한국] 값만 필터한다.
매출액 필드의 필터 단추를 클릭한다. 목록 중 Null, 0 은 체크를 해제하고 [확인]을 누른다.
대표국적 열의 필터 단추를 클릭하고 텍스트 검색에 [한국]을 입력하고 [확인]을 누른다.
5. 필터 결과를 확인하면 208개 행이라고 표시된다.
6. 엑셀에 데이터를 로드한다.
[홈] 탭 - [닫기 및 로드]를 클릭한다.
7. 워크 시트에서 확인한다.