엑셀

데이터 가져오기 - 2

jenak 2023. 3. 25. 08:31

파워 쿼리를 활용해서 데이터를 가져오는 방법이다.

 

엑셀 2016 부터는 파워 쿼리가 내장되어 있으므로 사용하는 데 큰 무리가 없다.

 

그 이전 버전(excel 2013 부터 그 이전 버전)은 MS 사이트에서 파워 쿼리를 다운받아서 설치해야 한다. 이부분에 대한 내용은 생략한다.

참고할 사이트는 아래와 같다.

https://www.microsoft.com/en-us/download/details.aspx?id=39379 

 

Download Microsoft Power Query for Excel from Official Microsoft Download Center

Important! Selecting a language below will dynamically change the complete page content to that language. ArabicBasqueBulgarianCatalanChinese (Simplified)Chinese (Traditional)CroatianCzechDanishDutchEnglishEstonianFinnishFrenchGalicianGermanGreekHebrewHind

www.microsoft.com


파워 쿼리가 필요한 이유는

 

1. 데이터의 행 크기가 엑셀 허용 범위를 초과한 경우 : 약 1백만 행 이상

2. 데이터에서 원하는 행만 필터하는 경우 : 데이터를 가져올 때 원하는 행만 필터 가능

3. 데이터가 정리되지 않은 경우 : 데이터가 세로 표 형식이 아니면 분석할 수 없으므로 전처리가 필요함

---> 파워 쿼리가 필요한 절대적 이유

 

이 포스트는 1번과 2번에 해당하는 경우에 대한 내용이다.

실습은 백만 행을 초과하는 데이터를 사용하기 어려우므로, 초과했다는 가정하에 원하는 데이터 행만 필터해서 가져온다.

박스오피스.csv
0.05MB

 

왜냐하면, 백만 행이 초과된 파일은 엑셀에서 데이터를 볼 수 없고(워크 시트로 가져오는 것은 불가능, 파워 쿼리에 모델링 상태로 존재), 이 경우는 엑셀의 피벗 테이블만 작업이 가능하기 때문이다.

---> 이 부분은 나중에 포스트할 예정


1. 데이터를 가져온다.

 

파워 쿼리를 사용해야 하므로 텍스트 마법사를 이용하여 데이터를 가져오면 안 된다.

 

2. 미리보기 창에서 하단의 [데이터 변환] 단추를 클릭한다. 

 

단추 이름은 버전에 따라 조금씩 차이가 있다.

 

로드는 액셀로 가져오기 이다. .데이터 변환이 아닌 변환인 경우도 있다.

 

3. 파워 쿼리 창이 열린다.

 

엑셀 창과 변환되지 않는다. 파워 쿼리 창을 닫은 경우에만 엑셀 창을 볼 수 있다.

 

파워 쿼리 편집기 창

 

4. 500 개의 행 중 매출액 값이 있는 경우와 대표 국적이 [한국] 값만 필터한다.

 

매출액 필드의 필터 단추를 클릭한다. 목록 중 Null, 0 은 체크를 해제하고 [확인]을 누른다.

 

대표국적 열의 필터 단추를 클릭하고 텍스트 검색에 [한국]을 입력하고 [확인]을 누른다.

 

 

5. 필터 결과를 확인하면 208개 행이라고 표시된다.

 

상태 표시줄에 필터링 된 레코드 수 표시

6. 엑셀에 데이터를 로드한다.

 

[홈] 탭 - [닫기 및 로드]를 클릭한다.

 

 

7. 워크 시트에서 확인한다.

 

필터링한 결과만 엑셀에 가져오기 완료