Chúng ta chắc hẳn ai cũng đã gặp trường hợp muốn đưa nhiều File Excel (hoặc cả Folder) vào trong Power BI để phân tích dữ liệu, mà trong mỗi file đó lại chứa các sheets (như đối với dữ liệu doanh số công ty chia theo từng tháng được lưu trữ lại dưới dạng sheets). Bài viết sau đây sẽ giúp ta có thể load được dữ liệu từ Excel vào Power BI, gộp các cột dữ liệu có cùng kiểu để rút ngắn thời gian, nâng cao hiệu suất phân tích dữ liệu.
I. Nhập dữ liệu File Excel từ Folder
Đưa tất cả các file Excel của bạn vào một tệp (Folder), sau đó thực hiện các bước sau trong Power BI desktop:
1.Phía trên thanh công cụ, chọn Get data, kéo xuống và lựa chọn Select Folder:
2.Trên màn hình sẽ xuất hiện cửa sổ Folder. Nhập đường dẫn của Folder hoặc nhấn nút Browse and navigate tìm kiếm Folder đó. Chọn và nhấn Ok:
3.Nhấn vào ô Transform data, khi đó Query editor sẽ mở lên như hình:
Chú ý rằng nhấn vào ô Combine thì dữ liệu sẽ tự động được gộp lại với nhau, tuy nhiên nếu dữ liệu của bạn không cần thiết thì có thể nhấn Load để đưa vào Power BI luôn hoặc Transform Data để tiếp tục làm sạch dữ liệu.
4. Trong Query Editor, nhấn vào Binary bên cạnh tên file Excel để chọn riêng từng file:
5. Lựa chọn ô Data cạnh tên của file Excel. Thực hiện các biến đổi cần thiết đối với dữ liệu của bảng, sau đó nhấn Close & Apply
II. Xử lý dữ liệu, gộp nhiều Sheets trong một File Excel:
Sau khi đã đưa file Excel vào PBI, một số file sẽ có các sheets khác nhau bên trong mà chúng ta muốn gộp lại. Chúng ta sẽ làm theo các bước sau đây:
1. Trong phần Navigator, chúng ta sẽ nhìn thấy các sheets và cả các bảng. Nhấn vào phần Transform Data:
2. Trong cửa sổ Query Editor, nhấn chuột phải vào Navigation Step và nhấn Delete Until End ( hành động này sẽ xóa tất cả các bước phía sau và không thể thực hiện lại)
3. Giờ thì trong phần Applied Step sẽ chỉ còn 1 bước (Source) và phần xem trước của Data sẽ bao gồm các bảng và tất cả các Sheets trong đấy:
4. Nhấp chuột phải vào phần data, chọn Remove Other Columns:
5. Giờ bạn có thể mở rộng cột data dưới dạng cơ bản:
6. Sau khi nhấn OK thì tất cả dữ liệu của chúng ta sẽ được nối vào thành một bảng duy nhất: