On-Premises Data Gateway trên Power BI

Cách cài đặt cập nhật dữ liệu tự động cho báo cáo Power BI

Ngày đăng: 13/07/2023

Hướng dẫn cài đặt cập nhật dữ liệu tự động cho báo cáo Power BI với mọi nguồn dữ liệu

Sau khi hoàn thành việc xây dựng report trên Power BI Desktop, chúng ta cần tiến hành xuất bản (publish) lên Power BI Service để chia sẻ báo cáo đến các người dùng khác nhau trong nội bộ doanh nghiệp hoặc các đối tác. Việc kết nối và tiến hành setup refresh tự động trên Power BI Service là công việc được thực hiện ngay khi publish để đảm bảo report cập nhật data mới nhất.  

Tuy nhiên, trở ngại chúng ta gặp phải là không phải tất cả các nguồn dữ liệu đều cho phép refresh một cách dễ dàng. Cụ thể với những nguồn dữ liệu ở trên máy tính (on-premises files) như file excel, csv, txt hay các on-premises database như SQL server chẳng hạn, chúng ta sẽ cần phải cài đặt On-Premises Data Gateway để có thể tiến hành kết nối và refresh được trên Power BI Service. Bài viết này sẽ hướng dẫn bạn đọc cách cài đặt và thực hiện các thiết lập gateway cần thiết.  

On-Premises Data Gateway là gì?

On-premises data gateway là một ứng dụng được cài đặt trên hệ thống nội bộ của cá nhân hoặc doanh nghiệp với tác dụng như là một cầu nối truyền dữ liệu nhanh chóng và an toàn giữa on-premises data (dữ liệu lưu trữ ở nội bộ và không có trong đám mây) với một số dịch vụ đám mây của Microsoft (Power BI, Power Apps, Power Automate, Azure Analysis Services và Azure Logic Apps…).

On-Premises Data Gateway trên Power BI

Chiếc cầu nối On-Premises Data Gateway này sẽ tạo một liên kết mạnh mẽ và an toàn nhằm chuyển dữ liệu từ các nguồn dữ liệu nội bộ tới Power BI Service. Việc này sẽ giúp chúng ta kết nối dữ liệu trực tiếp từ các nguồn nội bộ trên máy tính của chúng tới Power BI Service và sau đó, từ liên kết này chúng ta có thể cài đặt việc cập nhật dữ liệu một cách tự động nhanh chóng trên Power BI Service, chứ không phải thông qua Power BI Desktop. 

On-Premises Data Gateway

Chu trình thực thi của On-premises Data Gateway trên Power BI 

Chu trình thực thi của On-premises Data Gateway trên Power BI 

Chu trình thực hiện kết nối giữa Database với Power BI Service thông qua Gateway được thực hiện theo 7 bước sau: 

  1. Cài đặt cổng thông tin Gateway: Cài đặt cổng thông tin Power BI trên một máy tính hoặc hệ thống trong nền tảng cục bộ. Trong quá trình cài đặt này, thông tin xác thực được lưu trữ cả ở môi trường Local và Power BI Service. 
  1. Nhập thông tin xác thực (Credentials): Khi cài đặt xong, chúng ta cần cung cấp thông tin xác thực cho database trong Power BI. Thông tin này được mã hóa và sau đó lưu trữ trên Cloud. Chỉ gateway mới có thể giải mã thông tin xác thực này. 
  1. Kích hoạt dataset refresh: Dịch vụ Power BI khởi chạy quá trình làm mới bộ dữ liệu thông qua dataset refresh trong Power BI Service 
  1. Dịch vụ Di chuyển Dữ liệu (Data Movement Service): phân tích truy vấn và đẩy yêu cầu đến Service bus 
  1. Có một loạt các yêu cầu được gửi tới Service bus. Cổng thông tin truy vấn hàng này sẽ xử lý các yêu cầu đang chờ. 
  1. Cổng thông tin thực thi truy vấn: Cổng thông tin nhận truy vấn và thực thi nó trên nguồn dữ liệu database tương ứng. 
  1. Trả kết quả về Power BI: Sau khi nhận kết quả từ nguồn dữ liệu, cổng thông tin gửi kết quả đó trở lại Power BI. 

Sau khi hoàn thành 7 bước trên, cổng thông tin Power BI cho phép làm mới bộ dữ liệu và truy xuất dữ liệu từ nguồn dữ liệu nội bộ để đảm bảo rằng báo cáo và bảng điều khiển của chúng ta được cập nhật và hiển thị thông tin mới nhất. 

Các loại On-Premises Data Gateway 

On-Premises Data Gateway trong Power BI có hai chế độ: On-premises data gateway (Personal mode) và On-premises data gateway (Standard mode). 

Trong bài viết này, chúng mình sẽ tập trung hướng dẫn các bạn về chế độ Personal mode Gateway (bao gồm: cách cài đặt, cách thao tác và các thiết lập cần thiết). 

Sự khác biệt giữa hai chế độ này không phải liên quan tới chi phí hay các tính năng ưu việt hơn. Cả hai chế độ này chúng ta hoàn toàn có thể cài đặt miễn phí sử dụng. Sự khác biệt nằm ở cách chúng ta muốn sử dụng gateway với:  

  • On-premises data gateway (Standard mode): Cho phép nhiều người dùng kết nối với các nguồn dữ liệu on-premises. Chỉ cần 1 gateway, có thể sử dụng cổng dữ liệu on-premises với tất cả các dịch vụ được hỗ trợ. Gateway này rất phù hợp với trường hợp nhiều người truy cập vào nhiều nguồn dữ liệu. Khi cài đặt Data Gateway ở chế độ Standard Mode, người dùng khác trong tổ chức có thể sử dụng kết nối của chúng ta để truy cập và làm việc với dữ liệu từ các nguồn dữ liệu được kết nối. Chế độ này thường được sử dụng trong các tình huống khi chúng ta cần chia sẻ kết nối dữ liệu với các thành viên khác trong tổ chức để họ có thể tạo và cập nhật báo cáo hoặc truy vấn dữ liệu. 

    Video hướng dẫn tải và sử dụng Data gateway (Standard mode):
  • On-premises data gateway (Personal mode): Cho phép duy nhất một cá nhân kết nối với các nguồn và không thể chia sẻ với người khác. On-premises data gateway (personal mode) chỉ có thể được sử dụng với Power BI. Gateway này phù hợp với trường hợp chúng ta là người duy nhất tạo báo cáo và không cần chia sẻ bất kỳ nguồn dữ liệu nào với người khác. 

Hướng dẫn cài Personal Gateway (Personal mode) trên máy tính nội bộ 

Bước 1: Đầu tiên tải bộ cài bằng link: https://powerbi.microsoft.com/en-us/gateway/ vào máy tính cá nhân. 

Cài đặt gateway cập nhật dữ liệu tự động trên Power BI

Bước 2: Thực hiện cài đặt On-Premises data gateway trên máy tính. 

Các loại On-Premises Data Gateway 

Đường dẫn install to, chúng ta cứ để mặc định, check “I accept…” và bấm Install để cài đặt. 

Điền email công ty sử dụng gateway. Lưu ý: Email này là account đăng ký account Power BI.  

Kết quả sau khi hoàn tất các bước (cài đặt bản mới nhất June.2023). 

On-Premises Data Gateway personal mode

Hướng dẫn cài đặt cập nhật dữ liệu tự động trên Power BI Service

Bước 3: Cài đặt cấu hình Gateway trên Power BI service 

Sau khi chúng ta cài đặt Gateway trên máy tính, chúng ta cần cấu hình gateway trên Power BI Service để refresh dữ liệu. Giả sử chúng ta có 1 báo cáo có tên Test gateway. Báo cáo này sử dụng 1 data source là 2 file excel lưu trữ trên nội bộ máy tính và 1 file lấy từ database của SQL.  

Để thiết lập các cấu hình settings cho data gateway chúng ta vào kích chuột phải vào Mục “” (“More options”) ở phần dataset và chọn Settings: 

Đến đây, chúng ta đã vào màn hình giao diện chính để thiết lập các xác thực cho data gateway như hình bên dưới: 

Nhiệm vụ chính của chúng ta ở đây là tiến hành thực hiện setup cho 3 mục, lần lượt là: 

+ Gateway connections 

+ Data source credentials 

+ Refresh 

Phần gateway connections: Power BI Service mặc định rằng sau khi chúng ta cài đặt gateway trên máy tính thì nó sẽ nhận ra chúng ta có cài đặt một Personal gateway trên máy tính và có thông báo như màn hình bên dưới. 

Trong trường hợp gateway connections không hiển thị và có thông báo là “You don’t have any data gateways” thì bạn hãy lựa chọn restart trên phần mềm Data Gateway hoặc tiến hành uninstall file cũ và tiến hành cài đặt lại nhé.

Phần Data Source Credentials: Lúc này thì các data source trong file chúng ta vẫn chưa được tiến hành xác thực và có thông báo “Failed to test the connection to your data source”.

Đừng lo lắng, chúng ta sẽ lần lượt xác thực các dataset này bằng cách nhấn vào mục Edit Credentials. 

Với mỗi loại Datasource, các thiết lập là khác nhau.  

Đối với Excel:
Chúng ta sẽ cần cung cấp xác nhận cho 2 thiết lập là:

  • Authentication method (Phương pháp xác thực): Lựa chọn Windows Without Impersonation. 
  • Privacy level setting for this data source: Tùy thuộc vào mức độ nhạy cảm và quan trọng của dữ liệu, bạn có thể lựa chọn các mức thiết lập khác nhau từ “Private, Organizational, Public hoặc None”.   

Sau khi đã xác nhận các thiết lập trên, trên màn hình sẽ hiển thị kết quả xác nhận đã thành công là:  

Đối với nguồn dữ liệu SQL:

Do nguồn dữ liệu SQL thường được cài đặt trên máy chủ, và có yêu cầu tài khoản và mật khẩu để đăng nhập nên bạn cần lựa chọn: 

  • Authentication method: Lựa chọn Basic 
  • Username và Password: Điền thông tin username và password của SQL 

Sau khi hoàn thành, chúng ta có thông báo đã thành công như sau 

Kết quả sau khi đã xác thực các thông tin (Không còn dấu báo lỗi)  

Phần Refresh: Chúng ta sẽ tiến hành thiết lập lịch cập nhật tự động (refresh schedule) như sau. 

Sau khi hoàn thành thiết lập 2 phần trên của Data Gateway, chúng ta có thể bấm On ở phần lựa chọn Refresh để thiết lập lịch. 

Bằng việc bấm vào Add another time: chúng ta có thể lựa chọn bổ sung thêm số lần refresh.  

Lưu ý: 

  • Tài khoản Pro: có thể tiến hành refresh schedule tối đa 8 lần trong ngày.  
  • Tài khoản Premium: có thể tiến hành refresh schedule tối đa 48 lần trong ngày 

Ngoài ra, mọi người có thể tiến hành đăng ký bổ sung các email cần thiết trong mục “Send refresh failure notifications to”: Trong trường hợp Refresh failure thì Power BI Service có thể gửi thông báo tới. 

Sau khi hoàn thành tất cả các thiết lập với 3 mục trên, báo cáo trên Power BI Service của chúng ta đã hoàn thành việc kết nối Data Gateway trên máy và có thể tiến hành cập nhật định kỳ như lựa chọn. 

Một lưu ý nữa là không nên cài đặt trực tiếp gateway vào máy tính cá nhân, chẳng hạn như máy tính xách tay, có thể bị tắt, ở chế độ ngủ hoặc bị ngắt kết nối Internet.  

Bạn có thể thấy những kết quả Failed trên là do data gateway của chúng ta ở chế độ Offline khiến Power BI Service không thể kết nối.  

Lưu ý khi sử sụng Gateway

  • Gateway không được hỗ trợ trên các cài đặt Server Core. 
  • Gateway không được hỗ trợ trên Windows containers. 
  • Người dùng cài đặt gateway phải là quản trị viên của gateway. 
  • Không thể cài đặt gateway vào một domain controller. 
  • Nếu chúng ta định sử dụng xác thực Windows, hãy đảm bảo rằng chúng ta cài đặt gateway vào máy tính là thành viên của cùng môi trường Active Directory với nguồn dữ liệu. 
  • Nếu gateway sử dụng mạng không dây, hiệu suất của nó có thể bị ảnh hưởng. 
  • Chúng ta có thể cài đặt các ứng dụng khác trên gateway machine, nhưng điều này có thể làm giảm hiệu suất gateway. Nếu chúng ta cài đặt các ứng dụng khác trên gateway machine, hãy đảm bảo giám sát gateway machine kết nối chặt chẽ để kiểm tra xem có bất kỳ tranh chấp tài nguyên nào không. 
  • Chúng ta có thể cài đặt tối đa hai gateway trên một máy tính: một gateway chạy ở chế độ cá nhân và gateway còn lại chạy ở chế độ tiêu chuẩn. Chúng ta không thể có nhiều gateway chạy ở cùng một chế độ trên cùng một máy tính. 
  • Với tài khoản Pro bạn phải lưu ý set up data refresh hoàn thành trong vòng 2 tiếng đồng hồ. Trong trường hợp dữ liệu nặng yêu cầu thời gian load dữ liệu nhiều hơn, bạn cân nhắc chuyển sang sử dụng gói Premium với tối đa thời gian load là 5 giờ.  
  • Sau 2 tháng không hoạt động, các thiết lập scheduled refresh trên dataset của bạn sẽ bị dừng. Một dataset được coi như không hoạt động khi không có người dùng nào mở ra sử dụng hoặc xây dựng report cho dataset. Khi mà scheduled refresh bị dừng, bạn (người chủ của dataset) sẽ nhận được một email thông báo việc dừng hoạt động. Để có thể kích hoạt lại, bạn có thể vào lại dashboard hoặc report để tái khởi động.   

Hy vọng rằng thông qua bài viết này bạn đã hiểu về các thiết lập cần thiết cho On-premises Data Gateway và những lưu ý xung quanh việc thiết lập để giúp báo cáo của mình có thể kết nối giữa dự liệu nội bộ với Power BI Service và setup tự động refresh hiệu quả nhất. Bạn hãy lưu lại và sử dụng khi thấy cần thiết nhé.

Bài viết liên quan:

So sánh 4 chế độ lưu trữ dữ liệu trên Power BI

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *