Bạn đang làm Data Analyst và muốn nâng cao chuyên môn? Bạn muốn chuyển ngành và muốn bước chân và ngành Khoa học Dữ liệu? Chứng chỉ DAA (microsoft data analytics certification) sẽ là tấm vé cho bạn. Bài thi PL-300 là một data analysis test/ Power BI exam đến từ Microsoft. Nếu bạn muốn ôn thi PL-300 nhưng không biết bắt đầu từ đâu, hãy theo dõi bài viết của Datapot để có cái nhìn chuẩn xác và hướng đi nhanh nhất chinh phục kỳ thi này nhé.
Tham khảo Hướng dẫn đăng ký thi PL-300 tại: HƯỚNG DẪN ĐĂNG KÝ THI CHỨNG CHỈ PL-300 – Datapot.vn

Cấu trúc bài thi PL-300 – Kinh nghiệm ôn thi PL-300
Đề thi PL-300 của Microsoft bao gồm 5 chủ đề chính với tỉ trọng điểm số như sau:
- Prepare the data (20-25%)
- Model the data (25-30%)
- Visualize the data (20-25%)
- Analyze the data (10-15%)
- Deploy and maintain deliverables (10-15%)
Các bạn có thể download đề cương kỹ năng tại đây: https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4qlRu
Nội dung cụ thể từng Topic trong bài thi PL-300
Sau đây, chúng ta sẽ đi sâu hơn về ý nghĩa và các nội dung cần học trong từng Topic cụ thể:
Topic 1: Prepare the data – Chuẩn bị dữ liệu
Prepare the data là topic mà bạn cần phải lưu tâm đầu tiên khi ôn thi PL-300. Nó chiếm từ 20 – 25% tổng điểm của bài thi. Đây là phần việc cơ bản nhưng không kém quan trọng khi data analyst làm việc với dữ liệu, không chỉ trên Power BI mà còn với các công cụ, ngôn ngữ khác. Prepare the data trong Power BI là quá trình bao gồm các phần việc chính sau: Get data from different data sources — > Profile the data — > Clean, transform, and load the data
3 nhiệm vụ của Prepare the Data trong Power BI
- Get data from different data sources
Có rất nhiều loại dữ liệu khác nhau trong một tổ chức, doanh nghiệp và nó cũng được lưu trữ ở nhiều nguồn khác nhau. Đơn giản có thể là Excel, CSV, tổ chức hơn thì là trong các hệ cơ sở quản trị dữ liệu như MS SQL, MySQL…, hay trên các cloud như Google bigquery, Microsoft Azure. Với phần này trong ôn thi PL-300, chúng ta cần nắm được cách xác định và kết nối đến nguồn dữ liệu, ngoài ra làm sao để thay đổi setting đối với nguồn dữ liệu.
Ví dụ: Các bảng có cùng định dạng excel đang lưu trong 1 folder chung. Làm sao để import tất cả đồng thời và nối chúng lại thành 1 bảng duy nhất?
- Profile the data
Dữ liệu luôn có thể tồn tại những vấn đề của chính nó, có thể là thiếu dữ liệu ở 1 số cột dữ liệu nào đó, hoặc liệu có thể tồn tại outlier. Bước Profile the data là bước cần thiết để chúng ta nhìn nhận dữ liệu một cách tổng quan và tìm ra những vấn đề của dữ liệu nếu có, từ đó có hướng xử lý tiếp theo. Ở phần này, chúng ta cần biết được khi nào thì sử dụng.
Ví dụ: Để xác định được tỉ lệ missing thì cần dùng tùy chọn nào trong Power Query Editor? (Data Quality) Hay để xác định được phân bố dữ liệu thì dùng tùy chọn nào? (Column Distribution)
- Clean, transform, and load the data
Dữ liệu sau khi được import vào có thể chưa được sạch, tinh gọn và có thể chưa đáp ứng nhu cầu phân tích, báo cáo về sau. Clean và transform gần như là bước không thể thiếu khi làm việc với dữ liệu trên Power BI. Sau khi thao tác làm sạch, biến đổi theo mong muốn, chúng ta cần load dữ liệu vào data model để phục vụ tiếp các phần sau.
Tại phần việc này khi ôn thi PL-300, chúng ta cần nắm được các thao tác định dạng dữ liệu, fill dữ liệu, đặt header, xóa dòng xóa cột, split, transpose, merge, append data, các phép join … Bên cạnh đó, một chút kiến thức cơ bản về Power Query M code là cần thiết.
Ví dụ: Bảng dữ liệu về doanh số bán hàng có tên là “Sales.xlsx” sau khi import, tên cột của bảng đang trở thành dòng thứ nhất của bảng dữ liệu. Bên cạnh đó có cột price đang có định dạng text, với giá trị bên trong có format “$ 100”. Dùng những lệnh nào để có thể đặt lại header cho bảng và tách cột giá thành 2 cột là currency có dạng “$”. Cột còn lại tên là price_1 chính là giá trị số (ví dụ số 100) trong chính cột price ban đầu. (User first row as header, Split)
Topic 2: Model the data – Lập mô hình dữ liệu
Kiến thức và kĩ năng về Model the data là quan trọng bậc nhất và tất nhiên cũng là khó nhằn nhất trong Power BI exam. Tỷ lệ cho phần này là 25 – 30% tổng điểm của bài thi DA-100. Model the data được chia thành 4 nhóm nội dung chính.

- Design a data model
Việc đầu tiên sau khi load dữ liệu chính là thiết kế data model. Data model nói một cách đơn giản, chúng ta xây dựng mối quan hệ giữa các bảng dữ liệu. Với phần này, data analyst cần nắm được 1 số kiến thức về các tính chất của bảng, cột, quick measures, hierarchy, role-playing dimensions, cardinality and cross-filter direction trong 1 relationship.
- Develop a data model
Sau khi design một data model cơ bản dựa trên những gì chúng ta có sau khi load dữ liệu. Chúng ta có thể phát triển, mở rộng data model thông qua việc tạo thêm các calculated column, calculated table, hierarchies… Phần việc này thường cần thiết, khi data model sẵn có có thể không đáp ứng được nhu cầu báo cáo. Với phần này, chúng ta cần nắm được kiến thức, kĩ năng tạo hierarchy, calculated column, calculated table. Bên cạnh đó 1 số kiến thức về cross-filter direction and security filtering, row-level security roles, object-level security.
- Create measures by using DAX
Power BI cung cấp cho chúng ta các Implicit Measure thông qua kéo thả cột khi visualization. Tuy nhiên nhu cầu tạo ra những chỉ số phức tạp hơn, giúp báo cáo có thêm các góc nhìn mới mẻ hơn, khi đó chúng ta cần sử dụng DAX để tạo ra measures. Cần ôn tập một số nhóm DAX function thường gặp khi xử lý với dữ liệu text, string, aggregate. Bên cạnh đó là nhóm hàm liên quan đến Calculate để thể hiện filter context trong DAX. Nhóm hàm Time Intelligence cũng đáng chú ý.
- Optimize model performance
Khi data model nhẹ, Optimize model performance có thể chưa phải là vấn đề đối với bạn. Tuy nhiên, khi chúng ta có những bảng dữ liệu rất lớn, data model phức tạp, sử dụng nhiều measure phức tạp khiến việc tính toán, xử lý bị chậm, đấy là lúc chúng ta cần nghĩ đến tối ưu model performance. Đơn giản, chúng ta loại đi những cột không cần thiết, filter những dòng dữ liệu không sử dụng cho báo cáo, ví dụ như data quá khứ từ rất xa chẳng hạn. Tốn nhiều công sức hơn 1 chút, chúng ta review lại code DAX xem đã tối ưu chưa.
Topic 3: Visualize the Data – Trực quan hóa dữ liệu
Sau khi đã có được data model tạm thời như ý (thực tế phải update rất nhiều) thì chúng ta bắt tay làm một số việc mà nhiều người học Power BI sẽ hào hứng nhất, đó chính là visualize. Nói đơn giản, chúng ta tạo các bảng, biểu đồ để trả lời cho những câu hỏi mà chúng ta, hoặc sếp của chúng ta đặt ra. Đây là phần ôn thi PL-300 mà bạn cần chú ý. Visualize the Data chiếm đến 20 – 25% tổng điểm của bài thi DA-100. Rất quan trọng. Các nội dung bao gồm: Create Reports, Create Dashboards, Enrich reports for usability.

3 Nội dung chính của Visualize the Data
- Create Reports
Chúng ta sẽ tạo ra những bảng, biểu đồ phù hợp để trả lời các câu hỏi. Ví dụ: Muốn biết xu thế tăng hay giảm doanh thu qua các tháng, hay sự tăng trưởng doanh thu so với cùng kì năm trước… Với phần này, chúng ta cần nắm được các loại bảng, biểu, cách dùng của nó phù hợp với những tình huống, trả lời cho những câu hỏi nào. Với mỗi loại visual cụ thể, chúng ta cần biết đưa cột (field) nào vào. Một số kiến thức về format, apply filter…
- Create Dashboards
Dashboard là tập hợp của nhiều report. Một số kiến thức cần ôn tập như là set mobile view, manage tiles on a dashboard, configure data alerts, use the Q&A feature, add a dashboard theme, pin a live report page to a dashboard.
- Enrich reports for usability
Chúng ta có thể tạo 1 số thiết lập để giúp báo cáo dễ xem hơn, dễ dàng trình diễn dữ liệu hơn đối với người xem (end user). Một số kiến thức cần ôn tập như bookmark, tooltip, Interaction giữa các visual trong cùng 1 page, sorting, drillthrough and cross filter, export data…
Topic 4: Analyze the Data – Phân tích dữ liệu
Các câu hỏi về Analyze Data chiếm 10 – 15% tổng điểm của bài thi Chứng chỉ DA-100. Khi ôn thi PL-300, Analyze the data giúp chúng ta tìm kiếm được những insight, điểm nhấn từ dữ liệu, từ rất nhiều bảng biểu đã tạo trước đó. Đây cũng là phần tạo ra sự khác biệt giữa chúng ta so với những người dùng Power BI khác. Có 2 nội dung chính: Enhance reports to expose insights và Perform advanced analysis.
2 nội dung chính của Analyze the Data
- Enhance reports to expose insights
Các câu hỏi có thể liên quan đến conditional formatting, áp dụng slicer, filters, Top N, Q&A visual, …
- Perform advanced analysis
Các câu hỏi có thể liên quan đến cách xác định outliers, time series analysis, sử dụng groupings và binnings, Key Influencers to explore dimensional variances, decomposition tree visual, Al insights.
Topic 5: Deploy and Maintain Deliverables – Triển khai và duy trì các sản phẩm đã giao
Topic cuối cùng mà bạn cần lưu ý trong khi ôn thi PL-300 là Deploy and Maintain Deliverables. Các câu hỏi liên quan đến giai đoạn sau khi hoàn thiện dashboard chiếm khoảng 10 – 15% tổng điểm của bài thi. Có thể chia topic này thành 2 phần nội dung chính: Manage datasets và Create and manage workspaces.
2 Nội dung chính của Deloy and Maintain Deliverables
- Manage datasets
Chúng ta ôn tập các kiến thức liên quan đến quản lý dataset. Một số kiến thức chính như: Cách thiết lập lịch trình resfresh cho dashboard trên service. Cách cấu hình row-level security trong trường hợp chúng ta muốn phân quyền dữ liệu/báo cáo hiển thị cho từng nhóm user khác nhau. Các thiết lập tùy chọn incremental refresh giúp quá trình refresh nhanh hơn…
- Create and manage workspaces
Một số kiến thức cần ôn tập liên quan đến phần tạo và quản lý workspaces trên Power BI service như: cách tạo và cấu hình một workspace, assign workspace roles, cách cấu hình và cập nhật một workspace app, …
Trên đây là các topics và nội dung cụ thể để giúp bạn có thể ôn thi PL-300 mà Datapot cung cấp. Để có thể tìm hiểu kỹ về các kiến thức cũng như ứng dụng Power BI vàp phân tích và làm báo cáo trực quan, bạn có thể tham khảo thêm khóa học PL-300: MICROSOFT POWER BI DATA ANALYST của Datapot.
- Tham gia group ôn thi PL-300 tại: https://www.facebook.com/groups/da100vn
- Chuỗi Video Hướng dẫn thực hành Lab và sử dụng các tài nguyên của Microsoft: https://www.youtube.com/c/Datapotvn/videos
- Update tài nguyên từ Microsoft, PL-300 exam questions và exam topics tại Fanpage của Datapot: https://www.facebook.com/DatapotAnalytics/
- Chi tiết tham khảo: https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4qlRu
https://ravikirans.com/da-100-power-platform-exam-study-guide/