Sankey Chart là gì?
Sankey Chart hay Sơ đồ luồng là một biểu đồ hình vẽ được sử dụng để mô tả các luồng chuyển dịch từ một tệp giá trị (Source) đến các tệp giá trị khác (Destination). Chiều rộng của luồng được tỷ lệ theo một số lượng tính xác định (weight).

Cái tên “Sankey chart” được đặt theo tên của Đại úy Sankey, người đã tạo ra một biểu đồ về hiệu suất sử dụng động cơ hơi nước và sử dụng các mũi tên có chiều rộng tỷ lệ với sự hao nhiệt.
Ứng dụng của Sankey Chart
Với việc sử dung Sankey chart, chúng ta có thể dễ dàng giúp người đọc nắm bắt được dòng chảy từ các nguồn (source), điểm đến (desination) và các bước trung gian trong quá trình di chuyển và xem cách mọi thứ chảy qua chúng chỉ với một cái nhìn ngắn gọn.
Sơ đồ Sankey thường được sử dụng rộng rãi trong ngành năng lượng, nhưng cũng có những ứng dụng thú vị trong tất cả các ngành công nghiệp khác. Nó giúp bạn có thể hình dung thông tin có một điểm khởi đầu và một điểm kết thúc hoặc mối quan hệ động với nhiều yếu tố trung gian, ví dụ như cách người dùng truy cập và di chuyển trong một trang web (Customer Journey), hoặc quá trình vận hành vật liệu trong một đơn vị sản xuất, kiểm soát hoặc chuyển tiền trong quy trình kinh doanh, hoặc phân tích báo cáo kết quả kinh doanh (Income Statement)…
Cách lấy ra Sankey Chart
Do Sankey Chart không phải là một visual mặc định ở trong Power BI, nên trong trường hợp chúng ta muốn sử dụng, chúng ta sẽ phải vào phần Visualizations \ Get more visuals.

Sau khi bấm vào, chúng ta sẽ nhận được một bảng thông tin Power BI visuals với hàng loạt các visuals được cung cấp. Chúng ta có thể lướt từ đầu tới cuối để tìm Sankey chart. Tuy nhiên để tránh mất thời gian phải đi tìm, chúng ta search Sankey chart ở trong ô tìm kiếm (Lưu ý chúng ta sẽ dùng bản Sankey chart do Microsoft cung cấp)

Sau khi bấm vào hình Sankey chart, một cửa sổ hiển thị thông tin cơ bản về Sankey chart được hiển thị như bảng dưới.
Lưu ý: Các bạn có thể đọc phần Overview, Ratings + Reviews và download sample để hiểu thêm nhé
Chúng ta sẽ bấm Add để bổ sung Sankey chart vào Power BI của chúng ta.

Sau khi Add vào thì biểu tượng Sankey chart sẽ hiển thị ở trong góc cuối của màn hình Visualization.
Ở đây, chúng ta sẽ sử dụng bản Sankey chart (lastest version 3.0.8)

Ví dụ minh họa cơ bản
Chúng ta có model gồm 3 table là Product, Country và Sales với model được mô tả như bên dưới.

Bài toán: Mô tả luồng phân tích từ Category và Country theo giá trị Total Sales.
Áp dụng Sankey chart, trong đó lựa chọn Source là Category và Destination là Country – với Weight là Total Sales.


Visual trên là trường hợp điển hình của việc sử dụng Sankey Chart. Từ hình ảnh chúng ta, hoàn toàn có thể thấy là Category Bikes chiếm tỷ trọng nhiều nhất của Totals Sales và bán gần như đều ở phần lớn các nước. Sau đó là Componets, Clothing và Accessories.
Tiếp theo, trong trường hợp muốn thể hiện luồng dịch chuyển nhiều hơn 2 tệp giá trị là Category và Country, chúng ta hoàn toàn có thể xây dựng dòng chuyển tiếp qua 3, 4, 5 tệp giá trị thông qua DAX.
Do trên Visual Sankey chart, bạn không thể bỏ 2 cột hay 2 trường dữ liệu vào mục Source hay mục Desination, chúng ta cần phải tiến hành biến đổi linh hoạt bằng cách tạo ra một new table thông qua một hàm DAX là UNION.
Ở đây chúng ta sẽ bổ sung thêm vào Sankey Chart luồng di chuyển thông qua cột Color. Lúc đó giá trị Total Sales sẽ chuyển dịch qua 3 tệp là Category, Color vs SubCategory.
Bảng Sankey mới tạo sẽ có nội dung như sau:

Các bạn có thể thấy, chúng ta vẫn chỉ tạo ra 2 cột là Source và Destination nhưng việc bổ sung các giá trị vào từng trường linh hoạt sẽ giúp chúng ta thể hiện được từng bước dịch chuyển một cách hợp lý.
Và kết quả visual sẽ được thể hiển ở đây:

Ví dụ minh họa mô tả hành vi mua sắm của khách hàng (Customer Journey)
Bài toán: Sử dụng Sankey chart để mô tả Customer Journey khi tham quan một website của công ty.
Biết rằng, hành vi mua sắm của khách hàng sẽ được thực hiện theo 7 bước với tổng cộng 14 hành vi có thể như sau:
Level 0:
- Landing From(0)
Level 1:
- External Ad/Link(1)
- Direct Search(2)
- Organic Search (3)
Level 2:
- Mobile App(4)
- Official Website(5)
Level 3:
- View product & details(6)
- Read Reviews (7)
- Click on another product (8)
Level 4
- Add to Cart (9)
Level 5
- Checkout(10)
- Clear Cart(11)
Level 6
- Purchase (12)
- Give Reviews/Ratings (13)
- Exit (14)
Bài giải: Để cơ cấu lại hành vi tiêu dùng của khách hàng và thể hiện trên Sankey Chart, chúng ta cần cơ cấu lại thông tin ở trong bảng theo 2 cột là Source vs Destination theo từng mức độ level và các bước như bảng dưới đây.
Việc cơ cấu như dưới giúp cho Power BI hiểu được dòng chảy của dữ liệu thông qua từng bước.
Level | Source | Destination |
Level 1 | Customer Journey start from | External Ad/Link(1) |
Customer Journey start from | Direct Search(2) | |
Customer Journey start from | Organic Search (3) | |
Level 2 | External Ad/Link(1) | Mobile App(4) |
External Ad/Link(1) | Official Website(5) | |
Direct Search(2) | Mobile App(4) | |
Direct Search(2) | Official Website(5) | |
Organic Search (3) | Mobile App(4) | |
Organic Search (3) | Official Website(5) | |
Level 3 | Mobile App(4) | View product & details(6) |
Mobile App(4) | Exit(14) | |
Official Website(5) | View product & details(6) | |
Official Website(5) | Exit(14) | |
Level 4 | View product & details(6) | Read Reviews (7) |
View product & details(6) | Add to Cart (9) | |
View product & details(6) | Click on another product (8) | |
View product & details(6) | Give Reviews/Ratings(13) | |
View product & details(6) | Exit(14) | |
Read Reviews (7) | Add to Cart (9) | |
Read Reviews (7) | Click on another product (8) | |
Read Reviews (7) | Exit(14) | |
Level 5 | Add to Cart (9) | Clear Cart(11) |
Add to Cart (9) | Checkout(10) | |
Add to Cart (9) | Click on another product (8) | |
Add to Cart (9) | Exit(14) | |
Level 6 | Checkout(10) | Purchase(12) |
Checkout(10) | Exit(14) | |
Clear Cart(11) | Exit(14) |
Kết quả, sau khi sử dụng Sankey chart, dữ liệu hành vi tiêu dùng của khách hàng đã được thể hiện như sau:

Đến đây, hành trình mua sắm của khách hàng đã hoàn toàn trực quan để chúng ta đưa ra quyết định. Với mỗi hành vi chúng ta có thể sử dụng thời gian dừng lại để ước lượng giá trị hoặc các chỉ số % KPI hoàn thành để đưa ra quyết định phù hợp với mục đích của doanh nghiệp.
Ví dụ minh họa Báo cáo kết quả kinh doanh của doanh nghiệp
Sử dụng Sankey chart để mô tả báo cáo kết quả kinh doanh của Doanh nghiệp X với báo cáo KQKD đơn giản được sử dụng như sau:
Hạng mục | Kết quả | Value (USD) |
Tổng doanh thu | Giá vốn hàng bán | 60,609 |
Tổng doanh thu | Doanh thu thuần | 20,853 |
Doanh thu thuần | Chi phí hoạt động và KD | 7,021 |
Doanh thu thuần | Lợi nhuận gộp | 13,832 |
Chi phí hoạt động và KD | Chi phí bán hàng | 3,946 |
Chi phí hoạt động và KD | Chi phí quản lý doanh nghiệp | 2,000 |
Chi phí hoạt động và KD | Chi phí tài chính | 1,075 |
Lợi nhuận gộp | Lợi nhuận trước thuế | 13,719 |
Lợi nhuận gộp | Các khoản chi phí khác | (219) |
Lợi nhuận trước thuế | Lợi nhuận thuần | 12,853 |
Lợi nhuận trước thuế | Chi phí thuế | 1,132 |
Lợi nhuận trước thuế | Các khoản hoàn thuế | (4) |
Do trên bảng, chúng ta thấy các hạng mục, kết quả và giá trị đã sắp xếp thành 3 cột riêng biệt giống như yêu cầu của Sankey Chart, nên chúng ta chỉ đơn giản cho vào đúng các mục của Sankey:


Việc thể hiện Báo cáo KQKD bằng Sankey Chart giúp cho người đọc có thể nắm bắt toàn bộ dòng chảy của tiền chuyển dịch từ Tổng doanh thu tới cái đích đến cuối cùng là Lợi nhuận thuần và giá trị đã được thay đổi từ 81,462 USD à 12,853 USD.
Kết luận
Trong thực tế, sơ đồ Sankey được sử dụng rộng rãi trong việc phân tích Power BI, đặc biệt là ở các ngành liên quan tới tài chính hoặc kinh doanh. Tùy vào góc nhìn và cách phân tích, chúng ta có thể cơ cấu các luồng trong Sankey chart để giúp người sử dụng có thể nắm bắt được dòng chảy chuyển từ bước này sang bước khác.
Hy vọng bài viết trên đã giúp bạn hiểu thêm về Sankey Chart. Bạn hãy đón đọc các bài viết khác của Datapot ở đây nhé.