Power BI: Hãy chọn Chart đúng (Phần 2)

Power BI: Hãy chọn Chart đúng (Phần 2)

Ngày đăng: 14/11/2023

Chúng ta đã nói nhiều đến nhiệm vụ quan trọng của một Data Analyst, đó là dựa vào Data để tìm ra được những Insight quan trọng cho doanh nghiệp. Vậy có một câu hỏi cần đặt ra ở đây là, các insight đó nên được truyền tải đến người nghe (Manager, CEO, nhân viên trong công ty…) như thế nào để mang lại hiệu quả cao nhất? Chúng ta chỉ cần đưa số liệu thôi hay nên vẽ ra những biểu đồ minh họa? Nếu dùng biểu đồ thì nên dùng loại biểu đồ gì cho những trường hợp nào? Tất cả những câu hỏi trên sẽ được làm rõ trong bài viết này. 

Nên biểu diễn thông tin theo dạng bảng số liệu hay biểu đồ? 

Chúng ta cùng nhìn vào một ví dụ đơn giản dưới đây để hiểu được sự khác nhau giữa 2 cách biểu diễn thông tin cho người xem. 

Ví dụ: 

Ta có thông tin về dòng tiền vào/ra (Net cashflow) của một doanh nghiệp. Mục tiêu của chúng ta là cho người quản lý thấy được mức độ thay đổi của Net cashflow và các thời điểm dòng tiền bị âm. Thông tin này được biểu diễn theo 2 cách:  

  • Cách 1 chúng ta dùng dạng bảng thông tin để biểu diễn. 
  • Cách 2 chúng ta dùng biểu đồ column kết hợp với conditional formatting để biểu diễn. 
Choose right chart

Theo bạn thì cách nào người xem sẽ dễ nắm bắt được thông tin cần truyền tải? 

Rõ ràng trong trường hợp này nhìn vào cách biểu diễn thứ 2 (Dạng biểu đồ) sẽ dễ dàng nhận ra được các thông tin về dòng tiền vào/ra hơn.  

Có thể nói, trong phần lớn trường hợp, việc truyền đạt thông tin qua biểu đồ sẽ dễ dàng truyền tải được thông tin từ data hơn so với dạng bảng biểu số liệu thông thường. 

Làm thế nào để lựa chọn được dạng chart phù hợp? 

Tùy vào các trường hợp khác nhau cũng như mục đích, nhu cầu truyền tải thông tin mà chúng ta sẽ lựa chọn dạng biểu đồ phù hợp. Để cho dễ dàng lựa chọn, mình sẽ chia thành 2 cách lựa chọn biểu đồ phổ biến: 

  • Lựa chọn biểu đồ dựa vào mục đích của thông tin. 
  • Lựa chọn biểu đồ dựa vào loại dữ liệu. 

Lựa chọn biểu đồ dựa vào mục đích của thông tin 

Chọn chart (biểu đồ) đúng

Có bốn dạng thông tin chính hay dùng trong doanh nghiệp đó là: 

  • Thông tin so sánh (So sánh doanh thu qua từng kỳ, so sánh giữa các nhóm sản phẩm…) 
  • Thông tin về tỷ trọng (Tỷ trọng đóng góp doanh thu của các team, tỷ trọng khối lượng giao dịch của các mã cổ phiếu…) 
  • Thông tin về mối quan hệ giữa các biến (Mối quan hệ giữa doanh thu và chi phí trong doanh nghiệp…) 
  • Thông tin về phân bố các giá trị (Mức độ phân bố độ tuổi của khách hàng…) 

1. Thông tin so sánh:  

Thông thường, doanh nghiệp thường có nhu cầu so sánh là nhiều hơn cả. Vì vậy thông tin dạng so sánh sẽ xuất hiện nhiều hơn so với các dạng thông tin còn lại. Với thông tin dạng này chúng ta có 2 dạng chart rất phổ biến đó là Coulmn ChartLine Chart. 

  • Coulmn Chart sẽ giúp chúng ta thể hiện được sự khác nhau giữa các nhóm đối tượng với cùng 1 chỉ số cụ thể. 

Ví dụ: 

So sánh sự khác nhau về doanh số giữa các quốc gia. 

Coulmn Chart

So sánh sự khác nhau về doanh số giữa các quốc gia và các nhóm sản phẩm trong quốc gia đó. Ở đây sẽ là dạng nâng cao của biểu đồ Column Chart, được gọi là Stack Coulmn Chart. 

  • Line Chart sẽ giúp chúng ta thể hiện được sự khác nhau qua thời gian. 

Ví dụ: 

So sánh doanh số qua các tháng 

Line Chart

2. Thông tin về tỷ trọng: 

Thông tin về tỷ trọng cũng là loại thông tin hay được dùng. Doanh nghiệp sẽ muốn biết được là các nhóm đối tượng khác nhau có đóng góp như nào vào chỉ số chung của doanh nghiệp. Thông tin về tỷ trọng sẽ chỉ có thể dùng được với các metric additive measures (Mình sẽ đề cập sâu hơn về các loại metric trong phần lưu ý). 

Dạng biểu đồ phổ biến cho thông tin về tỷ trọng đó là Pie Chart và Tree map. Với các trường hợp có ít nhóm đối tượng (<=5 nhóm) thì chúng ta có thể sử dụng Pie Chart. Còn đối với các tình huống có nhiều nhóm đối tượng, việc sử dụng Pie Chart sẽ khó để nhìn thấy sự khác biệt giữa các nhóm, lúc này chúng ta nên sử dụng biểu đồ Tree map. 

Ví dụ: 

Các quốc gia có % tỷ trọng doanh thu như nào trên tổng doanh thu của toàn doanh nghiệp? (Pie Chart)

Pie Chart

Chi phí của các sản phẩm có tỷ trọng như nào trên tổng chi phí? (Tree map) 

Tree map chart

3. Thông tin về mối quan hệ giữa các biến: 

Thông tin dạng này thường thể hiện mối tương quan giữa 2 hay nhiều chỉ số của trong doanh nghiệp. Ví dụ chúng ta muốn xem xem là trong tất cả các sản phẩm, có phải đơn hàng càng nhiều thì càng mang lại nhiều doanh thu không?…Với dạng thông tin này, Scatter Chart là dạng biểu đồ hay được sử dụng. 

Ví dụ: 

Mối tương quan tuổi thọ và GDP bình quân đầu người của các quốc gia. 

Scatter Chart

4. Thông tin về phân bố các giá trị: 

Đây là thông tin giúp doanh nghiệp biết được rằng, dựa vào một chỉ số cụ thể thì các nhóm khác nhau có có lượng khác nhau như thế nào. Ví dụ số lượng khách hàng theo độ tuổi (Chỉ số ở đây là độ tuổi), số lượng các sản phẩm theo số đơn hàng bán được trong tháng (Chỉ số là số đơn hàng)… 

Biểu đồ điển hình cho dạng thông tin này là Histogram. 

Ví dụ: 

Số lượng khách hàng theo độ tuổi 

Histogram

Lựa chọn biểu đồ dựa vào loại dữ liệu. 

Ngoài việc lựa chọn Visual theo mục đích của thông tin, lựa chọn biểu đồ dựa vào loại dữ liệu của là một cách lựa chọn phổ biến. Chúng ta có 2 loại biến là continuous (Biến liên tục) và categorical (Biến phân loại). 

Continuous (Biến liên tục) là là một biến số có thể nhận bất kỳ giá trị nào trong một khoảng giá trị nhất định hoặc trên một tập hợp vô hạn các giá trị. Điển hình của biến liên tục là các biến như độ tuổi, chiều cao, cân nặng, thời gian…. Categorical (Biến phân loại) chỉ đơn giản là loại biến để phân loại giữa các nhóm như sản phẩm, quốc gia, team, nhân viên… 

Việc thể hiện thông tin với các sự kết hợp của các biến liên tục và phân loại sẽ có sự khác nhau nhất định. 

1. Một biến liên tục và một biến phân loại: 

Với trường hợp này, thông tin có thể có nhiều dạng: 

1.1. Thông tin về phân bố các giá trị:  

Phân bổ độ tuổi của khách hàng (Biến liên tục) của khách hàng Nam và Nữ (Biến phân loại): Dùng Histogram. 

Dùng Histogram

1.2. Thông tin dạng so sánh:  

Xu hướng doanh thu của các nhóm sản phẩm (Biến phân loại) theo ngày (Biến liên tục): Dùng biểu đồ Line Chart. 

Dùng biểu đồ Line Chart

2. Hai biến phân loại: 

2.1. Thông tin dạng so sánh:  

Xem xem giữa các quốc gia (Biến phân loại 1) và giới tính (Biến phân loại 2) thì doanh thu có sự khác nhau như nào. 

3. Hai biến liên tục: 

Trường hợp mà có sự xuất hiện của 2 biến liên tục thường là sẽ xem xét sự tương quan giữa 2 biến đó trong bộ data của chúng ta (Thông tin dạng mối quan hệ giữa các biến). 

Ví dụ: 

Chiều cao (Biến liên tục 1) và cân nặng (Biến liên tục 2) của người có sự tương quan với nhau như nào? 

4. Hai biến liên tục và một biến phân loại: 

Trường hợp này cũng giống trường hợp trên, nhưng chúng ta có sự so sánh giữa các nhóm khác nhau (Giữa nam với nữ, giữa các sản phẩm, giữa các quốc gia…) 

Ví dụ: 

Chiều cao (Biến liên tục 1) và cân nặng (Biến liên tục 2) giữa 2 nhóm nam và nữ (Biến phân loại) có sự tương quan như nào. 

Một số lưu ý: 

– Trong các biểu đồ có trục x-axis thể hiện giá trị của metric (Doanh thu, số đơn hàng…), giá trị gốc tọa độ của trục luôn phải xuất phát từ 0. Nếu giá trị gốc tọa độ khác 0, biểu đồ sẽ phóng đại sự tăng giảm của chỉ số, dẫn đến các nhận định thiếu khách quan. 

Ví dụ: 

Biểu đồ thể hiện profit margin qua từng tháng: 

Biểu đồ thể hiện profit margin qua từng tháng

Dễ dàng nhận thấy rằng, nếu biểu đồ bên trái không xuất phát từ 0 nên ta có cảm giác rằng profit margin tăng rất mạnh. Nhưng thực tế là, profit margin chỉ dao động +/- khoảng 2%. 

– Cần hiểu rõ bản chất của metric để thể hiện thông tin cho đúng. 

Các metric có thể chia ra làm 3 loại đó là: Additive measure, Non- Additive measure, Semi- Additive measure (Đọc thêm về các loại metric tại https://datapot.vn/data-model-phan-biet-measure-trong-bang-facts/).

Trong các loại metric, ta cần đặc biệt lưu ý đến Non- Additive measure. Đối với metric này, các loại chart thể hiện tỷ trọng của 1 metric (Ví dụ Pie Chart, Tree Map) sẽ không có ý nghĩa. Ví dụ:  

Ta không thể xem xét Profit margin của từng quốc gia chiếm bao nhiều phần trăm trên Profit margin của toàn công ty. 

– Đối với các biến categorical, ta có thể sắp xếp theo chiều tăng dần hoặc giảm dần theo một chỉ số nào đó. 

Ví dụ: 

Chart thể hiện doanh số theo các nhóm quốc gia thì có thể sắp xếp theo các quốc gia có doanh thu cao nhất => các quốc gia có doanh thu thấp nhất. 

– Đối với các biến continuous, ta phải sắp xếp theo thứ tự từ bé đến lớn. 

Ví dụ: 

Doanh số theo thời gian thì phải sắp xếp theo thứ tự từ ngày xa nhất tới ngày gần hiện tại nhất. 

Qua bài viết này, hy vọng bạn đã nắm được một số các nguyên tắc cơ bản khi lựa chọn chart để thể hiện thông tin.

Xem lại Phần 1: Hãy chọn Chart đúng

Bạn có thể đọc thêm về một số dạng chart nâng cao hơn dưới đây: 

Sankey Chart: Sơ đồ luồng trong Power BI 

Phân tích dữ liệu trên Power BI với biểu đồ AI (Trí tuệ nhân tạo) 

Livestream ứng dụng các loại biểu đồ & Trình bày báo cáo hiệu quả 

Để trở thành một nhà phân tích dữ liệu hay một nhà quản lý với kỹ năng tạo lập báo cáo trên Power BI thành thạo, hãy tham gia khóa học Analyzing Data with Power BI tại Datapot bạn nhé. 

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *