Power BI Day 3: Data-driven decision making: Ra quyết định dựa trên dữ liệu

Ngày đăng: 12/02/2022

Hiện nay, thật không quá ngạc nhiên khi thấy hầu hết các ngành công nghiệp cho dù là marketing, sản xuất, y học hay khoa học, … đang đưa ra quyết định dựa trên dữ liệu. Data-driven decision making – ra quyết định dựa trên dữ liệu là dựa vào những con số, bảng số liệu. Thay vì ra quyết định như cách thông thường là qua quan sát, trực giác hay cảm tính.

Vậy bằng cách nào và làm sao để sử dụng được dữ liệu trong thực tế?

Mình đọc khá nhiều những bài viết, blog cũng như các trang tham khảo khác nhau về quy trình thu thập và xử lý data, mỗi người có một quy trình khác nhau và có những ưu nhược điểm thú vị để mình học hỏi. Nhưng nhìn chung, mình thấy những quy trình đó đều có một mẫu số chung.

Phần đầu tiên và quan trọng nhất có lẽ là Identify Business Problem – nhận diện vấn đề doanh nghiệp. Đó là bước tiền đề để bạn thực hiện các phân tích sau này. Cũng như đói phải ăn, yêu phải nói, chưa biết vấn đề là gì, hãy hỏi stakeholder của bạn.

việt hoá

Kế đến, sau khi xác định nhu cầu doanh nghiệp, bạn đã có một ý tưởng rõ ràng bạn cần đo đạc những con số nào, bạn sẽ khoanh vùng nguồn dữ liệu đó lấy từ đâu và từ ai – Identify Data Source và lấy những dữ liệu cần – Select the Data

Tiếp theo là bước làm sạch dữ liệu – Clean the Data, nghe giang hồ đồn 80% thời gian các Data Analyst là dành cho bước này – sợ toát mồ hôi hột luôn! Sở dĩ tốn kém thời gian như vậy bởi dữ liệu trong thực tế luôn bị thiếu, sai định dạng rất nhiều!

Biến đổi dữ liệu – Transform the Data là bước dựa trên những dữ liệu đã được làm sạch để tạo ra dữ liệu mới, nôm na là tạo ra cột mới – đó chính là những dữ liệu phái sinh.

Tại bước phân tích dữ liệu – Analyze the Data, bài toán trở nên quen thuộc hơn. Nếu như các bạn có follow bài trước, mình đã nhắc đến 4 thuật ngữ gồm:

  • Descriptive Analytics – Phân tích mô tả
  • Diagnostic Analytics – Phân tích chuẩn đoán
  • Predictive Analytics – Phân tích dự đoán
  • Prescriptive Analytics – Phân tích đề xuất

Có nhiều cách phân tích tùy theo quan điểm của mỗi người, nhưng nếu là beginners thì mình thấy đây là một flow phù hợp để có thể có một nghiên cứu chi tiết.

Bước cuối cùng Interpret, Evaluate and Deploy the Model có thể coi là “level” cao nhất trong phân tích dữ liệu Prescriptive Analytics – Phân tích đề xuất, sử dụng các mô hình Machine Learning để đưa ra quyết định.

Quá trình thu thập data và xử lý chúng để đưa ra những quyết định kinh doanh là một quá trình phức tạp, đó cũng là lý do mà công việc nghiên cứu dữ liệu liên quan đến rất nhiều người và các vai trò khác nhau. Để biết họ là ai, hãy đón chờ bài post sau của mình nhé!

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *