Phân tích dữ liệu (Data Analytics) là một quá trình bao gồm: xác định, làm sạch, biến đổi & mô hình hóa, trực quan hóa dữ liệu để khám phá ra những thông tin ý nghĩa và hữu ích. Những thông tin này được thể hiện qua những báo cáo phân tích, từ đó hỗ trợ cho quá trình ra quyết định.
Hoạt động phân tích dữ liệu có thể phân loại như sau
- Descriptive (Mô tả)
- Diagnostic
- Predictive (Dự đoán)
- Prescriptive
- Cognitive
Mục lục
Descriptive analytics
Descriptive analytics (Phân tích mô tả) giúp trả lời các câu hỏi về điều gì đã xảy ra dựa trên các dữ liệu quá khứ. Các kỹ thuật phân tích mô tả sẽ tổng hợp lượng dữ liệu lớn và từ đó đưa ra kết quả.
Với việc phát triển các chỉ tiêu đo lường hiệu quả (KPI), việc theo theo dõi thành công hay thất bại của các mục tiêu sẽ trở nên dễ dàng hơn. Chỉ tiêu như ROI (return on investment) được sử dụng trong rất nhiều lĩnh vực. Và ở mỗi lĩnh vực, lại có những chỉ tiêu chuyên môn riêng được phát triển để đo lường hiệu quả.
Một ví dụ của phân tích mô tả là chính là các báo cáo theo dõi kết quả hoạt động bán hàng hoặc tình hình tài chính của doanh nghiệp.
Diagnostic analytics
Phân tích chuẩn đoán giúp trả lời câu hỏi tại sao tình trạng này lại diễn ra. Phân tích chuẩn đoán bao gồm các phân tích mô tả cơ bản, sử dụng những kết quả của phân tích mô tả để từ đó tìm ra nguyên nhân của các sự kiện. Từ đó, những chỉ số đo lường hiệu quả được phân tích kỹ hơn. Quá trình này thường bao gồm 3 bước:
- Tìm ra những điểm bất thường trong dữ liệu. Những điểm này thường là một biến đổi không lường trước được ở một chỉ số hoặc một thị trường nào đó.
- Thu thập các dữ liệu liên quan đến những điểm bất thường này.
- Sử dụng các kỹ thuật thống kê để tìm ra mối quan hệ và xu hướng giúp giải thích những điểm bất thường này.
Predictive analytics
Phân tích dự đoán giúp trả lời các câu hỏi về điều gì sẽ xảy ra trong tương lai. Phân tích dự đoán sử dụng các dữ liệu quá khứ để xác định các xu hướng cũng như khả năng xảy ra của xu hướng đó. Những công cụ phân tích dự đoán cung cấp những thông tin giá trị về tình hình tương lai. Các kỹ thuật phân tích dự đoán đa dạng bao gồm cả các kỹ thuật thống kê lẫn học máy (machine learning) như neural networks, decision trees và hồi quy (regression).
Prescriptive analytics
Phân tích đề xuất giúp trả lời các câu hỏi về hành động nào nên được thực hiện để đặt được một mục tiêu nhất định. Bằng cách sử dụng các kết quả từ phân tích đề xuất, các tổ chức có thể ra quyết định dựa trên dữ liệu. Phương pháp này giúp các tổ chức đưa ra các quyết định trong các hoàn cảnh không chắc chắn. Phân tích đề xuất dựa trên học máy (machine learning) để tìm ra các pattern trong các dataset lớn. Bằng cách phân tích các quyết định & sự kiện trong quá khứ, các tổ chức có thể ước lượng xác suất xảy ra của các kết quả.
Cognitive analytics
Cognitive analytics diễn giải từ các dữ liệu và các pattern đã có, đưa ra các kết luận dựa trên kiến thức hiện tại, sau đó lại thêm những kết quả này vào vốn kiến thức hiện tại để tiếp tục đưa ra các diễn giải về tương lai, tạo ra một vòng lặp tự học hỏi. Cognitive analytics giúp bạn tìm hiểu điều gì sẽ xảy ra nếu tình hình thay đổi và quyết định bạn nên giải quyết các tình huống đó như thế nào.
Các diễn giải không phải là những truy vấn có cấu trúc trên những dữ liệu quy chuẩn, thay vào đó, là những dự đoán không có cấu trúc được thu thập từ nhiều nguồn với độ tin cậy thay đổi. Cognitive analytics hiệu quả phụ thuộc vào các thuật toán học máy, và sẽ sử dụng các concept về xử lý ngôn ngữ tự nhiên để phân tích các nguồn dữ liệu chưa được dùng tới, ví dụ như nhật ký cuộc gọi bán hàng hay review sản phẩm.
Các nội dung trên được Microsoft cung cấp cho các ứng viên tham gia thi chứng chỉ Data Analyst Associate. Đây là chứng chỉ role-based của Microsoft, nhằm đánh giá các kỹ năng của Data Analyst, ứng dụng công cụ BI là Power BI.
Theo dõi các bài viết tiếp theo, trao đổi kinh nghiệm & tài liệu luyện chi chứng chỉ của Microsoft cho Data Analyst tại group Microsoft Certified: Data Analyst Associate Việt Nam (DA-100).