Tổng quan môn học
Phát triển, nâng cao toàn diện toolset – skillset – mindset về Phân tích dữ liệu. Xây dựng tư duy phân tích dữ liệu nhằm chinh phục các bài toán phân tích hoạt động doanh nghiệp thông qua ứng dụng lý thuyết Pareto phân tích sản phẩm, ứng dụng cohort analysis phân tích khách hàng và sử dụng Linear Regression dự đoán doanh nghiệp.
Nội dung đào tạo
DAFP - Data Analytics Foundation Plus được thiết kế nhằm đưa ra một lộ trình chi tiết, toàn diện từ cơ bản đến nâng cao, giúp xây dựng nền tảng vững chắc về ngành Phân tích dữ liệu cho bất cứ ai muốn bước chân vào làm việc trong ngành dữ liệu.
Học viên sẽ được trang bị một bộ kỹ năng toàn diện bao gồm: Toolset – các công cụ thao tác và quản trị luồng dữ liệu, Skillset – kỹ năng bóc tách và xử lý quy trình dữ liệu và Mindset – tư duy phân tích và giải quyết các bài toán dữ liệu cụ thể.
Kết thúc khóa học, các nhân sự có thể tự tin bắt đầu làm việc trong ngành Khoa học dữ liệu tại các vai trò Associate DA/BI mà không phải đối diện với nỗi lo không đáp ứng được yêu cầu thực tế của công việc.
Lộ trình học chi tiết
- Khám phá các dịch vụ dữ liệu quan hệ trong Azure
- Khám phá việc cung cấp và triển khai các dịch vụ cơ sở dữ liệu quan hệ trên Azure
- Truy vấn dữ liệu quan hệ trong Azure
- Các Công nghệ được sử dụng trong bài thực hành:
- SQL Server trên máy ảo Azure
- Cơ sở dữ liệu Azure SQL
- Azure SQL Database Managed Instance
- PostgreSQL, MariaDB, and MySQL
- Khám phá các dịch vụ dữ liệu không quan hệ trong Azure
- Khám phá việc cung cấp và triển khai các dịch vụ dữ liệu không quan hệ trên Azure
- Quản lý kho dữ liệu không quan hệ trong Azure
- Các công nghệ được sử dụng trong bài thực hành:
- Azure Table storage
- Azure Blob storage
- Azure File storage
- Azure Cosmos DB
- Kiểm tra các thành phần của kho dữ liệu hiện đại
- Khám phá quá trình nhập dữ liệu trong Azure
- Khám phá lưu trữ và xử lý dữ liệu trong Azure
- Khám phá các tùy chọn xử lý có sẵn để xây dựng các giải pháp phân tích dữ liệu trong Azure.
- Khám phá Azure Synapse Analytics, Azure Databricks và Azure HDInsight
- Bắt đầu xây dựng với Power BI
- Các công nghệ được sử dụng trong bài thực hành:
- Azure Synapse Analytics
- Azure Data Factory
- Azure Data Lake Storage
- Azure Databricks
- Azure Analysis Services
- Azure HDInsight
- Microsoft Power BI
- Khám phá các khái niệm dữ liệu cốt lõi
- Khám phá các vai trò và trách nhiệm trong thế giới dữ liệu
- Mô tả các khái niệm về dữ liệu quan hệ và không quan hệ
- Khám phá các khái niệm về phân tích dữ liệu
Module 1: DP-900: Azure Data Fundamentals
Module 4: Python for Data
Module 5: Advanced Query with T-SQL
Module 6: Power BI Advanced Data Modeling and Visualization
Tổng quan môn học
Gồm bộ 3 khóa học tiêu chuẩn của Microsoft được giảng dạy bởi Microsoft Certified Trainer giúp làm chủ bộ 3 công cụ xử lý và phân tích dữ liệu sử dụng trong mọi doanh nghiệp: Azure – SQL – PowerBI.
Kỳ vọng đầu ra
1. Biết cách cung cấp và triển khai cơ sở dữ liệu thông qua các giải pháp dữ liệu đám mây với Microsoft Azure
2. Hiểu được các nguyên tắc cơ bản của Cơ sở dữ liệu quan hệ và cách truy vấn SQL
3. Mô hình hóa dữ liệu và và thiết kế báo cáo phục vụ cho kinh doanh với Power BI
Data Analytics Foundation
Data Analytics Advanced
Kỳ vọng đầu ra
1. Thành thạo các công thức DAX nâng cao và quy trình xây dựng mô hình dữ liệu hiệu quả.
2. Kỹ thuật xử lý, biến đổi và trực quan hóa dữ liệu nâng cao với Python – ngôn ngữ lập trình phổ biến nhất trong khoa học dữ liệu.
- Giới thiệu khóa học
- Giới thiệu SQL
- Cơ sở dữ liệu
- Schema
- Bảng
- Các loại câu lệnh và từ khóa trong SQL
- Viết các truy vấn SQL đầu tiên
- Hiểu sâu hơn về các khái niệm của Join
- Join nhiều điều kiện
- Join nhiều bảng dữ liệu,
- Self-join
- Truy vấn con vs CTEs
- Truy vấn con
- Common Table Expression (CTEs)
- Giới thiệu về SQL Join
- Inner Join
- Left Join
- Right Join
- Full Outer Join
- Giới thiệu về SQL Union
- Thực hành
- Mệnh đề truy vấn SELECT, FROM, WHERE, GROUP BY, ORDER BY
- Các kiểu dữ liệu trong SQL Server
- Các hàm trong SQL
- Hàm chuyển đổi kiểu dữ liệu
- Hàm Datetime
- Hàm String
- Aggregate functions
- Logical Statement
- ROW_NUMBER(), RANK() và PARTITION BY
- Thực hành SQL và giải quyết các bài toán thực tế
- Tóm tắt khóa học SQL, nêu bật các khái niệm và các phần thực hành quan trọng của SQL
- Trao đổi, chia sẻ với Chuyên gia Microsoft về kinh nghiệm Phân tích dữ liệu
- Q&A (Optional) – Lộ trình nghề nghiệp ngành Dữ liệu và các vị trí tiềm năng
- Các vị trí quan trọng và các lựa chọn nghề nghiệp tiềm năng trong Ngành Dữ liệu
- Nhiệm vụ của một Data Analyst
- Khám phá khả năng của Power BI và làm quen với Môi trường làm việc của Power BI
- Hiểu được toàn bộ luồng phân tích dữ liệu
- Xác định và truy xuất dữ liệu từ các nguồn dữ liệu khác nhau
- Giải quyết lỗi nhập dữ liệu
- Các nhiệm vụ thông thường của quá trình chuẩn bị dữ liệu (làm sạch, định hình lại dữ liệu, v.v.)
- Làm sạch dữ liệu trong Power BI bằng Power Query Editor
- Data Profiling và khám phá Metadata của tập dữ liệu
- Hiểu các khái niệm cơ bản về dimensional model
- Tạo model relationships làm việc với các bảng trong Power BI
- Triển khai dimensions và hierarchies cho mô hình của bạn
- Tóm tắt các khái niệm quan trọng đã học trong 6 ngày trước đó
- Tối ưu hóa hiệu suất mô hình
- Bài kiểm tra giữa khóa
- Hiểu các khái niệm cơ bản về DAX
- Sử dụng các mẫu DAX cơ bản để tính toán các biện pháp kinh doanh
- Thực hành các mẫu DAX phức tạp theo từng trường hợp sử dụng trong kinh doanh
- Giới thiệu các khái niệm và nguyên tắc cơ bản của trong việc thiết kế và xây dựng một báo cáo
- Nâng cao khả năng truy cập và khả năng sử dụng của báo cáo bằng cách sử dụng tính năng trực quan hóa của Power BI
- Giới thiệu các khái niệm và thực hành EDA (Exploratory Data Analysis) trong Power BI
- Sử dụng Power BI AI visualization để thực hiện các phân tích nâng cao
- Giới thiệu các tính năng của Power BI service
- Tạo và cấu hình dashboard dựa trên các trường hợp sử dụng trong kinh doanh khác nhau
- Tổ chức không gian làm việc (workspace) của Power BI service
- Giới thiệu các khái niệm cơ bản về quản trị dữ liệu
- Tìm hiểu cách cấu hình và quản lý tập dữ liệu trong Power BI Service
- Triển khai và định cấu hình bảo mật trong Power BI để đảm bảo an toàn cho tài sản của bạn
- Tóm tắt khóa học PL-300, nêu bật các khái niệm và các phần thực hành quan trọng của Power BI
- Trao đổi, chia sẻ với Chuyên gia Microsoft về kinh nghiệm Phân tích dữ liệu và lời khuyên khi làm bài thi PL-300
- Q&A (Optional) – Lộ trình nghề nghiệp ngành Dữ liệu và các vị trí tiềm năng
- Giới thiệu khoá học
- Cài đặt phần mềm
- Giới thiệu Python
- Các cú pháp và khái niệm cơ bản
- Quy tắc và quy ước đặt tên
- Xử lý liệu nhị nguyên với kiểu bool
- Kiểu NoneType và use cases
- Xử lý dữ liệu số với kiểu int và float
- Nhận user input và ép kiểu
- Giới thiệu kiểu collections
- Xử lý dữ liệu chuỗi với list và tuple
- Tạo nhanh sequeces với range
- Xử lý dữ liệu text với string
- Xử lý dữ liệu key-value với dictionary
- Giới thiệu kiểu dữ liệu set và use cases
- Rẽ nhánh ra quyết định với câu lệnh if
- Lặp khối lệnh với vòng lặp for
- Điều khiển vòng lặp với reak và continue
- Viết và sử dụng hàm
- Giới thiệu Pandas data frames
- Làm việc với cột dạng số, text, và ngày tháng
- Thêm, xoá, update giá trị, ép kiểu, và đổi tên cột
- Làm việc với unique values, missing values
- Lọc và sắp xếp các dòng theo điều kiện
- Giới thiệu về data aggregation và các aggregate operations
- Combine data từ nhiều nguồn
- Đọc và xuất data ra các định dạng khác nhau
- Giới thiệu Numpy arrays và Pandas series
- Dùng các thao tác element-wise để tính toán và lọc dữ liệu
- Biểu diễn và làm việc với missing data
- Các bước để vẽ đồ thị trong Python
- Phân loại và vẽ các loại đồ thị tương ứng với từng loại data: bar plot, pie plot, hisgram, KDE, boxplot, dodged/stacked bar plot, scatter plot, regression plot
- Phân tích dữ liệu khai phá (EDA) và rút trích ra các đặc trưng hữu ích
- Dùng machine learning để xây dựng mô hình dự đoán
- Đánh giá performance và so sánh các mô hình
- Q&A
- Review basic SQL queries
- Window Functions
- Subquery vs CTE vs Temp Table
- Text Function, Json Function
- Case study: Cohort Analysis
- Case study: RFM segmentation
- Case study: A/B testing
- Query performance tuning
- ER diagram
- Database Design
- Stored Procedure
- Flow control
- Building and Optimizing Trigger
- Quy trình làm việc với Power BI
- Cấu trúc dữ liệu và các kỹ thuật trong mô hình hoá dữ liệu
- Quy trình xây dựng mô hình dữ liệu trong phân tích bài toán kinh doanh
- Case study: Xây dựng mô hình dữ liệu
- Thiết kế mô hình dữ liệu cho doanh nghiệp bán lẻ
- Xây dựng báo cáo phân tích hiệu quả kinh doanh
- Vận dụng các kỹ thuật mô hình hóa dữ liệu với bảng Dim và Fact
- Các kỹ thuật biến đổi dữ liệu. (Data transformation)
- DAX Foundation: Scalar, Interator Functions
- Calculate and Filter functions
- Ứng dụng các hàm time intelligent: DATEADD, DATESBETWEEN, PREVIOUS ver (PREVIOUSDAY, PREVIOUS MONTH ..), DATEDIFF
- Caculation groups và ứng dụng
- Row context and Filter context
- Logical functions
- Context modification functions
- Một số kỹ thuật visualization nâng cao
- Biến và các phép biến đổi dữ liệu nâng cao.
- Vận dụng các information functions CONTAINS, HASONEVALUE, ISBLANK
- Sử dụng các celationship function RELATED, USERELATIONSHIP
- Hiểu rõ hơn về table manipulation functions ADDCOLUMNS, DATATABLE, DISTINCT, EXCEPT, GROUPBY, INTERSECT
- Vận dụng các kỹ thuật trình diễn dữ liệu nâng cao.
- Vận dụng các text functions CONCATENATE, COMBINEVALUES,REPLACE,VALUE
- Các kỹ thuật sử dụng trong Cohort analysis
Data Analytics Preparation
Tổng quan môn học
Trong học phần này, học viên được trang bị hành trang kỹ càng trước khi bước vào môi trường công việc, được cung cấp trải nghiệm sát nhất với các công việc Phân tích dữ liệu thực tế trong doanh nghiệp.
Module 3: PL-300: Microsoft Power BI Data Analyst
DATAPOT CERTIFICATE OF COMPLETION
Certificate of completion là chứng nhận do Datapot cấp cho học viên đã hoàn thành các khóa học chuyên môn được thiết kế, xây dựng bởi Datapot. Các khóa học do chính đội ngũ giảng viên giàu kinh nghiệm giảng dạy và thực chiến lâu năm trong ngành Dữ liệu xây dựng. Giáo trình của khóa học luôn được cập nhật, kết hợp hài hòa giữa lý thuyết và thực hành trên các case study thực tế trong doanh nghiệp, giúp cho các học viên có nền tảng chuyên môn vững chắc và cách tiếp cận đúng đắn với ngành Dữ liệu.
Học viên có cơ hội nhận 2 loại chứng nhận khác nhau, thể hiện sự chuyên nghiệp và gây ấn tượng với nhà tuyển dụng
Chứng nhận
MICROSOFT CERTIFICATE OF ACHIEVEMENT
Certificate of Achievement là chứng nhận được công nhận trên toàn thế giới do Microsoft cấp cho học viên đã hoàn thành các khóa học theo chuẩn Microsoft và do Microsoft Certified Trainer giảng dạy. Datapot hiện là Learning Partner và Power BI Partner. Datapot được Microsoft công nhận và cấp quyền sử dụng tài liệu độc quyền từ hãng cho các đối tác phù hợp.
Sẵn sàng trở thành Data Analyst chuyên nghiệp?
Module 2: DP-080: Querying Data with Microsoft T-SQL
Module 7: Data Analytics Preparation
- Những lưu ý để chuẩn bị cho một công việc mới
- Thiết lập mục tiêu công việc
- Critical thinking - Tư duy phản biện
- Design thinking - Tư duy thiết kế
- Giảng viên chữa CV cho học viên
- Phỏng vấn thử 1-1
- Kỹ năng giao tiếp & kỹ năng thuyết trình
- Kỹ năng làm việc nhóm
- Kỹ năng Quản lý thời gian và xếp ưu tiên công việc
- Cách viết CV hiệu quả
Bài tập học viên môn Python for Data Analytics