Data Analytics Foundation Plus (DAFP)

ĐƯỢC YÊU THÍCH BỞI NHỮNG HỌC VIÊN TỪ CÁC CÔNG TY LỚN

Khóa học DAFP – Data Analytics Foundation Plus là lộ trình hoàn hảo cho bất cứ ai muốn bước chân vào làm việc trong ngành dữ liệu. Khóa học sẽ giúp học viên xây dựng một nền tảng vững chắc về ngành Phân tích dữ liệu, theo một lộ trình chuẩn từ cơ bản đến nâng cao, từ gốc rễ của vấn đề cho đến cách giải quyết và phát triển.

Học viên sẽ được  trang bị một bộ kỹ năng toàn diện bao gồm: Toolset – các công cụ thao tác và quản trị luồng dữ liệu, Skillset – kỹ năng bóc tách và xử lý quy trình dữ liệu và Mindset – tư duy phân tích và giải quyết các bài toán dữ liệu cụ thể. Kết thúc khóa học, các bạn hoàn toàn có thể bắt đầu làm việc trong ngành Khoa học dữ liệu tại các vai trò Associate DA/BI.

Lộ trình DAFP gồm: 3 Học phần – 7 Modules

Học phần I – Data Analytics Foundation

👉 Gồm bộ 3 khóa học tiêu chuẩn của Microsoft được giảng dạy bởi Microsoft Certified Trainer giúp làm chủ bộ 3 công cụ xử lý và phân tích dữ liệu sử dụng trong mọi doanh nghiệp: Azure – SQL – PowerBI
👉 Biết cách cung cấp và triển khai cơ sở dữ liệu thông qua các giải pháp dữ liệu đám mây với Microsoft Azure
👉 Hiểu được các nguyên tắc cơ bản của Cơ sở dữ liệu quan hệ và cách truy vấn SQL
👉 Mô hình hóa dữ liệu và và thiết kế báo cáo phục vụ cho kinh doanh với Power BI

Học phần II – Data Analytics Advanced

👉 Phát triển, nâng cao toàn diện toolset – skillset – mindset về Phân tích dữ liệu
👉 Xây dựng tư duy phân tích dữ liệu nhằm chinh phục các bài toán phân tích hoạt động doanh nghiệp thông qua ứng dụng lý thuyết Pareto phân tích sản phẩm, ứng dụng cohort analysis phân tích khách hàng và sử dụng Linear Regression dự đoán doanh nghiệp
👉 Thành thạo các công thức DAX nâng cao và quy trình xây dựng mô hình dữ liệu hiệu quả
👉 Kỹ thuật xử lý, biến đổi và trực quan hóa dữ liệu nâng cao với Python – ngôn ngữ lập trình phổ biến nhất trong khoa học dữ liệu

Học phần III – Data Analytics Preparation

👉 Cùng học viên chuẩn bị hành trang kỹ càng trước khi bước vào môi trường công việc
👉 Cung cấp trải nghiệm sát nhất với các công việc Phân tích dữ liệu thực tế trong doanh nghiệp

    • Thực hiện các Project với bài toán và bộ dữ liệu thực từ doanh nghiệp
    • Xây dựng Porfolio cá nhân và hoàn thiện CV
    • Hỗ trợ Mock Interview 1-1 với các Data Analyst/Business Intelligence Leader của các doanh nghiệp lớn

ĐỐI TƯỢNG

Những người có định hướng rõ ràng và quyết tâm cao với ngành Phân tích dữ liệu, mong muốn có nền tảng vững chắc để có thể đi làm:
📌 Các nhân sự trong nhiều lĩnh vực kinh doanh, hành chính, marketing, tài chính, kế toán,… có nhu cầu chuyển hướng nghề nghiệp.
📌 Các nhân sự đang đảm nhiệm các công việc cần đến sự hỗ trợ của mảng công nghệ cơ sở dữ liệu.
📌 Sinh viên các khối ngành kinh tế, kinh doanh, tài chính, marketing,… có định hướng trở thành Data Analyst/Business Intelligence/Data Scientist trong các lĩnh vực chuyên biệt.
📌 Sinh viên các khối ngành khoa học dữ liệu, hệ thống thông tin,… mong muốn phát triển tư duy và tiếp cận dữ liệu theo hướng Business.

ĐIỀU KIỆN TIÊN QUYẾT

Khóa học không yêu cầu điều kiện tiên quyết hay các kiến thức chuyên môn về lập trình

TẠI SAO LẠI CHỌN DATA ANALYTICS FOUNDATION PLUS CỦA DATAPOT?

🌟  Kiến thức đầy đủ, thực tiễn, bao quát mọi khía cạnh của ngành Dữ liệu và các công việc Phân tích dữ liệu.
🌟  Lộ trình rõ ràng, cụ thể từ cơ bản đến nâng cao giúp học viên dễ dàng định hình và phát triển toàn diện.
🌟  Giáo trình chuẩn quốc tế, được công nhận bởi Microsoft.
🌟  Đội ngũ giảng viên giàu kinh nghiệm là những chuyên gia DA/BI trong các doanh nghiệp, tập đoàn lớn.
🌟  Sau khi kết thúc, học viên sẽ đủ khả năng thi các chứng chỉ Microsoft Certified: Data Analyst Associate được công nhận toàn cầu.
🌟  Được học kỹ năng thực chiến, chuẩn bị hành trang sẵn sàng chinh phục các công việc DA/BI.

Ưu đãi đặc quyền cho học viên tại Datapot:
Discount 40% khi tham gia thi chứng chỉ PL-300: Microsoft Power BI Data Analyst

Mã lớp học:

DAF-21, DAFP-30, DAF-22, DAFP-29, DAF-23, DAFP-31, DAF-24, DAF-25, DAF-26, DAF-27, DAF-28, DAF-29, DAF-30, DAFP

Study program

Module 1: DP-900: Azure Data Fundamentals

1.1 Khám phá các khái niệm dữ liệu cốt lõi

  • Khám phá các khái niệm dữ liệu cốt lõi
  • Khám phá các vai trò và trách nhiệm trong thế giới dữ liệu
  • Mô tả các khái niệm về dữ liệu quan hệ và không quan hệ
  • Khám phá các khái niệm về phân tích dữ liệu

1.2 Khám phá dữ liệu quan hệ trong Azure

  • Khám phá các dịch vụ dữ liệu quan hệ trong Azure
  • Khám phá việc cung cấp và triển khai các dịch vụ cơ sở dữ liệu quan hệ trên Azure
  • Truy vấn dữ liệu quan hệ trong Azure
  • Các Công nghệ được sử dụng trong bài thực hành:
  • SQL Server trên máy ảo Azure
  • Cơ sở dữ liệu Azure SQL
  • Azure SQL Database Managed Instance
  • PostgreSQL, MariaDB, and MySQL

1.3 Khám phá dữ liệu không quan hệ trong Azure

  • Khám phá các dịch vụ dữ liệu không quan hệ trong Azure
  • Khám phá việc cung cấp và triển khai các dịch vụ dữ liệu không quan hệ trên Azure
  • Quản lý kho dữ liệu không quan hệ trong Azure
  • Các công nghệ được sử dụng trong bài thực hành:
  • Azure Table storage
  • Azure Blob storage
  • Azure File storage
  • Azure Cosmos DB

1.4 Phân tích kho dữ liệu hiện đại trong Azure

  • Kiểm tra các thành phần của kho dữ liệu hiện đại
  • Khám phá quá trình nhập dữ liệu trong Azure
  • Khám phá lưu trữ và xử lý dữ liệu trong Azure
  • Khám phá các tùy chọn xử lý có sẵn để xây dựng các giải pháp phân tích dữ liệu trong Azure.
  • Khám phá Azure Synapse Analytics, Azure Databricks và Azure HDInsight
  • Bắt đầu xây dựng với Power BI
  • Các công nghệ được sử dụng trong bài thực hành:
  • Azure Synapse Analytics
  • Azure Data Factory
  • Azure Data Lake Storage
  • Azure Databricks
  • Azure Analysis Services
  • Azure HDInsight
  • Microsoft Power BI
Module 2: DP-080: Querying Data with Microsoft T-SQL

2.1 Giới thiệu SQL và Cơ sở dữ liệu quan hệ

  • Giới thiệu khóa học
  • Giới thiệu SQL
  • Cơ sở dữ liệu
  • Schema
  • Bảng
  • Các loại câu lệnh và từ khóa trong SQL
  • Viết các truy vấn SQL đầu tiên

2.2 Mệnh đề truy vấn trong SQL

  • Mệnh đề truy vấn SELECT, FROM, WHERE, GROUP BY, ORDER BY
  • Các kiểu dữ liệu trong SQL Server
  • Các hàm trong SQL
  • Hàm chuyển đổi kiểu dữ liệu
  • Hàm Datetime
  • Hàm String

2.3 Kết nối các bảng dữ liệu, giới thiệu về Join và Union

  • Giới thiệu về SQL Join
  • Inner Join
  • Left Join
  • Right Join
  • Full Outer Join
  • Giới thiệu về SQL Union
  • Thực hành

2.4 Joins, Truy vấn con và Bảng tạm

  • Hiểu sâu hơn về các khái niệm của Join
  • Join nhiều điều kiện
  • Join nhiều bảng dữ liệu,
  • Self-join
  • Truy vấn con vs CTEs
  • Truy vấn con
  • Common Table Expression (CTEs)

2.5 Các hàm tổng hợp dữ liệu (Aggregate functions) và Logical Statement

  • Aggregate functions
  • Logical Statement
  • ROW_NUMBER(), RANK() và PARTITION BY

2.6 Wrap up

  • Thực hành SQL và giải quyết các bài toán thực tế
  • Tóm tắt khóa học SQL, nêu bật các khái niệm và các phần thực hành quan trọng của SQL
  • Trao đổi, chia sẻ với Chuyên gia Microsoft về kinh nghiệm Phân tích dữ liệu
  • Q&A (Optional) – Lộ trình nghề nghiệp ngành Dữ liệu và các vị trí tiềm năng
Module 3: PL-300: Microsoft Power BI Data Analyst

3.1 Làm quen với Data Analytics và Power BI

  • Các vị trí quan trọng và các lựa chọn nghề nghiệp tiềm năng trong Ngành Dữ liệu
  • Nhiệm vụ của một Data Analyst
  • Khám phá khả năng của Power BI và làm quen với Môi trường làm việc của Power BI

3.2 Làm sạch, chuyển đổi và tải dữ liệu trong Power BI

  • Các nhiệm vụ thông thường của quá trình chuẩn bị dữ liệu (làm sạch, định hình lại dữ liệu, v.v.)
  • Làm sạch dữ liệu trong Power BI bằng Power Query Editor
  • Data Profiling và khám phá Metadata của tập dữ liệu

3.6 Course check-point

  • Tóm tắt các khái niệm quan trọng đã học trong 6 ngày trước đó
  • Tối ưu hóa hiệu suất mô hình
  • Bài kiểm tra giữa khóa

3.5 Thực hành DAX

  • Ôn lại các khái niệm cơ bản về DAX
  • Thực hành các mẫu DAX phức tạp theo từng trường hợp sử dụng trong kinh doanh

3.7 Thiết kế báo cáo trong Power BI

  • Giới thiệu các khái niệm và nguyên tắc cơ bản của trong việc thiết kế và xây dựng một báo cáo
  • Nâng cao khả năng truy cập và khả năng sử dụng của báo cáo bằng cách sử dụng tính năng trực quan hóa của Power BI

3.8 Thực hiện các phân tích nâng cao với Power BI

  • Giới thiệu các khái niệm và thực hành EDA (Exploratory Data Analysis) trong Power BI
  • Sử dụng Power BI AI visualization để thực hiện các phân tích nâng cao

3.9 Làm việc với Dashboards trong Power BI Service

  • Giới thiệu các tính năng của Power BI service
  • Tạo và cấu hình dashboard dựa trên các trường hợp sử dụng trong kinh doanh khác nhau
  • Tổ chức không gian làm việc (workspace) của Power BI service

3.10 Quản lý, kiểm soát và chia sẻ nội dung Power BI

  • Giới thiệu các khái niệm cơ bản về quản trị dữ liệu
  • Tìm hiểu cách cấu hình và quản lý tập dữ liệu trong Power BI Service
  • Triển khai và định cấu hình bảo mật trong Power BI để đảm bảo an toàn cho tài sản của bạn

3.11 Tổng kết

  • Tóm tắt khóa học PL-300, nêu bật các khái niệm và các phần thực hành quan trọng của Power BI
  • Trao đổi, chia sẻ với Chuyên gia Microsoft về kinh nghiệm Phân tích dữ liệu và lời khuyên khi làm bài thi PL-300
  • Q&A (Optional) – Lộ trình nghề nghiệp ngành Dữ liệu và các vị trí tiềm năng
Module 4: Python for Data

4.1 Giới thiệu về khóa học và Python

  • Giới thiệu khoá học
  • Cài đặt phần mềm
  • Giới thiệu Python
  • Các cú pháp và khái niệm cơ bản
  • Quy tắc và quy ước đặt tên

4.2 Các kiểu dữ liệu tiêu chuẩn trong Python

  • Xử lý liệu nhị nguyên với kiểu bool
  • Kiểu NoneType và use cases
  • Xử lý dữ liệu số với kiểu int và float
  • Nhận user input và ép kiểu
  • Giới thiệu kiểu collections
  • Xử lý dữ liệu chuỗi với list và tuple
  • Tạo nhanh sequeces với range
  • Xử lý dữ liệu text với string
  • Xử lý dữ liệu key-value với dictionary
  • Giới thiệu kiểu dữ liệu set và use cases

4.3 Luồng điều khiển và hàm

  • Rẽ nhánh ra quyết định với câu lệnh if
  • Lặp khối lệnh với vòng lặp for
  • Điều khiển vòng lặp với reak và continue
  • Viết và sử dụng hàm

4.4 Xử lý dữ liệu 1 chiều với Numpy và Pandas series

  • Giới thiệu Numpy arrays và Pandas series
  • Dùng các thao tác element-wise để tính toán và lọc dữ liệu
  • Biểu diễn và làm việc với missing data

4.5 Xử lý dữ liệu dạng bảng với Pandas data frames

  • Giới thiệu Pandas data frames
  • Làm việc với cột dạng số, text, và ngày tháng
  • Thêm, xoá, update giá trị, ép kiểu, và đổi tên cột
  • Làm việc với unique values, missing values
  • Lọc  và sắp xếp các dòng theo điều kiện
  • Giới thiệu về data aggregation và các aggregate operations
  • Combine data từ nhiều nguồn
  • Đọc và xuất data ra các định dạng khác nhau

4.6 Trực quan hoá dữ liệu với Matplotlib và Seaborn

  • Các bước để vẽ đồ thị trong Python
  • Phân loại và vẽ các loại đồ thị tương ứng với từng loại data: bar plot, pie plot, hisgram, KDE, boxplot, dodged/stacked bar plot, scatter plot, regression plot

4.7 Project và Q&A

  • Phân tích dữ liệu khai phá (EDA) và rút trích ra các đặc trưng hữu ích
  • Dùng machine learning để xây dựng mô hình dự đoán
  • Đánh giá performance và so sánh các mô hình
  • Q&A
Module 5: Advanced Query with T-SQL

5.1 Data Wrangling

  • Review basic SQL queries
  • Window Functions
  • Subquery vs CTE vs Temp Table
  • Text Function, Json Function

5.2 Applications

  • Case study: Cohort Analysis
  • Case study: RFM segmentation
  • Case study: A/B testing
  • Query performance tuning

5.3 Data Definition Language

  • ER diagram
  • Database Design
  • Stored Procedure
  • Flow control
  • Building and Optimizing Trigger
Module 6: Power BI Advanced Data Modeling and Visualization

6.1 Data Modeling – Cấu trúc dữ liệu và các kỹ thuật

  • Quy trình làm việc với Power BI
  • Cấu trúc dữ liệu và các kỹ thuật trong mô hình hoá dữ liệu
  • Quy trình xây dựng mô hình dữ liệu trong phân tích bài toán kinh doanh

Case study: Xây dựng mô hình dữ liệu

  • Thiết kế mô hình dữ liệu cho doanh nghiệp bán lẻ
  • Xây dựng báo cáo phân tích hiệu quả kinh doanh

6.2 Các phép biến đổi dữ liệu trong M-Query và DAX

  • Vận dụng các kỹ thuật mô hình hóa dữ liệu với bảng Dim và Fact
  • Các kỹ thuật biến đổi dữ liệu. (Data transformation)
  • DAX Foundation: Scalar, Interator Functions
  • Calculate and Filter functions

6.3 Case Study – Bài toán Doanh thu và Lợi nhuận của Doanh Nghiệp

  • Row context and Filter context
  • Logical functions
  • Context modification functions
  • Một số kỹ thuật visualization nâng cao

6.4 Case Study – Bài toán Customer Behaviour

  • Biến và các phép biến đổi dữ liệu nâng cao.
  • Vận dụng các information functions CONTAINS, HASONEVALUE, ISBLANK
  • Sử dụng các celationship function RELATED, USERELATIONSHIP
  • Hiểu rõ hơn về table manipulation functions ADDCOLUMNS, DATATABLE, DISTINCT, EXCEPT, GROUPBY, INTERSECT
  • Vận dụng các kỹ thuật trình diễn dữ liệu nâng cao.
  • Vận dụng các text functions CONCATENATE, COMBINEVALUES,REPLACE,VALUE
  • Các kỹ thuật sử dụng trong Cohort analysis

6.5 Case Study – Bài toán Customers Segmentaion sử dụng RFM

  • Ứng dụng các hàm time intelligent: DATEADD, DATESBETWEEN, PREVIOUS ver (PREVIOUSDAY, PREVIOUS MONTH ..), DATEDIFF
  • Caculation groups và ứng dụng
Module 7: Data Analytics Career Kickstart

7.1 Project và Porfolio

  • Thực hiện các Project Phân tích dữ liệu thực từ hoạt động của doanh nghiệp
  • Phát triển các case study để áp dụng vào các tình huống cụ thể phát sinh từ doanh nghiệp
  • Hoàn thiện các Project và xây dựng Porfolio gây ấn tượng với nhà tuyển dụng

7.2 Career Kickstart

  • Tư vấn viết và hoàn thiện CV
  • Hỗ trợ học viên chuẩn bị cho các vòng phỏng vấn xin việc
  • Phỏng vấn trực tiếp với các chuyên gia trong ngành