Python for Data Analytics (PYDA)

ĐƯỢC YÊU THÍCH BỞI NHỮNG HỌC VIÊN TỪ CÁC CÔNG TY LỚN

Khóa học mang đến cho học viên những nền tảng về ngôn ngữ lập trình và xử lý dữ liệu, ứng dụng trên ngôn ngữ Python. Học viên sẽ nắm bắt được các khái niệm và từng thành phần của ngôn ngữ lập trình Python cùng với thư viện Pandas – một thư viện được sử dụng phổ biến trong việc xử lý dữ liệu trong các ứng dụng như tổng hợp, biến đổi, làm sạch dữ liệu, trực quan hóa dữ liệu, xây dựng mô hình Machine Learning đơn giản. Ngoài ra, khóa học cũng giới thiệu đến học viên một số ứng dụng Python trong việc tự động hóa các công việc hàng ngày.

ĐỐI TƯỢNG

Những người muốn có tư duy về lập trình, ứng dụng trong các lĩnh vực khác
Những người muốn theo đuổi mảng dữ liệu một cách nghiêm túc, tiền đề cho các khóa học chuyên sâu về Machine Learning và AI
Nhân sự muốn tự động hóa các công việc tương tác với dữ liệu hàng ngày

ĐIỀU KIỆN TIÊN QUYẾT

Khóa học không yêu cầu điều kiện tiên quyết hay các kiến thức chuyên môn về lập trình

KỸ NĂNG ĐẠT ĐƯỢC SAU KHÓA HỌC

Nắm được quy trình phân tích dữ liệu và tầm quan trọng của nó đối với quá trình ra quyết định
Hiểu các khái niệm cơ bản về lập trình Python, bao gồm nhưng không giới hạn đối với trình thông dịch Python, môi trường, cấu trúc dữ liệu, các hàm, làm việc với tệp và các thư viện mở rộng
Sử dụng Python để thực hiện các công việc về phân tích dữ liệu: nhập dữ liệu, thao tác, chuyển đổi, phân tích mô tả và trực quan hóa bằng biểu đồ
Tạo các công cụ tạo báo cáo cơ bản bằng cách sử dụng Python: tự động hóa việc lập báo cáo và gửi email
Có nền tảng cơ bản để theo đuổi các lĩnh vực chuyên sâu hơn trong ngành khoa học dữ liệu: lập trình hướng đối tượng, Machine Learning với Python.

Mã lớp học:

PYDA-33, PYDA-34

Study program

Giới thiệu khóa học và Python

Giới thiệu khoá học

Cài đặt phần mềm

Giới thiệu Python

Hướng dẫn dụng Jupyter Lab

Giới thiệu Markdown

Các cú pháp và khái niệm cơ bản

Quy tắc và quy ước đặt tên

Các kiểu dữ liệu tiêu chuẩn trong Python (phần 1)

Xử lý liệu nhị nguyên với kiểu bool

Kiểu NoneType và use cases

Xử lý dữ liệu số với kiểu int và float

Nhận user input và ép kiểu

Các kiểu dữ liệu tiêu chuẩn trong Python (phần 2)

Giới thiệu kiểu collections

Xử lý dữ liệu chuỗi với list và tuple

Các kiểu dữ liệu tiêu chuẩn trong Python (phần 3)

Tạo nhanh sequeces với range

Xử lý dữ liệu text với string

Xử lý dữ liệu key-value với dictionary

Giới thiệu kiểu dữ liệu set và use cases

Luồng điều khiển và hàm

Rẽ nhánh ra quyết định với câu lệnh if

Lặp khối lệnh với vòng lặp for

Điều khiển vòng lặp với reak và continue

Viết và sử dụng hàm

Xử lý dữ liệu 1 chiều với Numpy và Pandas series

Giới thiệu Numpy arrays và Pandas series

Dùng các thao tác element-wise để tính toán và lọc dữ liệu

Biểu diễn và làm việc với missing data

Xử lý dữ liệu dạng bảng với Pandas data frames (phần 1)

Giới thiệu Pandas data frames

Đọc dữ liệu từ định dạng khác nhau (Excel, CSV, …)

Khảo sát sơ bộ data

Làm việc với cột dạng số, text, và ngày tháng

Thêm, xoá, update giá trị, ép kiểu, và đổi tên cột

Làm việc với unique values

Lọc  và sắp xếp các dòng theo điều kiện

Xử lý dữ liệu dạng bảng với Pandas data frames (phần 2)

Giới thiệu về data aggregation và các aggregate operations: sum, min/max, mean/median, variance/standar deviation

Thực hiện aggregation theo group

Combine data từ nhiều nguồn

Giới thiệu dạng long vs. wide và cách reshape data từ long sang wide và ngược lại

Xử lý missing data

Xuất data ra các định dạng khác nhau

Trực quan hoá dữ liệu với Matplotlib và Seaborn

Giới thiệu các thành phần căn bản của 1 đồ thị

Các bước để vẽ đồ thị trong Python

Hai styles vẽ đồ thị phổ biến (pyplot vs. OOP) và những nhầm lẫn thường gặp

Phân loại và vẽ các loại đồ thị tương ứng với từng loại data: bar plot, pie plot, hisgram, KDE, boxplot, dodged/stacked bar plot, scatter plot, regression plot

Project và Q&A

Làm việc với dữ liệu bất động sản

Phân tích dữ liệu khai phá (EDA) và rút trích ra các đặc trưng hữu ích cho dự đoán giá nhà

Dùng machine learning để xây dựng mô hình dự đoán giá bất động sản

Đánh giá performance và so sánh các mô hình

Q&A

“Sau khi học xong khóa học Python, em thấy tư duy về lập trình của em đã được mở rộng hơn Thực sự cho tới hết năm 2 ở Đại học em dường như không có kiến thức về lập trình và rất sợ lập trình trong khi chuyên ngành học của em lại thiên về hướng đó, cho nên em tìm đến Datapot và em đã không hối hận.
Anh Việt giảng rất dễ hiểu giúp em suy nghĩ logic hơn khi viết code, bài tập cũng rất đa dạng khiến cho em phải tư duy nhiều hướng khác nhau. Trải qua 10 buổi học em đã vượt qua nỗi sợ của mình và đã trở nên yêu thích nó.”

Lê Trung Chính

Fintech – Đại Học Kinh Tế – Luật (ĐH Quốc Gia Tp.HCM )

“Mình học khóa SQL và Python ở Datapot khoảng 3 năm trước. Sau khóa học, mình đã áp dụng luôn được vào công việc thực tế. Giảng viên nhiệt tình và là những người thực chiến, chia sẻ những bài học rất thực trong xử lý tình huống công việc. Học xong cả năm rồi inbox support vấn đề các anh vẫn dành thời gian trả lời. Datapot bây giờ có dạy cả chứng chỉ ở FTU, là cơ hội lớn cho sinh viên FTU rồi. Chắc chắn mình giới thiệu Datapot đến bạn bè và mọi người. Chúc anh chị giảng viên luôn mạnh khỏe và nhiệt huyết nhé!”

Bách Phạm

IT Project Manager - FPT Software

“Giảng viên Datapot cực nhiệt tình, chia sẻ nhiều kiến thức và kinh nghiệm công việc thực tế. Ngưỡng mộ anh Việt dạy mình khoá Python, buổi nào cũng ở lại thêm tiếng support học viên. Vẫn luôn tin tưởng recommend bạn bè đến đây học. Chúc Datapot ngày càng phát triển nhé!”

Lan Anh

Ernst & Young Việt Nam

“ Khóa học của Datapot cung cấp tốt các kiến thức nền tảng về Python và cách sử dụng Python để xữ lý file excel, csv,..cho những bạn chưa biết gì ngôn ngữ này cho như mình.”

Phan Nguyễn Huy Tú

Học viên Datapot

“ Em được dạy bởi anh Việt, anh dạy rất nhiệt tình, dễ hiểu và đã chia sẻ cho chúng em rất nhiều kiến thực thực tế qua cả quá trình làm việc của anh. Từ bài giảng đến bài tập đều được chuẩn bị rất chu đáo và em cũng tự mình tập được cách tư duy bài toán.”

Lê Thị Cẩm Ly

Học viên Datapot

“Chương trình học phù hợp, sắp xếp khoa học. Kiến thức từ khoá học bổ ích, có thể áp dụng ngay vào một số công việc.”

Nguyễn Quang Nhật

Học viên Datapot

học viên khóa power bi datapot

“Thầy giáo và các bạn tại Datapot hỗ trợ rất nhiệt tình. Kiến thức rất tốt. Cấu trúc bài giảng trong khóa PL-300 hợp lý, phù hợp với các đối tượng. Tôi “happy”. Cảm ơn thầy giáo và team đã khai sáng Power BI cho tôi.”

Trần Đình Hiệu

Head of SFC & Investment Appraisal MIS & ALM, Finance & Planning Division - Techcombank

học viên datapot

“Đã học qua 2 khóa Phân tích dữ liệu của Datapot (Power BI + SQL) và áp dụng luôn được vào công việc. Khóa học cung cấp cả kỹ năng phân tích, tổng hợp và cấu trúc hóa dữ liệu để tạo ra được 1 sản phẩm có giá trị chứ không chỉ dạy mỗi kỹ năng sử dụng tool. Nên học xong áp dụng được cả trong quản trị dự án, xây dựng và phát triển sản phẩm,… Đội ngũ giảng viên trẻ, vui tính và tập trung đầu tư cho giáo án, tài liệu nên rất ưng. “

Chiến Lê

Topica Edtech Group