Recap Webinar | Giải mã hành vi khách hàng TMĐT: Thực hành với SQL & mô hình RFM

Ngày đăng: 09/05/2025

“Học cách đặt đúng câu hỏi – truy vấn đúng – kể đúng câu chuyện từ dữ liệu.” 

Tối ngày 07/05/2025, Datapot đã tổ chức webinar “Thực hành với SQL – Giải mã hành vi khách hàng TMĐT từ dữ liệu”, thu hút hơn 200 người tham dự từ nhiều lĩnh vực như chuyên viên marketing cần phân tích hành vi khách hàng, nhân sự e-commerce muốn tối ưu hiệu suất chuyển đổi, người làm báo cáo cần trực quan hóa dữ liệu hiệu quả và cả những ai đang tìm hiểu lộ trình chuyển ngành sang phân tích dữ liệu. Buổi học được dẫn dắt bởi diễn giả Ms. Nguyễn Thị Hiền – Data Analyst tại Viettel Digital với 5 năm kinh nghiệm thực chiến đa lĩnh vực, giúp người học tiếp cận tư duy phân tích bài bản và dễ hiểu. 

Tư duy từ dữ liệu đúng cách – Giải pháp cho người học “không biết bắt đầu từ đâu” 

Nội dung buổi webinar được thiết kế theo đúng hành trình học tập của một người mới bắt đầu: 

  1. Giải mã ngành TMĐT dưới lăng kính dữ liệu: hiểu vì sao dữ liệu là tài nguyên chiến lược trong việc nắm bắt hành vi khách hàng và nâng cao hiệu quả kinh doanh. 
  1. Giới thiệu các mô hình phân tích khách hàng phổ biến: từ segmentation, journey đến cohort – RFM. 
  1. Thực hành live coding với SQL: học viên được hướng dẫn trực tiếp cách viết truy vấn SQL đơn giản, ứng dụng để phân nhóm khách hàng, tính vòng đời và phân tích hành vi. 
  1. Kết thúc bằng storytelling & dashboard: làm sao để trực quan hóa báo cáo từ dữ liệu, kể một câu chuyện logic và thuyết phục sếp, đồng nghiệp, hoặc nhà tuyển dụng. 

Phần 1: Giải mã ngành TMĐT dưới lăng kính dữ liệu 

Mở đầu chương trình, Ms Hiền mang tới cho người tham dự cách tiếp cận ngành thương mại điện tử (TMĐT) bằng tư duy dữ liệu với góc nhìn hiện đại, không còn cảm tính như trước. 

Một số điểm nổi bật: 

  • TMĐT đang bùng nổ: Doanh thu toàn cầu đạt ~6.3 nghìn tỷ USD (2024), chiếm hơn 22% tổng doanh số bán lẻ toàn cầu. 
  • Hành vi mua sắm thay đổi: Người tiêu dùng giờ đây mua hàng qua app, website, mạng xã hội, và ra quyết định dựa trên đánh giá – đề xuất cá nhân hóa. 
  • Dữ liệu trở thành tài nguyên chiến lược: Ai hiểu khách hàng bằng dữ liệu – người đó có lợi thế. Ai làm chủ dữ liệu – người đó không thể bị thay thế. 

Điểm mù lớn mà doanh nghiệp gặp phải là gì? 

  • Không biết khách hàng nào đang rời đi và tại sao. 
  • Chưa đo lường được chi phí ẩn như refund, hoàn đơn, chiết khấu dài hạn. 
  • Bỏ qua Lifetime Value (LTV) – giá trị khách hàng dài hạn, dẫn đến chiến lược marketing lệch pha. 

Trong bối cảnh TMĐT ngày càng cạnh tranh, doanh nghiệp không thể ra quyết định chỉ dựa vào cảm tính. Việc đọc hiểu đúng dữ liệu hành vi khách hàng chính là nền tảng để xây dựng chiến lược marketing chính xác, hiệu quả và bền vững.  

Phần 2: Các mô hình phân tích khách hàng phổ biến 

2.1 Mô hình RFM: Phân nhóm khách hàng dựa trên hành vi 

Ở phần đầu tiên của nội dung chuyên sâu, người học được tiếp cận với mô hình RFM (Recency – Frequency – Monetary) – nền tảng cơ bản nhưng hiệu quả trong việc phân nhóm khách hàng theo hành vi mua hàng thực tế. 

RFM không chỉ giúp “nhìn thấy” ai đang mua nhiều, mà còn lý giải tần suất – thời điểm – mức độ giá trị của từng người mua. Từ đó, doanh nghiệp có thể dễ dàng xác định được đâu là nhóm khách hàng trung thành cần chăm sóc đặc biệt, đâu là nhóm có dấu hiệu “ngủ đông” cần được kích hoạt lại. 

Thay vì cố gắng gửi hàng loạt ưu đãi đại trà, việc ứng dụng RFM cho phép cá nhân hóa chiến lược: giảm chi phí, tăng hiệu quả – chăm đúng người, vào đúng thời điểm

Điểm cộng lớn của RFM là dễ hiểu – dễ triển khai, nhưng lại mở ra một “góc nhìn mới” về chính tập khách hàng doanh nghiệp đang sở hữu. 

2.2 Phân tích Cohort: Theo dõi hành vi theo nhóm thời gian 

Khác với RFM phân tích theo chiều ngang (hành vi), Cohort Analysis mở ra chiều dọc của thời gian, cho phép doanh nghiệp theo dõi vòng đời hành vi khách hàng theo từng “nhóm thời gian gắn kết” – ví dụ: nhóm khách đăng ký tháng 1, nhóm mua lần đầu trong tuần thứ 3,… 

Với Cohort, câu hỏi không còn là “khách này đã mua bao nhiêu lần?”, mà là “họ có còn quay lại sau 1 tháng, 3 tháng, 6 tháng không?”. Đây là nền tảng để đo Retention Rate, so sánh hiệu quả của các chiến dịch marketing hoặc onboarding, và dự đoán khả năng gắn bó lâu dài của từng nhóm khách hàng. 

Điểm mạnh của Cohort là giúp doanh nghiệp tránh những hiểu lầm phổ biến: ví dụ doanh thu tăng chưa chắc là vì có khách mới, mà có thể do khách cũ đang chi tiêu nhiều hơn. Nhìn đúng dữ liệu theo dòng thời gian chính là chìa khóa để hiểu đúng hành vi. 

2.3. Tính LTV (Lifetime Value) từ RFM và Cohort 

Phần cuối cùng là bước “nối dài” giữa mô hình hành vi và chiến lược tài chính: kết hợp RFM và Cohort để tính Customer Lifetime Value (LTV) – tức là đo lường một khách hàng sẽ mang lại bao nhiêu giá trị trong suốt vòng đời gắn bó với doanh nghiệp. 

Việc tính LTV không đơn thuần là một chỉ số, mà là nền tảng để trả lời cho câu hỏi: “Doanh nghiệp có thể đầu tư bao nhiêu để thu hút hoặc giữ chân một khách hàng mà vẫn đảm bảo hòa vốn – thậm chí là sinh lời?” 

Dưới sự hướng dẫn của giảng viên, học viên thực hành từng bước: 

  • Xác định tháng mua đầu. 
  • Gắn nhóm RFM. 
  • Tính Cohort Index và doanh thu theo thời gian. 
  • Tổng hợp để ra LTV tích lũy. 

Nhìn một cách tổng thể, LTV không chỉ là con số, mà là công cụ giúp doanh nghiệp đầu tư đúng – và làm chủ được đường dài trong chiến lược marketing. 

Phần 3: Thực hành live coding với SQL 

Nếu như phần trước giúp người xem hình dung khách hàng thông qua dữ liệu thì ở phần này là lúc những người tham gia được tự thao tác – dựng hình – kể chuyện từ chính những dữ liệu thưc tế. Điểm khác biệt lớn của webinar lần này nằm ở việc diễn giả đồng hành thực hiện cùng người tham dự trên môi trường code, sử dụng SQL để xử lý, phân tích và trực quan hóa dữ liệu theo đúng yêu cầu kinh doanh. 

3.1. Làm quen với truy vấn SQL: từ cú pháp cơ bản đến tư duy phân tích 

Phần thực hành mở đầu bằng việc hệ thống lại cấu trúc câu lệnh SQL cơ bản gồm các thành phần SELECT, FROM, WHERE, GROUP BY, HAVING và ORDER BY, cũng như thứ tự thực thi thực tế của chúng. Đây là kiến thức nền bổ trợ để chị Hiền tiếp tục hướng dẫn người tham dự cách áp dụng các câu lệnh SQL vào bài toán thực tế với các nội dung: 

  • Query đơn bảng (như city, country), dùng alias để đổi tên cột rõ ràng hơn. 
  • Lọc dữ liệu bằng các điều kiện như BETWEEN, LIKE, IN để xử lý tình huống thực tế. 
  • Sắp xếp bảng kết quả theo tiêu chí cụ thể (ORDER BY tăng hoặc giảm dần). 

Điểm nổi bật của phần này là cách diễn giả đã khéo léo lồng ghép ví dụ đơn giản – dễ hiểu – sát thực tế, giúp người mới cũng dễ dàng tiếp cận. 

3.2. Làm quen với dữ liệu và môi trường làm việc thực tế 

Ở phần này, người tham dự được kết nối trực tiếp đến hệ thống SQL Server và thực hành trên bộ dữ liệu Online Retail – gồm hơn 390.000 giao dịch bán lẻ tại Anh, với hơn 4.000 khách hàng. Dữ liệu bao gồm thông tin chi tiết về đơn hàng, sản phẩm, thời gian, quốc gia và người mua – là đầu vào lý tưởng để phân tích hành vi khách hàng. 

Điểm đáng chú ý không chỉ nằm ở dữ liệu lớn, mà ở tư duy tiếp cận như một dự án thật: hiểu dữ liệu – xác định vấn đề – chuẩn bị truy vấn phù hợp. Đây cũng chính là điều giúp phân biệt giữa “biết SQL” và làm phân tích chuyên nghiệp

3.3. Phân tích hành vi khách hàng: từ câu lệnh SQL đến quyết định chiến lược 

Phần thực hành chuyên sâu này giúp người tham dự trực tiếp vận dụng kỹ thuật SQL để phân tích hành vi khách hàng dựa trên mô hình RFM – Cohort – LTV. Bên cạnh việc học cách viết câu lệnh họ còn hiểu rõ mỗi bước xử lý đang giải quyết bài toán kinh doanh nào. 

1. Phân tích RFM với SQL 

  • Bước 1: Tổng hợp dữ liệu về đơn hàng, đưa về cấp độ đơn vị nhỏ nhất là InvoiceNo. 
  • Bước 2: Đặt ngày phân tích (snapshot) – thường là ngày liền sau giao dịch cuối cùng. Với tập dữ liệu này là ngày 2011-12-10. 
  • Bước 3: Tính toán chỉ số: Recency: ngày mua cuối cùng; Frequency: số lần mua hàng (COUNT(DISTINCT InvoiceNo)); Monetary: tổng chi tiêu (SUM(UnitPrice * Quantity)) 
  • Bước 4: Gán điểm RFM theo phương pháp quartile, sau đó phân nhóm khách hàng thành các phân khúc (Champions, Loyal, At Risk…). 

2. Kết hợp Cohort và tính LTV 

  • Truy vấn tính CohortMonth (tháng mua đầu tiên) và CohortIndex (số tháng kể từ lần đầu mua). 
  • Tính doanh thu theo từng RFM_Group và CohortIndex. 
  • Tính LTV tích lũy bằng cách: 
  1. Gộp tổng doanh thu theo thời gian 
  2. Chuẩn hóa theo số lượng khách từng nhóm 
  3. Pivot kết quả theo dạng bảng hiển thị LTV qua từng tháng 

Phần này giúp người tham dự không chỉ viết được một câu SQL dài, mà tư duy được cấu trúc phân tích – từ dữ liệu thô đến giá trị kinh doanh cuối cùng. Đây cũng là bước đệm để bước sang phần storytelling bằng dashboard ngay sau đó. 

Từ thao tác trên SQL đến hiểu vấn đề kinh doanh

Khác với những buổi học kỹ thuật thông thường, phần thực hành lần này được thiết kế như một dự án thật: người tham dự làm việc trên hệ thống SQL Server thật, xử lý dữ liệu thật, và quan trọng nhất – giải quyết bài toán kinh doanh thật

Dưới sự dẫn dắt từ kinh nghiệm thực chiến của diễn giả, từng truy vấn SQL không chỉ để chạy ra kết quả mà để trả lời các câu hỏi sống còn trong doanh nghiệp: 

  • Ai là khách hàng mang lại nhiều giá trị nhất? 
  • Nhóm nào đang có nguy cơ rời bỏ mà doanh nghiệp chưa nhận ra? 
  • Mỗi nhóm khách đáng để đầu tư bao nhiêu ngân sách giữ chân? 

Highlight ứng dụng thực tế: 

  • RFM giúp phân khúc khách hàng và cá nhân hóa chiến dịch chăm sóc → Giảm chi phí marketing, tăng tỉ lệ chuyển đổi. 
  • Cohort Analysis giúp theo dõi hành vi qua thời gian → Đo hiệu quả onboarding và retention. 
  • LTV là cơ sở ra quyết định tài chính → Tối ưu ROI cho từng nhóm khách hàng. 

Chính sự kết nối giữa kỹ thuật – mô hình – nghiệp vụ là lý do buổi thực hành không chỉ mang lại kỹ năng thao tác, mà còn hình thành tư duy phân tích có thể áp dụng ngay trong môi trường doanh nghiệp

Nếu bạn đang muốn làm phân tích một cách có định hướng kinh doanh, không chỉ dừng ở thao tác kỹ thuật mà còn hiểu rõ cách dữ liệu tạo ra giá trị thật, hãy tìm hiểu thêm về chương trình học được thiết kế theo đúng lộ trình này.

Tại Datapot, bạn sẽ không học một mình, mà được đồng hành cùng chuyên gia đang làm thật, môi trường dữ liệu thật, và tình huống bài bản giúp bạn từng bước làm chủ nghề phân tích. 

Phần 4: Kết thúc bằng storytelling & dashboard 

Sau phần coding, nội dung buổi webinar được khép lại bằng phần trình diễn dashboard và chia sẻ cách đọc insight từ kết quả phân tích. Đây là giai đoạn chuyển đổi từ kỹ thuật sang chiến lược – nơi dữ liệu bắt đầu có tiếng nói và tạo ảnh hưởng thực tiễn. 

Mở đầu, chị Hiền trình bày kết quả phân tích từ dữ liệu RFM – Cohort – LTV bằng bảng dashboard trực quan, làm nổi bật các nhóm khách hàng theo hành vi: 

  • Lost và At Risk chiếm hơn 60% – phản ánh tỷ lệ rơi rớt lớn. 
  • Champions có giá trị cao nhưng tệp chưa đủ lớn, cần chiến lược mở rộng. 
  • Loyal Customers tiềm năng, nhưng tỷ lệ còn thấp – cho thấy việc chuyển hóa từ At Risk → Loyal chưa hiệu quả. 
  • New Customers là nhóm nền tảng cho tăng trưởng, nhưng tệp còn nhỏ, cần tăng tốc đầu vào. 

Đặc biệt, phần trình bày thể hiện rõ: tỷ lệ giữ chân (Retention Rate) có sự phân hóa theo nhóm: 

  • Champions giữ chân cao (trên 40%) nhưng giảm mạnh sau tháng thứ 12. 
  • Loyal Customers duy trì ổn định trong 7 tháng liên tiếp (>32%). 
  • At RiskNew Customers giảm nhanh; nhóm Lost gần như rời bỏ sau tháng đầu. 

Những con số không chỉ là báo cáo mà là tín hiệu để doanh nghiệp điều chỉnh chiến lược chăm sóc, phân bổ nguồn lực và đầu tư chính xác hơn. Với cách tiếp cận storytelling từ dashboard, chị Hiền cho thấy: SQL – tư duy phân tích đúng – trình bày rõ ràng là ba yếu tố then chốt để dữ liệu trở thành công cụ ra quyết định chứ không chỉ là công cụ báo cáo. 

Tạm kết 

Webinar mang lại góc nhìn thực tế và công cụ hữu ích giúp người học ứng dụng dữ liệu để phân tích hành vi khách hàng và xây dựng báo cáo hiệu quả trong ngành TMĐT. 

Đây không chỉ là một buổi chia sẻ kiến thức – mà là khởi đầu vững chắc cho những ai muốn phát triển sự nghiệp dữ liệu một cách bài bản, thực tiễn và dễ áp dụng. 

Tài nguyên sau sự kiện 
Người tham dự có thể xem lại tài liệu và truy cập bộ dữ liệu thực hành dưới đây:

Video nội dung sự kiện sẽ được đăng tải trên YouTube của Datapot. Đừng quên subscribe kênh để nhận thông báo sớm nhất khi có video mới bạn nhé.

Bạn đã sẵn sàng bắt đầu hành trình phân tích dữ liệu? 

Hãy theo dõi Datapot để không bỏ lỡ những webinar tiếp theo – nơi bạn được học, thực hành và xây dựng con đường sự nghiệp vững chắc trong ngành Data. 

Xem thêm các Event và Webinar tại đây 

  • Tham khảo khóa học Power BI, SQL, Python của Datapot tại đây

Chia sẻ bài viết này

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

This site uses Akismet to reduce spam. Learn how your comment data is processed.