LÀM SAO ĐỂ XÂY DỰNG DATA TEAM VỮNG CHẮC VÀ HIỆU QUẢ

Ngày đăng: 27/10/2022

Đi cùng sự phát triển của dữ liệu số trên thế giới, một trong những công việc đầu tiên mà chúng ta nhắc tới đó là data scientists. Và khi xây dựng những sản phẩm theo hướng data (data – driven products), bạn cần một data team với các vị trí như: data scientists, data engineers và product owners. Mỗi role sẽ tập trung vào một mảng riêng và mọi người đều có tầm quan trọng như nhau. Nhưng điều quan trọng là bạn sẽ phải đảm bảo rằng mọi người được kết nối và làm việc với nhau dù cho mỗi người trong team phát triển một mảng riêng của sản phẩm. Nếu không giao tiếp hiệu quả với mọi người trong team, mọi thứ sẽ không thể thực sự work được. Hay nói cách khác, sự cộng tác giữa các thành viên trong team là key chính. Dù cho solution họ đang làm là gì thì cũng rất cần thiết để được thực hiện bởi toàn bộ team.

Mô hình hóa data team

Dưới đây là diagram với những vai trò cần thiết (essential role) cho một data team, nó sẽ cung cấp cho chúng ta một cái nhìn về vai trò của mỗi người trong team cũng như những đóng góp của họ cho products và ai sẽ là người làm việc cùng họ.

Data team
Data team

Quan sát vào hình trên, chúng ta đặt câu hỏi rằng: Liệu những roles nào là quan trọng cho một data team và họ làm những gì? Để giải quyết câu hỏi này, chúng ta sẽ đi đến một ví dụ xem một team thực sự làm việc như nào khi build lên một platform tool như Spotify.

Khi xây dựng một platform tool, chắc chắn bạn cần có những câu chuyện (stories) và những đầu việc (tasks) sẵn. Lúc này, scrum masters phải đảm bảo mọi người trong team biết những điều đầu việc đó và sắp xếp chúng lại. Và product owner (và các thành viên còn lại của team), họ sẽ define lại các tasks và tổ chức chúng bằng cách tạo ra một roadmap.

Scrum masters cũng phải kiểm tra và define lại các tasks, thậm chí nhiều hơn những cái mà họ cần cho việc build lên một sản phẩm (product). Đồng thời, trách nhiệm của product owners cũng phải đảm bảo mọi người làm việc như một team thực sự và giúp team devise được những task tốt nhất dựa trên roadmap.

Những bước tiếp theo của data team (possible next steps)

Để xây dựng một công cụ (tool) như Spotify, business managers sẽ phải liên lạc với các stakeholders để có thể cải thiện được product và tạo ra các impacts cho thị trường. Họ sẽ phải nghĩ về tất cả các khả năng có thể xảy ra, cũng như đặt ra các câu hỏi như “Họ có thể làm được những gì để hoàn thành tầm nhìn (vision) của họ dựa trên những dữ kiện trên thị trường?”

Ngoài ra, business manager làm công việc báo cáo, hỏi và trả lời các câu hỏi của một business intelligence. Business intelligence tập trung vào việc làm thế nào để cải thiện được doanh nghiệp và ngày càng thu về nhiều lợi nhuận hơn. Với Spotify, họ có thể nghĩ tới một số subscriptions.

Cũng như vậy thì trong một data team, business intelligence nghiên cứu và đánh giá về các mô hình kinh doanh của đối thủ cạnh tranh để xem nó có cạnh tranh với sản phẩm của họ không? Bằng cách sử dụng Tableau, họ có thể tạo ra các dashboard báo cáo trực quan hóa dữ liệu tự động hàng ngày hoặc hàng tuần. Vậy khi nào mọi người sử dụng Spotify? Và cái mà mọi người sử dụng nhiều nhất là gì? Cùng với data, những quyết định tốt hơn sẽ được đưa ra. Business intelligence có thể đưa ra các lời khuyên tốt hơn cho business manager và thảo luận về các bước tiếp theo.

Showcasing các giải pháp

Trong một data team, trách nhiệm của một product owners (PO) là hiểu những đầu việc nào cần làm để tạo nên một sản phẩm (product). Họ sẽ là người phải tìm kiếm liên tục các dữ liệu để trả lời các câu hỏi. Đồng thời, PO cũng là người nhận các feedback từ data analysts – những người phát triển và define sản phẩm. PO cũng phải đảm bảo rằng business managers phù hợp và quản lý tốt những kỳ vọng của họ.

Cuối cùng nhưng cũng rất quan trọng, đó là data scientists sẽ đưa ra các giải pháp cho các PO thấy những cái mà được làm để tạo nên sản phẩm đó. Tóm lại, PO phải đảm bảo được rằng một sản phẩm đang đi đúng hướng của nó.

Còn DA sẽ xem liệu có thể thực hiện dựa trên những dữ liệu có sẵn trong công ty hay không. Họ sử dụng Python và Tableau để biến thông tin bán hàng thành thông tin chi tiết giúp ban quản lý đưa ra quyết định. Python và Snowflake được sử dụng để tự động hóa báo cáo hiện có (automate existing report) thành các giải pháp tốt hơn. Bằng cách kiểm tra những gì đang xảy ra, họ cho PO và business intelligence biết nếu có thể xây dựng một sản phẩm và làm thế nào để làm nó.

Ví dụ, họ có thể đánh giá phản hồi của khách hàng về sản phẩm và tác động của công cụ đó trên thị trường. Sau đó, họ sẽ thảo luận với PO nếu có dữ liệu có thể giúp ích. Lấy một ví dụ khác, giả sử chúng ta cần một tính năng mới cho các bài đánh giá (reviews), vậy câu hỏi đặt ra là người dùng muốn hoặc cần gì? Lúc này đây, DA sẽ thực hiện các truy vấn để trả lời những câu hỏi này.

Và trong một data team, Data scientists cũng đang làm việc bên cạnh DA (data engineers và machine learning engineers). Họ tạo ra các dashboard và Proof of Concepts và có quyền truy cập vào các thông tin chi tiết từ data engineers và làm việc với dữ liệu của công ty. Data scientists sẽ kiểm tra dữ liệu nào đã có và những thứ cần thiết để một công cụ thực sự đi vào hoạt động hoặc được sử dụng. Họ sẽ xem xét xem những dữ liệu tốt hơn có cần thiết không? Sau đó, họ sẽ phải làm việc, tương tác với data engineers.

Làm việc với dữ liệu phù hợp

Chuyển sang machine learning engineers, những người này cần làm việc với data engineers và hợp nhất tất cả pipelines. Họ lấy các mô hình để mở rộng quy mô và đưa chúng vào môi trường sản xuất.

Ví dụ: khi Spotify muốn mở rộng quy mô, họ sẽ làm việc cùng với các kỹ sư phần mềm (software engineers) trên chương trình phụ trợ (backend) để tối ưu hóa công nghệ và cộng tác với các data engineers. Data engineers tạo và làm việc với cơ sở dữ liệu (databases). Họ đảm bảo rằng data scientists có quyền truy cập vào dữ liệu cần thiết để xây dựng một công cụ. Nếu không có dữ liệu, bạn sẽ không biết phải làm gì hoặc bắt đầu từ đâu.

Chúng ta có thể nói rằng data engineers có vai trò cốt yếu và quan trọng nhất của nhóm khoa học dữ liệu (data team). Vì điều quan trọng là họ biết cách xây dựng cơ sở dữ liệu. Ví dụ: khi ai đó đang thực hiện một truy vấn, nó cần phải hiệu quả. Và các kỹ sư dữ liệu đảm bảo những người khác có dữ liệu phù hợp để thực hiện truy vấn.

Khi bạn đã có công cụ của mình và các bên liên quan đã có mặt, bạn muốn tất cả mọi người có thể truy cập nó. Đây là lúc một giải pháp sẽ được đưa vào sản xuất, và bằng chứng về khái niệm phải được hiển thị. Đưa công cụ vào sản xuất sẽ đảm bảo người dùng thực sự bắt đầu sử dụng nó. Khi đã có mặt trên thị trường, bạn cũng cần phải làm cho nó trở nên hấp dẫn đối với công chúng. Để điều chỉnh đối tượng mục tiêu mà bạn hướng tới, cần đảm bảo sản phẩm trông đẹp mắt và dễ sử dụng. Đó là nơi front-end software engineers ra đời hoặc có thể là một nhà thiết kế UI/UX

Xây dựng đội ngũ của bạn


Trước khi xây dựng một nhóm khoa học dữ liệu (a data team), điều quan trọng là phải hiểu rõ những gì bạn đang làm và những cái mà bạn đang tìm kiếm. Một sai lầm phổ biến chúng ta thường mắc phải là mọi người bắt đầu tìm kiếm các data scientists. Không phải vì họ cần một, hai hoặc ba người, mà bởi vì những khác cũng đang tìm kiếm họ. Mặc dù có thể có cần các data scientists, nhưng trước tiên bạn cần đảm bảo rằng bạn có dữ liệu để làm việc. Trong một data team, data engineer cũng đóng một vai trò vô cùng quan trọng vì nếu không có data engineer, bạn sẽ không có dữ liệu phù hợp để làm việc.

Trên đây là góc nhìn để build một data team. Hy vọng nó sẽ hữu ích với bạn!

Nguồn: Build solid data team

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *