
Khi mới bước chân vào ngành dữ liệu, chúng ta thường không khỏi hoang mang, một là vì thiếu thông tin, chưa hiểu rõ về ngành, hai là vì có quá nhiều luồng thông tin, không biết nên tin bên nào.
Thấu hiểu sự băn khoăn này, Datapot cùng các bạn tháo gỡ mốt số lầm tưởng, thắc mắc khi bước vào ngành dữ liệu nhé!
Chia sẻ một chút về tác giả bài viết.
Context: Mình làm nhiều role trong cả vòng đời dữ liệu: Data Clerk, Data Analyst/BI, DBA, Solution Architect, Department Manager (Data Managment and Analytics), Consultant, Trainer…(Mình không nhảy việc nhiều, thay đổi theo quá trình phát triển công việc)
Mình note lại một số quan điểm của mình (mình đã từng lầm tưởng hoặc đang phổ biến):
1. Làm dữ liệu phải giỏi siêu nhân về toán, thần thánh về lập trình hoặc công cụ, hiểu rất sâu về business?
Sự thật là: Bạn code tốt hơn một ông thuần về business, hiểu về business hơn một ông dev bình thường, hiểu về toán tốt hơn cả 2 ông kia (cũng chưa biết đâu vì nhiều dev sịn mình biết học sư phạm toán với toán ứng dụng ra đấy :-s ). bạn viết truy vấn SQL có thể tốt hơn Dev vì bạn hiểu về business nhưng thử viết một stored produce xử lý một tác vụ của phần mềm xem có toang không đã nhé.
2. Bạn không cần học SQL, lập trình? Mấy cái đó chỉ dành cho các công ty nghèo không có tiền mua tool xịn như Power BI, Alteryx…. Còn làm gì có tool làm được hết rồi, cần thì request IT xử lý.
Sự thật là: Tool toy rất tiện và bản thân mình cũng ủng hộ tool nếu có thể. Tuy nhiên tool nào cũng có mặt hạn chế. Thử vào một doanh nghiệp và cần trích xuất dữ liệu trực tiếp với lượng dữ liệu từ vừa đến lớn với logic phức tạp thì SQL sẽ là cứu cánh để bạn triển khai được nhanh, gọn và mạch lạc hơn. Và mình học và làm việc sâu với SQL không phải vì mình “nghèo” mà vì tính phổ biến, khả năng tùy biến của ngôn ngữ và ưu điểm tuyệt đối của nó trong một số hoàn cảnh cụ thể. Ít nhất mình có quyền lựa chọn thay vì chết vì phụ thuộc tool toy.
3. Mình chỉ cần học về tư duy là đủ rồi, chứ công cụ không quan trọng?
Sự thật là:Việc đầu tiên khi người ta học làm bếp là học cầm con dao sơ chế miếng thịt, cá như thế nào. Với một chief có thể nấu được bữa ăn từ bất cứ những công cụ gì họ có trong tay. Họ làm được vì họ từng sử dụng qua rất nhiều công cụ chứ không phải họ chỉ ngồi học lý thuyết về ẩm thực. Trước đây mình đã từng viết 1 bài về Law of the Instrument: “if all you have is a hammer, everything looks like a nail”. Quá trình sử dụng công cụ để giải quyết vấn đề giúp bạn phát triển tư duy, nếu khả năng sử dụng công cụ của bạn bị giới hạn thì rất có thể bạn sẽ dẫn về số 2, phụ thuộc vào một công cụ nào đó vì không còn quyền lựa chọn. Khá hài hước khi tư tưởng coi thường công cụ nhưng xét mặt nào đó lại bị phụ thuộc vào công cụ. :))
4. Ngược lại với 3, mình cần phải giỏi công cụ X, master công cụ Y, công ty không tuyển mình vì mình không giỏi công cụ xyz.
Sự thật là: Thành thạo công cụ là một điểm cộng lớn khi bạn apply công việc, nhất là với các vị trí junior. Tuy nhiên, nếu như bạn đã thành thạo và tạo được sản phẩm bằng một công cụ nào đó, bạn hoàn toàn có thể học công cụ tương đương mà không mất nhiều thời gian. Các nguyên lý và cách sử dụng công cụ, ngôn ngữ lập trình đều tương tự nhau, nếu học hãy tập trung vào một số mảng và thực sự thành thạo nó thay vì đẽo cày giữa đường để gom key word ném vào CV.
5. Mình đã luyện xong 1001 đường tịch tà kiếm phổ, sẵn sàng trở thành siêu nhân trong ngành dữ liệu?
Sự thật là: Bạn có thể chỉ cần thuần Excel vẫn kiếm được công việc chính thức trong ngành dữ liệu với mức lương tính bằng nghìn USD (người thật việc thật). Nhưng đa phần các công việc trong ngành dữ liệu đều cần tìm hiểu thêm rất nhiều thứ khác, tech stack khác với dự án trước đây, domain khác với domain đã biết, nghiệp vụ hoặc luật lá thay đổi. Bạn sẽ tìm hiểu đủ thứ từ marketing đến UI-UX design, human heuristics…. Giữ tư duy mở và thái độ sẵn sàng học bất cứ cái gì công việc yêu cầu. Khả năng học và vận dụng nhanh mới giúp bạn sống sót và phát triển tốt trong ngành này.
6. Làm BI/DA là phải làm dashboard đẹp, kể được câu chuyện về dữ liệu, phải có 1001 nghiêm quy giới luật về information design cần tuân thủ?
Sự thật là: Bạn cần phải làm được những điều trên nhưng chỉ là một phần rất nhỏ trong công việc, nếu bạn tôn thờ nó quá thì nhiều khả năng bạn làm consultant hơn là làm in-house cho doanh nghiệp. Đào bới được dữ liệu xem nó nằm đâu trong hệ thống, thống nhất được với các đơn vị xem dữ liệu nào chính xác đã hộc máu rồi. Nhiều stakeholders chỉ cần một cái pivot table hay chart đơn giản là quá đủ cho nhu cầu của họ. Quan trọng là context và mục đích sử dụng và làm sao tối đa được giá trị cho stakeholders.
Tham khảo bài viết: 5 Lưu ý để trực quan hóa dữ liệu hiệu quả.
Tạm thế đã, các bạn ủng hộ đi rồi mình viết tiếp. :))