Tài liệu

Tự học nghề Data Analyst theo Roadmap của Maz

Huy Erick

Tiếp nối series về nghề, mình dành bài viết này để chia sẻ về lộ trình và nguồn tự học để trở thành một Data Analyst dựa trên những trải nghiệm của bản thân trong...

Tiếp nối series về nghề, mình dành bài viết này để chia sẻ về lộ trình và nguồn tự học để trở thành một Data Analyst dựa trên những trải nghiệm của bản thân trong hành trình 3 năm vừa qua.

Nếu bạn là người mới đang tìm hiểu về nghề Data Analyst, mình hy vọng bạn hãy dành vài phút để xem qua các công việc thực tế của một DA tại bài viết này. Hoặc có thể tiết kiệm thời gian bằng cách xem hết video bên dưới để hình dung rõ ràng về công việc hằng ngày khi làm Data. Xem xong nhớ LIKE và SUBCRIBE ủng hộ kênh tớ nhé!

Bởi lẽ, lời khuyên chân thành mà Maz muốn gửi gắm đến mọi người (những ai đang tìm hiểu nghề Data và có ý định chuyển đến ngành này), hãy tìm đọc và hiểu thật kĩ giá trị cốt lõi của người phân tích dữ liệu là gì, công việc cụ thể ra sao? Sau đó tự hỏi bản thân, mình có thật sự thích thú với nghề data, vị trí mong muốn trong lĩnh vực này là gì? Điều gì ở bạn phù hợp với sự lựa chọn này? Nếu câu trả lời dứt khoát và rõ ràng hết các vấn đề, Maz tin bạn sẽ đạt được mục tiêu của mình sớm thôi.

Rèn luyện các kĩ năng và kiến thức về nghề Data Analyst

4 - 6 tháng là con số ước lượng mà mình nghĩ mọi người hoàn toàn có thể thực hiện được nếu như thật sự quyết tâm và nghiêm túc. Tuy nhiên, học sao cho đúng, cái gì đầu tư học tốt, học sâu? Để trả lời câu này thì việc đầu tiên cần làm là bạn phải hiểu đúng bản chất và vai trò của Data Analyst.

Ngẫm lại vai trò của Data Analyst: là người tìm ra insights thông qua những con số giúp business tạo ra những quyết định có cơ sở, cải thiện tình hình doanh nghiệp và chất lượng sản phẩm. Như vậy người DA phải có năng lực thực hiện được công việc ở các giai đoạn: từ preparation - exploratory - modeling - communication. Ở đây mình chia sẻ chi tiết các nội dung cần học trong Roadmap trên theo từng giai đoạn + nguồn tài liệu kèm theo để mọi người có thể dễ dàng hình dung được các kiến thức và kĩ năng sẽ áp dụng vào các công việc làm phân tích ra sao:

I. Cần gì để làm tốt Data Preparation?

Có 2 yêu cầu cần một DA đạt được ở giai đoạn này:

  1. Hiểu được kiến thức tổng quan về cơ sở dữ liệu, đặc biệt là Relational database, schema, table, constraints.

  2. Thực hiện được việc querying, transforming, profiling dữ liệu từ database: Có thể dùng SQL hoặc Python.

    • SQL: Bạn cần nắm bắt được các phần chính sau đây:
      • Hiểu được ngôn ngữ SQL có thể được thao tác trên nhiều tools/ platforms (SQL Sever Management Studio, Google BigQuery, ...) và nền tảng khác (Redash, Metabase, Superset, ...) tùy thuộc vào mỗi công ty đang sử dụng cái nào.
      • Thành thạo các câu lệnh SQL mà Data Analyst thường sử dụng: Select + From statement, Where statement, Group By + Window function, Join function.
    • Python: Dùng ở giai đoạn này cần nắm bắt các concepts sau:
      • Read and write text files, Microsoft Excel files.
      • Work with JSON.
      • Làm quen với thư viện Numpy và Pandas để có thể làm data wrangling: Xử lý missing values, Cleaning & formatting data, Merge, concatenate, combining data frames, pivoting, mapping, replace, group by.
    • Sources: Sách "Python numpy tutorial", "Pandas Tutorial (Data Analysis In Python)"

II. Data exploratory là tiêu điểm

Trong giai đoạn này, mục tiêu chính của bạn là "khai phá" ý nghĩa của data để đưa ra insights. Vì thế bạn cần có sự kết hợp hài hòa giữa domain knowledge + statistical techniques + visualization skills + problem-solving strategies.

  1. Trau dồi problem-solving skill và domain knowledge

    • Khi bạn đủ hiểu về mảng công việc mình đang làm (marketing, risk, finance, ...), bạn sẽ có đủ kiến thức và kinh nghiệm để biết rõ từng chỉ số, các root causes có thể xảy ra đối với bài toán bạn đang giải quyết. Khi đã hiểu rõ rồi thì việc giải quyết như thế nào đầy tính logic, có hệ thống để đảm bảo không bỏ sót các khía cạnh của vấn đề, problem-solving skill sẽ giúp bạn chuyện này.
    • DOMAIN KNOWLEDGE: Tập trung vào một lĩnh vực mà mình đang theo đuổi hoặc vị trí hiện tại đang làm việc để bắt đầu đào sâu. Trong quá trình làm việc và tìm hiểu thêm, mình có tổng hợp lại một số nguồn tham khảo: Gary Fox - strategy and innovation consultant, Books về Marketing Analytics, Product Analytics.
    • PROBLEM SOLVING: Đọc sách "Problem Solving 101", "The one skill that changes everything" để nắm bắt phương pháp giải quyết vấn đề và tư duy logic.
  2. Áp dụng Statistics

  3. Dùng BI tools (Data visualization tools) cũng làm được EDA

  4. Python - là ngôn ngữ hiện tại mình dùng làm EDA mỗi ngày

III. Modeling & Evaluation

Với mình, công việc áp dụng các mô hình thuật toán vào phân tích để giải quyết cho Predictive Analytics đòi hỏi sự am hiểu và thực hành tốt Machine Learning. Tuy nhiên, input của các model Machine Learning thường là các features được tìm ra từ bước descriptive và diagnostic analytics. Điều này có nghĩa, bạn phải thực sự hiểu bài toán, vấn đề đang giải quyết, làm EDA sâu sắc để có thể tạo ra input cho bước modeling.

  • Highly recommend khóa ML bất hủ của Andrew Ng.

IV. Communication of insights

90% thời gian DA sẽ dành để làm việc với dữ liệu, ước chừng chỉ 10% còn lại được dùng để giao tiếp và trình bày kết quả mình làm ra với đối tác và sếp. Nhưng mà, 10% lại quyết định thành công hay thất bại của 90% công sức. Vì thế communication và presentation skills là những kĩ năng tuyệt đối người DA không thể lơ là.

  • 3 Tips giúp mình thực hiện communication of insights xịn hơn:
    • Luôn nhớ Data Storytelling là vô cùng quan trọng.
    • Focus on my audiences.
    • Trước khi làm slide deck hay thuyết trình, hãy đặt mình vào vị trí là audience để tìm ra một bố cục và mạch câu chuyện tốt nhất để thể hiện.

V. Xây dựng Portfolio and Resume

Đây là bước cuối cùng mà mình cần phải làm từ nay và cả về sau cho sự nghiệp. Trong suốt quá trình trau dồi các kiến thức và kĩ năng ở trên, bạn đều thực hành với dữ liệu thực tế. Vì thế hãy dùng chúng tạo nên một "hồ sơ năng lực" xịn xò hơn mỗi ngày.

Kết

Học gì trước, gì sau? Mình đã chia sẻ kinh nghiệm đúc kết của 3 năm qua trong Roadmap 4 tháng này. Đồng thời ở mỗi topics mình cũng đã nói chi tiết các key points trong công việc của một Data Analyst mà mình cần đầu tư lĩnh hội.

Maz không phải là một chuyên gia xuất sắc trong lĩnh vực data, nhưng Maz biết hành trình đến với nghề Data Analyst lắm gian truân đến nhường nào. Hi vọng câu chuyện của mình sẽ giúp các bạn rút ngắn được thời gian trên con đường bước chân vào nghề phân tích dữ liệu. Nếu thấy hữu ích, giúp mình chia sẻ với mọi người nhe.

Đôi lời tâm sự: Trong các bài viết trước, Maz nhận được rất nhiều câu hỏi mà các bạn nhắn gửi. Một trong những lời nhắn nhủ là Maz hãy ra bài viết thường xuyên hơn. Maz rất vui vì nhận được sự quan tâm của mọi người, nhưng bản thân Maz tâm niệm rằng, việc chia sẻ các nội dung liên quan đến kiến thức thì mình phải thật sự cẩn trọng và kĩ lưỡng để hạn chế những sai sót hết mức có thể. Vì thế tần suất ra blog mới có hơi lâu nhưng hi vọng vẫn mang lại những nội dung chất lượng với mọi người.

Follow Maz tại đây để cùng cập nhật thông báo mỗi khi có bài viết mới nhé:

  • Fanpage: Maz học Data & Lucas học Product
  • Cộng đồng Cùng Maz học Data
  • Linkedin
  • Facebook
  • TikTok

Mọi thông tin trên blog đều thuộc bản quyền của blog Maz Nguyen. Vui lòng đọc kĩ Copyright Notice trước khi copy hoặc đăng tải lại nội dung/hình ảnh của bài viết.

1