Câu chuyện cho bài viết lần này xuất phát từ trải nghiệm cá nhân của mình trong quá trình trở thành Data Analyst. Thường thì mọi người khuyên bắt đầu học phân tích dữ liệu từ SQL, tuy nhiên mình lại bắt đầu với các BI tools như Power BI và Tableau. Sau đó, khi làm việc ở công ty mới, mình thực hành với Python nhưng không động đến SQL. Tuy nhiên, sau một thời gian, mình nhận ra rằng điều này không hoàn toàn sai, chỉ là việc học của mình không có một quy trình bài bản. Điều này dẫn đến việc mình thiếu kiến thức và kỹ năng quan trọng trong quá trình làm phân tích dữ liệu. Từ kinh nghiệm đó, lộ trình tự học để trở thành một Data Analyst sẽ là con đường chỉ dẫn cho những ai đang bắt đầu.
Bài viết này bao gồm các nội dung sau:
Hiểu về SQL?
SQL (Structured Query Language) là ngôn ngữ truy vấn có cấu trúc, cho phép truy cập và tương tác với cơ sở dữ liệu để tạo, xóa, sửa đổi và trích xuất dữ liệu.
Các biến thể SQL
SQL là ngôn ngữ tiêu chuẩn cho các hệ cơ sở dữ liệu quan hệ. Các hệ thống quản trị cơ sở dữ liệu như MySQL, MS Access, Oracle, Sybase, Informix, Postgres và SQL Server đều sử dụng SQL làm ngôn ngữ cơ sở dữ liệu tiêu chuẩn. Mỗi hệ thống có các biến thể riêng để phù hợp với tính chất của từng nền tảng. Mặc dù có sự khác nhau nhưng tất cả đều tuân theo tiêu chuẩn được quy định bởi American National Standards Institute (ANSI).
SQL được sử dụng trong giai đoạn chuẩn bị dữ liệu, truy vấn data và thao tác với data trong quy trình phân tích dữ liệu.
Vai trò của SQL trong công việc phân tích dữ liệu
SQL đóng vai trò quan trọng trong giai đoạn chuẩn bị dữ liệu. Nếu không có truy xuất và làm sạch dữ liệu bằng SQL, các bước tiếp theo không thể được thực hiện. SQL còn được sử dụng để xây dựng các bảng dữ liệu tinh gọn, lưu trữ trong data warehouse và sử dụng trong các công cụ BI như Power BI và Tableau để tạo ra các bảng và biểu đồ.
SQL cũng đóng vai trò trong công việc hàng ngày của một Data Analyst. Đối với việc tạo dashboard, SQL giúp tạo ra các bảng dữ liệu tinh gọn để sau đó trực quan hóa trên các công cụ BI. SQL cũng được sử dụng trong các báo cáo và phân tích ngắn hạn, nhanh chóng để đáp ứng nhu cầu cấp thiết.
SQL sẽ phổ biến như sự thịnh hành của Excel?
Excel là công cụ phổ biến nhất trong công việc hiện tại. SQL cũng sẽ trở thành công cụ không thể thiếu trong công việc của một Data Analyst. Không chỉ có DA và BI, nhiều vị trí khác như marketing analyst, finance analyst, risk analyst và cả HR cũng cần sử dụng SQL để truy xuất dữ liệu và thực hiện phân tích. Hiện tại, kĩ năng SQL được xem là một điểm cộng, tuy nhiên, trong tương lai, nó sẽ trở thành một yêu cầu giống như việc giỏi Microsoft Office.
Học SQL - Đủ cho nhu cầu công việc
Để học SQL hiệu quả, cần nắm bắt các khái niệm cốt lõi, tập trung vào nhóm lệnh truy vấn (DQL) và hiểu thứ tự thực hiện các lệnh trong SQL.
Nắm bắt các khái niệm cốt lõi
Nắm bắt các khái niệm cốt lõi của SQL như các biến thể SQL, database, schema, table, columns & rows, constraints.
Chú trọng nhóm lệnh truy vấn (DQL)
Nhóm lệnh truy vấn (DQL) là nhóm lệnh mà người làm phân tích sử dụng nhiều nhất. Các câu lệnh truy vấn bao gồm SELECT, FROM, WHERE, GROUP BY, ORDER BY, HAVING. Ngoài ra, cần phải nắm vững các phép ghép bảng dữ liệu, hàm tính toán có sẵn, truy vấn trên bảng phụ.
Tư duy logic và hiểu thứ tự thực hiện các lệnh trong SQL
Việc học SQL không chỉ đòi hỏi việc nhớ câu lệnh, mà còn cần tư duy logic và khả năng giải quyết vấn đề. Hiểu thứ tự thực hiện các lệnh trong mệnh đề truy vấn là điều quan trọng. Thứ tự thực hiện các lệnh trong SQL là: FROM -> WHERE -> GROUP BY -> HAVING -> SELECT -> ORDER BY -> LIMIT.
Nguồn tự học SQL
Có nhiều nguồn tự học SQL như các video hướng dẫn của Alex The Analyst, HackerRank, W3schools.
Cảm ơn vì đã đọc bài viết này. Chúc bạn học tốt SQL!
Kết nối với mình:
- LinkedIn: https://www.linkedin.com/in/ntrunghieu/
- Facebook Group: https://www.facebook.com/groups/mazhocdata
- Fanpage: Maz học Data & Lucas học Product
- Tiktok: https://www.tiktok.com/@mazhocdata
Mọi thông tin trong bài viết thuộc bản quyền của blog Maz Nguyen. Vui lòng đọc kĩ Copyright Notice trước khi sao chép hoặc đăng tải lại nội dung/hình ảnh của bài viết.