CSV (Comma Separated Values) hay giá trị được phân tách bằng dấu phẩy là một định dạng tệp đơn giản được sử dụng để lưu trữ dữ liệu dạng bảng. Tệp CSV lưu trữ dữ liệu ở dạng văn bản thuần túy, mỗi dòng của tệp là một bản ghi dữ liệu và mỗi bản ghi bao gồm một hoặc nhiều trường, được phân tách bằng dấu phẩy. Trong Python, chúng ta có mô-đun csv
để làm việc với tệp CSV.
Cách đọc tệp CSV trong Python
Để đọc tệp CSV trong Python, chúng ta có thể sử dụng mô-đun csv
có sẵn. Dưới đây là một ví dụ về cách đọc tệp CSV trong Python:
import csv
filename = "aapl.csv"
fields = []
rows = []
with open(filename, 'r') as csvfile:
csvreader = csv.reader(csvfile)
fields = next(csvreader)
for row in csvreader:
rows.append(row)
print("Tổng số dòng: %d" % (csvreader.line_num))
print('Các trường dữ liệu:' + ', '.join(field for field in fields))
print('Các dòng đầu tiên:')
for row in rows[:5]:
for col in row:
print("%10s" % col, end=' ')
print('\n')
Cách tạo một tệp CSV trong Python
Một tệp CSV gồm 3 phần:
- Phần đầu tiên: tương ứng với cột đầu tiên trong bảng tính, biểu thị tên của các cột, mỗi cột được ngăn cách với nhau bởi dấu phẩy.
- Phần thứ hai: tương ứng với cột cuối cùng trong bảng tính.
- Phần thứ ba: bao gồm các dòng có cấu trúc tương đương nhau, tương ứng với nội dung của các cột giá trị trong bảng tính.
Cách đọc tệp CSV trong Python
Có nhiều cách khác nhau để đọc tệp CSV trong Python, bao gồm sử dụng mô-đun csv
và thư viện pandas
. Lựa chọn phụ thuộc vào nhu cầu của bạn.
-
Sử dụng mô-đun
csv
: Mô-đun CSV trong Python cung cấp các lớp để đọc và ghi thông tin dạng bảng ở định dạng tệp CSV. -
Sử dụng thư viện
pandas
: Thư viện pandas cung cấp các cấu trúc dữ liệu thuận tiện và các công cụ phân tích dữ liệu cho lập trình Python.
Dưới đây là một ví dụ về cách đọc tệp CSV trong Python sử dụng mô-đun csv
:
import csv
with open('Giants.csv', mode='r') as file:
csvFile = csv.reader(file)
for lines in csvFile:
print(lines)
Dưới đây là một ví dụ về cách đọc tệp CSV trong Python sử dụng lớp csv.DictReader
:
import csv
with open('Giants.csv', mode='r') as file:
csvFile = csv.DictReader(file)
for lines in csvFile:
print(lines)
Dưới đây là một ví dụ về cách đọc tệp CSV trong Python sử dụng thư viện pandas
:
import pandas as pd
csvFile = pd.read_csv('Giants.csv')
print(csvFile)
Kết luận: Bài viết này đã giới thiệu cho bạn về tệp CSV trong Python và những cách để làm việc với nó. Hi vọng thông tin này sẽ hữu ích cho bạn trong quá trình học lập trình. Đừng ngần ngại tìm hiểu thêm về ngôn ngữ lập trình thông qua các khóa học lập trình tại T3H!
Nguồn tham khảo: geeksforgeeks