“Một bức ảnh đáng giá ngàn lời nói”. Trong dữ liệu, một biểu đồ chuẩn có thể giúp sếp của bạn đưa ra quyết định chỉ trong vài giây, thay vì phải đọc hàng chục bảng Excel khô khan. Hôm nay, chúng ta sẽ làm quen với Matplotlib — “ông tổ” của các thư viện đồ họa trong Python.
1️⃣ Biểu Đồ Đường (Line Plot) & Cột (Bar Chart)
Đây là hai loại biểu đồ phổ biến nhất trong kinh doanh để theo dõi xu hướng và so sánh các nhóm dữ liệu.
- Line Plot: Tuyệt vời để theo dõi sự thay đổi theo thời gian (ví dụ: Doanh thu theo tháng).
- Bar Chart: Dùng để so sánh các hạng mục (ví dụ: Doanh số giữa các phòng ban).
import matplotlib.pyplot as plt
# Biểu đồ đường cơ bản
months = ['Jan', 'Feb', 'Mar', 'Apr']
sales = [100, 150, 120, 200]
plt.plot(months, sales, marker='o', color='blue')
plt.title("Doanh thu 4 tháng đầu năm")
plt.xlabel("Tháng")
plt.ylabel("Triệu VNĐ")
plt.show()
2️⃣ Biểu Đồ Phân Phối (Histogram)
Nếu bạn muốn biết: “Khách hàng của tôi chủ yếu nằm ở độ tuổi nào?”, Histogram là câu trả lời. Nó giúp bạn thấy được mật độ phân bố của dữ liệu.
ages = [20, 21, 25, 25, 25, 30, 32, 40, 45, 50]
plt.hist(ages, bins=5, color='green', edgecolor='black')
plt.title("Phân bổ độ tuổi khách hàng")
plt.show()
3️⃣ Biểu Đồ Phân Tán (Scatter Plot)
Giúp tìm ra mối quan hệ giữa hai biến số. Ví dụ: Cửa hàng có diện tích càng lớn thì doanh thu có thực sự cao hơn không?
TỔNG KẾT BUỔI 10
Matplotlib cung cấp cho bạn quyền kiểm soát tuyệt đối đến từng chi tiết nhỏ nhất của biểu đồ. Tuy nhiên, nó hơi “tốn code” một chút. Đừng lo, ở buổi tiếp theo chúng ta sẽ học Seaborn — thư viện giúp bạn vẽ biểu đồ đẹp lung linh chỉ với 1-2 dòng mã!
🎨 Nghệ thuật thị giác dữ liệu tại: Hướng nghiệp Python – Data Analysis