Bài 3: Giới thiệu về cấu trúc dữ liệu – Python Panda

Trang chủ » Training » Bài 3: Giới thiệu về cấu trúc dữ liệu – Python Panda
22/02/2022 Training 36 viewed
Pandas làm việc với 3 cấu trúc dữ liệu sau :
  • Series
  • DataFrame
  • Panel
Các cấu trúc dữ liệu này được xây dựng trên mảng Numpy, nên việc xử lý xảy ra rất nhanh.

1. Chiều và mô tả :

Cách tốt nhất để hiểu về các cấu trúc dữ liệu này là cấu trúc dữ liệu có chiều cao hơn là vùng chứa cấu trúc dữ liệu chiều thấp hơn của nó. Ví dụ, DataFrame là vùng chứa của Series, Panel là vùng chứa của DataFrame.
Cấu trúc dữ liệu Chiều Mô tả
Series 1 1 chiều, có thể thay đổi kích thước.
Data Frames 2 Cấu trúc dạng bảng 2 chiều, có thể thay đổi kích thước với các cột được nhập không đồng nhất.
Panel 3 3 chiều , mảng có thể thay đổi kích thước

 

Xây dựng và xử lý mảng hai hoặc nhiều chiều là một công việc tẻ nhạt, người dùng phải cân nhắc hướng của tập dữ liệu khi viết hàm. Nhưng sử dụng cấu trúc dữ liệu Pandas, thì việc xử lý sẽ dễ dàng hơn.
Ví dụ: với dữ liệu dạng bảng (DataFrame), sẽ hữu ích hơn về mặt ngữ nghĩa khi nghĩ đến index (các hàng) và các cột hơn là trục 0 và trục 1.

2. Tính đột biến

Tất cả cấu trúc dữ liệu của Pandas đều có thể thay đổi giá trị và trừ Series tất cả đều có thể thay đổi kích thước. Series có kích thước không đổi
Lưu ý – DataFrame được sử dụng rộng rãi và là một trong những cấu trúc dữ liệu quan trọng nhất. Panel được sử dụng ít hơn nhiều.

3. Series :

Series là một mảng một chiều giống như cấu trúc với dữ liệu đồng nhất. Ví dụ: chuỗi sau là tập hợp các số nguyên 10, 23, 56,…
Điểm chính
  • Dữ liệu đồng nhất
  • Kích thước bất biến
  • Giá trị của dữ liệu có thể thay đổi

4. DataFrame

DataFrame là một mảng hai chiều với dữ liệu không đồng nhất. Ví dụ,
Bảng này đại diện cho dữ liệu nhóm bán hàng của một tổ chức với xếp hạng hiệu suất tổng thể của họ. Dữ liệu được biểu diễn dưới dạng hàng và cột. Mỗi cột đại diện cho một thuộc tính và mỗi hàng đại diện cho một người.

5. Kiểu dữ liệu cột :

Các kiểu dữ liệu của bốn cột như sau:
Điểm chính
  • Dữ liệu đồng nhất
  • Kích thước có thể thay đổi
  • Giá trị của dữ liệu có thể thay đổi

6. Panel

Panel là một cấu trúc dữ liệu ba chiều với dữ liệu không đồng nhất. Thật khó để biểu diễn bảng điều khiển bằng biểu diễn đồ họa. Nhưng một panel có thể được minh họa như một vùng chứa DataFrame.
Điểm chính
  • Dữ liệu đồng nhất
  • Kích thước có thể thay đổi
  • Giá trị của dữ liệu có thể thay đổi
Chia sẻ:
Tags:
TOP HOME