Tổng Quan Về Thư Viện Numpy Trong Python

Thư viện NumPy

Như các bạn đã biết có khá nhiều thư viện hỗ trợ Python, trong đó thư viện NumPy được xem là thứ mà người dùng phải làm việc thường xuyên trong xuyêt suốt các dự án của họ. Để nắm được thông tin và hiểu được cách thực vận hành của thư viện này, xin mời các bạn theo dõi những thông tin quan trọng bên dưới.

Thư viện NumPy trong Python là gì?

NumPy (Numerical Python) được hiểu nôm na là một thư viện mã nguồn mở trong Python. Nói cách khác, nó sẽ hỗ trợ những công cụ nhằm phục vụ cho quá trình xử lý dữ liệu số và những phép tính liên quan.

Về bản chất, NumPy sẽ đưa ra tập hợp nhiều đối tượng nhằm tượng trưng cho những mảng dữ liệu số đa chiều tương ứng với những phương thức để thực thi những phép toán ứng với những mảng này.

Nói tóm lại, NumPy được xem là một trong số những thư viện khá quen thuộc trong ngôn ngữ Python cũng như tính thịnh hành trong hầu hết những ứng dụng trong lĩnh vực máy tính.

Thư viện NumPy trong Python
Hình 1. Thư viện NumPy trong Python

Tính năng chính của NumPy

Bên cạnh việc nắm rõ những thông tin liên quan đến thư viện NumPy, các bạn cũng cần biết thêm các tính năng chính của NumPy.

– Hỗ trợ mang đến mảng đa chiều cho một đối tượng kèm theo lưu trữ dữ liệu số đa năng hơn với cấu trúc dữ liệu tích hợp trong chương trình.

– Mang đến những phép toán số học cũng như hình học ở trên mảng kể cả phép toán thực hiện ở mảng hay trên những trục riêng biệt của mảng.

– Giúp tạo mảng ngẫu nhiên kèm theo thao tác trên mảng tương ứng với những phần tử bất kỳ.

– Phục vụ tính toán đại số và kiểm tra dữ liệu.

Lý do bạn phải dùng thư viện NumPy trong Python

Đối với ngôn ngữ Python, người dùng hầu hết phải xử lý trên mảng là list. Tuy nhiên, ai cũng biết tốc độ trên list là kém hiệu quả và lâu hơn khi dùng thư viện NumPy. Cũng chính vì vậy, những mảng hay ma trận trong ngành dữ liệu sẽ cần phải dùng thư viện Numpy để tối ưu chương trình.

Dùng thư viện Numpy trong mảng
Hình 2. Dùng thư viện Numpy trong mảng

Làm sao để cài đặt NumPy?

Phần này sẽ giúp cho các bạn hiểu thêm về quá trình cài đặt NumPy. Trên thực tế, người dùng cần tiếp cận và sử dụng trình quản lý package của Python (PIP) thông qua những bước cơ bản bên dưới:

1. Việc trước tiên cần làm là mở terminal/command prompt. Sau đó, chạy lệnh bên dưới để nâng phiên bản pip lên phiên bản mới nhất.

pip install --upgrade pip

2. Tiếp theo, chúng ta cần chạy lệnh để cài NumPy nhé.

pip install numpy

Khi bạn cần cài đặt phiên bản NumPy bất kỳ, chúng tôi khuyên hãy thêm số phiên bản tương ứng vào cuối câu lệnh.

pip install numpy==1.20.3

Một điều phải ghi nhớ là NumPy sẽ ra thông báo cần bạn cài phiên bản Python từ 3.7 trở lên để làm việc. Do đó, người dùng bắt buộc phải cập nhật lên phiên bản Python mới nhất để sử dụng thư viện NumPy.

Các kiểu dữ liệu trong NumPy

Những kiểu dữ liệu có thể được dùng để đại diện tương ứng với những giá trị nằm trong mảng đa chiều trong thư viện NumPy. Những kiểu dữ liệu này thường tồn tại ở hai dạng phổ biến gồm: kiểu không số và kiểu số.

1. Kiểu không số

– Boolean: kiểu dữ liệu này tượng trưng cho những giá trị “True” hay “False”.

– String: đại diện cho những chuỗi ký tự và cho kiểu dữ liệu str

– Object: tượng trưng cho những đối tượng trong Python.

2. Kiểu số

– Integer: kiểu số nguyên, và được tượng trưng cho những kiểu dữ liệu như int16, int32,int3…

– Floating-point: kiểu số thực và thường được tượng trưng bởi những kiểu dữ liệu gồm float16, và float64.

– Complex: kiểu số phức và đại diện cho nhiều kiểu dữ liệu: complex128 hay complex64.

Kiểu dữ liệu dạng số trong thư viện NumPy
Hình 3. Kiểu dữ liệu dạng số trong thư viện NumPy

Sau đây, xin mời các bạn tham khảo ví dụ tạo những kiểu dữ liệu trong NumPy.

import numpy as np

# Kiểu số

arr_int = np.array([1, 2, 3], dtype=np.int32)

arr_float = np.array([1.0, 2.0, 3.0], dtype=np.float32)

arr_complex = np.array([1+2j, 3+4j], dtype=np.complex64)

# Kiểu không số

arr_bool = np.array([True, False, True], dtype=np.bool)

arr_str = np.array(['hello', 'world'], dtype=np.str)

arr_obj = np.array([{'name': 'John'}, {'name': 'Alice'}], dtype=np.object)

Thế nào là mảng trong Numpy?

Mảng (Array) là một đối tượng cơ bản trong NumPy. Nó là một cấu trúc dữ liệu đa chiều thường được dùng để lưu trữ những giá trị có cùng một kiểu dữ liệu. Thực tế cho thấy mảng NumPy thường tồn tại ở một chiều hay đa chiều và phụ thuộc vào mục đích của lập trình viên.

Để hỗ trợ các bạn hiểu thêm về chúng, chúng tôi xin trình bày ví dụ về mảng một chiều.

Ví dụ 1:

import numpy as np

arr = np.array([1, 2, 3, 4, 5])

print(arr)

Kết quả:

[1 2 3 4 5]

Tiếp theo, các bạn cũng nên quan tâm đến một mảng hai chiều và cách tạo ra nó.

Ví dụ 2:

import numpy as np

arr = np.array([[1, 2, 3], [4, 5, 6]])

print(arr)

Kết quả:

[[1 2 3] [4 5 6]]

Có thể nói NumPy mang đến khá nhiều hàm cũng như phương thức để phục vụ cho việc tạo, sử dụng, điều chỉnh, cập nhật và kể cả việc tính toán trên mảng. Từ đó, hỗ trợ cho các bạn xử lý dữ liệu nhanh chóng và hiệu quả.

Array Indexing của NumPy trong Python

Các bạn có thể dùng những chỉ số (index) trên mảng để truy xuất những phần tử trong mảng của NumPy trong Python. Lúc này, những chỉ số tương ứng trên phần tử trong mảng sẽ bắt đầu từ 0.

Ví dụ:

import numpy as np

arr = np.array([1, 2, 3, 4, 5])

print(arr[0]) # Output: 1

Người dùng hoàn toàn có thể truy xuất một phần của mảng thông qua việc chỉ định những chỉ số bắt đầu hay kết thúc trên một khoảng giá trị (slice). Nói cách khác, chúng ta muốn truy xuất phần tử bất kỳ từ thứ hai đến thứ tư trên mảng, hãy dùng Slice nhé.

import numpy as np

arr = np.array([1, 2, 3, 4, 5])

print(arr[1:4]) # Output: [2 3 4]

Những chỉ số và slice hoàn toàn được dùng cho những mảng đa chiều. Khi xét đến nó, chỉ việc dùng những chỉ số hay slice phù hợp với mỗi chiều của mảng.

import numpy as np

arr = np.array([[1, 2, 3], [4, 5, 6]])

print(arr[0, 1]) # Output: 2

print(arr[:, 1:3]) # Output: [[2 3]

# [5 6]]

Từ ví dụ có thể thấy được người dùng hoàn toàn có thể truy xuất phần tử trên hàng đầu tiên cũng như cột hai thông qua việc dùng chỉ số [0,1]. Ngoài ra, truy xuất một phần trên mảng thông qua Slice mà “:” sẽ thể hiện những phần tử trên chính chiều đó. Vì vậy, slice [:, 1:3] có thể được truy xuất những phần tử ở cột thứ hai và ba trên toàn bộ những hàng trên mảng.

Lời kết

NumPy được ví như một thư viện khá phổ biến trong ngôn ngữ Python. Nói cách khác, thư viện NumPy hỗ trợ người dùng làm việc nhanh chóng và thuận tiện đối với ma trận cũng như mảng. Nó phù hợp với dữ liệu ma trận kèm theo mảng lớn ứng với tốc độ xử lý như vũ bão so với việc dùng Python đơn thuần.

Một lần nữa, xin cám ơn quý vị đọc giả đã quan tâm và theo dõi bài viết. Chúng tôi hy vọng sẽ nhận được đóng góp từ các bạn trong thời gian tới.

Rate this post

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *