tutorial-string

Sử dụng Iterator trong Python

logo 1024 22

Trong lập trình nói chung và Python nói riêng, việc làm việc và xử lý mảng luôn là điều không thể thiếu trong khi làm việc với dữ liệu. Đi kèm với nhu cầu đó, trong mỗi ngôn ngữ thường sẽ có những hàm, phương thức, đối tượng… cho phép làm việc với mảng một cách hiệu quả, nhanh chóng và tối ưu. Ở đây, chúng ta có Iterator trong Python, với chức năng chính là để xử lý mảng, Iterator hỗ trợ chúng ta truy cập vào từng phần tử trong mảng. Sau đây, chúng ta sẽ cùng nhau khám phá cách hoạt động của Iterator cũng như cách sử dụng Iterator trong Python.

1. Iterator là gì?

Trong Python, đối tượng Iterator hỗ trợ chúng ta duyệt qua từng phần tử của một tập hợp (list, tuple, dictionary, set,…) một cách tuần tự mà không cần quan tâm rằng cấu trúc bên trong nó là như thế nào. Khi làm việc với Iterator chúng ta sẽ thường xuyên sử dụng nhiều nhất là hai phương thức:

  • __iter__(): Phương thức này trả về chính đối tượng iterator.
  • __next__(): Phương thức này trả về phần tử tiếp theo trong tập hợp và nâng cấp vị trí con trỏ.

Khi ta sử dụng vòng lặp for hoặc hàm next(), Python sẽ tự động tạo một Iterator và duyệt qua từng phần tử một cách tuần tự.

2. Ví dụ về Iterator

Chúng ta cùng nhau xem một ví dụ đơn giản sau đây:

lst = [1, 2, 3, 4, 5]
iterator = iter(lst)
print(next(iterator))  # Output: 1
print(next(iterator))  # Output: 2
print(next(iterator))  # Output: 3

Như bạn có thể thấy, chúng ta đã tạo một iterator từ danh sách lst và sử dụng hàm next() để lấy từng phần tử một từ iterator.

>>> Xem thêm bài viết:

3. Lặp tuple với Iterator trong Python

Cũng tương tự, không riêng gì danh sách chúng ta có thể sử dụng iterator để duyệt qua từng phần tử của một tuple.

tuple = (1, 2, 3, 4, 5)
iterator = iter(tuple)
for i in iterator:
    print(i)

4. Lặp chuỗi với Iterator trong Python

Ở đây, không loại trừ chuỗi chúng ta cũng có thể sử dụng Iterator để lặp qua từng ký tự trong nó.

string = "Hello, Python"
iterator = iter(string)
for char in iterator:
    print(char)

5. Sử dụng Iterator trong vòng lặp

Trong tất cả các cách sử dụng, việc sử dụng Iterator trong vòng lặp for là một cách không thể không nói đến. Với vòng lặp for, chúng ta sẽ không cần quản lý con trỏ của iterator, việc này sẽ được Python tự động quản lý giúp cho chúng ta có thể xử lý mọi thứ dễ dàng hơn.

list = [1, 2, 3, 4, 5]
for i in list:
    print(i)

6. Tạo Iterator tự định nghĩa

Trong Python, chúng ta hoàn toàn có thể tạo ra các iterator tự định nghĩa bằng hai phương thức __iter__()__next__(). Chúng ta sẽ cùng nhau tìm hiểu về cách chúng ta có thể tạo ra một iterator tự định nghĩa để duyệt qua các số chẵn từ 0 đến một giới hạn cụ thể.

class EvenNumbers:
    def __init__(self, limit):
        self.limit = limit
        self.current = 0
    def __iter__(self):
        return self
    def __next__(self):
        if self.current <= self.limit:
            result = self.current
            self.current += 2
            return result
        else:
            raise StopIteration
even_numbers = EvenNumbers(10)
for num in even_numbers:
    print(num)

7. Sử dụng Iterator với các tình huống nâng cao

Những ví dụ trên là những ví dụ rất cơ bản khi làm việc với Iterator, ngoài ra Iterator còn cung cấp cho chúng ta rất nhiều cách xử lý rất hay ho, đồng thời cũng có khả năng làm tăng hiệu suất xử lý của hệ thống so với những cách thông thường. Sau đây, chúng ta sẽ cùng nhau tìm hiểu một số tình huống nâng cao thường được sử dụng Iterator:

7.1. Sử dụng Iterator với tập tin

Khi làm việc với tập tin hoặc các dữ liệu lớn, thông thường chúng ta sẽ đọc toàn bộ dữ liệu trong một lần. Với việc này, nó dễ dàng khiến cho hệ thống bị chậm do phải xử lý một lượng dữ liệu quá lớn cùng một lúc. Giải pháp được đưa ra trong ví dụ này đó là sử dụng Iterator để đọc từng dòng. Việc này sẽ giúp cho hệ thống tiết kiệm bộ nhớ hơn và việc xử lý những dữ liệu lớn trở nên hiệu quả hơn.

Chúng ta cùng nhau quan sát đoạn mã trong ví dụ sau:

with open('file.txt') as file:
    for line in file:
        # Xử lý từng dòng trong tập tin mà không cần đọc toàn bộ tập tin vào bộ nhớ
        process_line(line)

7.2. Sử dụng itertools để xử lý dữ liệu nâng cao

Ở đây ta nhắc đến itertools trong Python, nó là một thư viện cung cấp cho chúng ta nhiều công cụ mạnh mẽ hơn để dễ dàng làm việc với Iterator đồng thời ta cũng sẽ dễ dàng tạo ra những iterator phức tạp hơn với thư viện itertools.

  • itertools.chain(): Kết hợp nhiều iterator thành một.
  • itertools.islice(): Trích xuất một phần của iterator.
  • itertools.cycle(): Lặp lại vô hạn một iterator.
  • itertools.groupby(): Nhóm các phần tử của iterator dựa trên một điều kiện.

Chúng ta có thể quan sát qua ví dụ như sau:

import itertools
data = [1, 2, 3, 4, 5, 6, 7, 8, 9]
# Sử dụng itertools.islice() để trích xuất phần tử từ 2 đến 6
subset = itertools.islice(data, 2, 7)
for item in subset:
    print(item)

Tổng kết

Iterator trong Python là một công cụ mạnh mẽ cho phép bạn duyệt qua từng phần tử của một tập hợp một cách linh hoạt và hiệu quả. Bài viết này đã giới thiệu bạn về cách iterator hoạt động và cách sử dụng chúng trong Python, bao gồm cả việc lặp qua tuple và chuỗi. Bạn có thể sử dụng iterator mặc định với các tập hợp có sẵn hoặc tạo ra các iterator tự định nghĩa cho nhu cầu cụ thể của bạn.


Cộng Đồng Linux là giải pháp cung cấp các tính năng giao tiếp như gọi thoại, gọi video, tin nhắn chat, SMS hay tổng đài CSKH cho phép tích hợp trực tiếp vào ứng dụng/website của doanh nghiệp nhanh chóng. Nhờ đó giúp tiết kiệm đến 80% thời gian và chi phí cho doanh nghiệp bởi thông thường nếu tự phát triển các tính năng này có thể mất từ 1 – 3 năm.

Bộ API giao tiếp của hiện đang được tin dùng bởi các doanh nghiệp ở mọi quy mô, lĩnh vực ngành nghề như TPBank, VOVBacsi24, VNDirect, Shinhan Finance, Ahamove, Logivan, Homedy,  Adavigo, bTaskee…

Quý bạn đọc quan tâm xin mời đăng ký bài viết mới:

logo 1024 22

Đăng ký liền tay Nhận Ngay Bài Mới

Subscribe ngay

Cám ơn bạn đã đăng ký !

Lỗi đăng ký !

Add Comment

Click here to post a comment

Đăng ký liền tay
Nhận Ngay Bài Mới

Subscribe ngay

Cám ơn bạn đã đăng ký !

Lỗi đăng ký !