Trong Python, mô-đun re
(Regular Expressions) cung cấp nhiều phương thức hữu ích để làm việc với các biểu thức chính quy. Dưới đây là giải thích chi tiết về ba phương thức split()
, sub()
, và subn()
của mô-đun re
.
split()
Phương thức re.split()
được sử dụng để tách một chuỗi thành một danh sách các chuỗi con, sử dụng một biểu thức chính quy làm dấu phân cách.
re.split(pattern, string, maxsplit=0, flags=0)
import re text = "Python is great; Java is good; C++ is okay" result = re.split(r';s*', text) # Tách bằng dấu chấm phẩy và khoảng trắng tùy chọn print(result)
Kết quả:
['Python is great', 'Java is good', 'C++ is okay']
sub()
Phương thức re.sub()
được sử dụng để thay thế tất cả các mẫu khớp với biểu thức chính quy bằng một chuỗi khác.
re.sub(pattern, repl, string, count=0, flags=0)
import re text = "I like cats and dogs." result = re.sub(r'cats|dogs', 'pets', text) # Thay thế "cats" và "dogs" bằng "pets" print(result)
Kết quả:
I like pets and pets.
subn()
Phương thức re.subn()
tương tự như sub()
, nhưng nó không chỉ trả về chuỗi đã thay thế mà còn trả về một tuple chứa số lần thay thế đã được thực hiện.
re.subn(pattern, repl, string, count=0, flags=0)
import re text = "I like apples and oranges." result, count = re.subn(r'apples|oranges', 'fruits', text) # Thay thế và đếm số lần thay thế print(result) # Chuỗi đã thay thế print(count) # Số lần thay thế
Kết quả:
I like fruits and fruits. 2
split()
: Tách một chuỗi thành danh sách bằng cách sử dụng biểu thức chính quy làm dấu phân cách.sub()
: Thay thế tất cả các mẫu khớp với biểu thức chính quy bằng một chuỗi khác.subn()
: Tương tự như sub()
, nhưng trả về một tuple chứa chuỗi đã thay thế và số lần thay thế đã được thực hiện.Các phương thức này là những công cụ mạnh mẽ trong việc xử lý chuỗi và cho phép bạn thực hiện các thao tác phức tạp với văn bản một cách dễ dàng.