Cộng đồng chia sẻ tri thức Lib24.vn

Python - Chuỗi

Gửi bởi: Phạm Thọ Thái Dương 19 tháng 2 2020 lúc 15:24:11


Mục lục
* * * * *

Chuỗi là một trong những loại phổ biến nhất trong Python. Chúng ta có thể tạo chúng đơn giản bằng cách đặt các ký tự trong dấu ngoặc kép. Python xử lý dấu ngoặc đơn giống như dấu ngoặc kép. Tạo chuỗi đơn giản như gán giá trị cho biến. Ví dụ:

var1 = 'Hello World!'
var2 = "Python Programming"

Truy cập các giá trị trong chuỗi

Python không hỗ trợ kiểu ký tự; chúng được coi là các chuỗi có độ dài một, do đó cũng được coi là một chuỗi con.

Để truy cập các chuỗi con, sử dụng dấu ngoặc vuông để cắt cùng với chỉ mục hoặc chỉ mục để lấy chuỗi con của bạn. Ví dụ:

#!/usr/bin/python

var1 = 'Hello World!'
var2 = "Python Programming"

print "var1[0]: ", var1[0]
print "var2[1:5]: ", var2[1:5]

Khi đoạn mã trên được thực thi, nó tạo ra kết quả sau -

var1[0]:  H
var2[1:5]:  ytho

Cập nhật chuỗi

Bạn có thể "cập nhật" một chuỗi hiện có bằng cách (tái) gán một biến cho một chuỗi khác. Giá trị mới có thể liên quan đến giá trị trước đó của nó hoặc với một chuỗi hoàn toàn khác. Ví dụ:

#!/usr/bin/python

var1 = 'Hello World!'
print "Updated String :- ", var1[:6] + 'Python'

Khi đoạn mã trên được thực thi, nó tạo ra kết quả sau -

Updated String :-  Hello Python

Nhân vật thoát

Bảng sau là danh sách các ký tự thoát hoặc không in được có thể được biểu thị bằng ký hiệu dấu gạch chéo ngược.

Một nhân vật thoát được giải thích; trong một trích dẫn cũng như chuỗi trích dẫn kép

Chuỗi toán tử đặc biệt

Giả sử biến chuỗi a giữ 'Xin chào' và biến b giữ 'Python', sau đó -

Toán tử định dạng chuỗi

Một trong những tính năng thú vị nhất của Python là toán tử định dạng chuỗi%. Toán tử này là duy nhất cho chuỗi và bù cho gói có các hàm từ họ printf (). Sau đây là một ví dụ đơn giản -

#!/usr/bin/python
print "My name is %s and weight is %d kg!" % ('Zara', 21)

Khi đoạn mã trên được thực thi, nó tạo ra kết quả sau -

My name is Zara and weight is 21 kg!

Dưới đây là danh sách các bộ ký hiệu hoàn chỉnh có thể được sử dụng cùng với% -

Các biểu tượng và chức năng được hỗ trợ khác được liệt kê trong bảng sau -

Báo giá ba

Bộ ba trích dẫn của Python giúp giải cứu bằng cách cho phép các chuỗi trải dài trên nhiều dòng, bao gồm cả NEWLINE, TAB và bất kỳ ký tự đặc biệt nào khác.

Cú pháp cho ba dấu ngoặc kép bao gồm ba dấu ngoặc đơn hoặc dấu ngoặc kép liên tiếp .

#!/usr/bin/python

para_str = """this is a long string that is made up of
several lines and non-printable characters such as
TAB ( \t ) and they will show up that way when displayed.
NEWLINEs within the string, whether explicitly given like
this within the brackets [ \n ], or just a NEWLINE within
the variable assignment will also show up.
"""
print para_str

Khi đoạn mã trên được thực thi, nó tạo ra kết quả như sau. Lưu ý cách mỗi ký tự đặc biệt đã được chuyển đổi thành dạng in của nó, ngay xuống NEWLINE cuối cùng ở cuối chuỗi giữa "lên". và đóng ba dấu ngoặc kép. Cũng lưu ý rằng NEWLINE xảy ra với lợi nhuận vận chuyển rõ ràng ở cuối dòng hoặc mã thoát của nó (\ n) -

this is a long string that is made up of
several lines and non-printable characters such as
TAB (    ) and they will show up that way when displayed.
NEWLINEs within the string, whether explicitly given like
this within the brackets [
 ], or just a NEWLINE within
the variable assignment will also show up.

Các chuỗi thô không coi dấu gạch chéo ngược là một ký tự đặc biệt. Mỗi ký tự bạn đặt vào một chuỗi thô vẫn giữ nguyên cách bạn viết nó -

#!/usr/bin/python

print 'C:\\nowhere'

Khi đoạn mã trên được thực thi, nó tạo ra kết quả sau -

C:\nowhere

Bây giờ hãy sử dụng chuỗi thô. Chúng tôi sẽ đặt biểu thức trong r'expression ' như sau -

#!/usr/bin/python

print r'C:\\nowhere'

Khi đoạn mã trên được thực thi, nó tạo ra kết quả sau -

C:\\nowhere

Chuỗi Unicode

Các chuỗi thông thường trong Python được lưu trữ bên trong dưới dạng ASCII 8 bit, trong khi các chuỗi Unicode được lưu trữ dưới dạng Unicode 16 bit. Điều này cho phép tập hợp các ký tự đa dạng hơn, bao gồm các ký tự đặc biệt từ hầu hết các ngôn ngữ trên thế giới. Tôi sẽ hạn chế việc xử lý chuỗi Unicode của mình theo cách sau -

#!/usr/bin/python
print u'Hello, world!'

Khi đoạn mã trên được thực thi, nó tạo ra kết quả sau -

Hello, world!

Như bạn có thể thấy, các chuỗi Unicode sử dụng tiền tố u, giống như các chuỗi thô sử dụng tiền tố r.

Các phương thức chuỗi tích hợp

Python bao gồm các phương thức tích hợp sau để thao tác các chuỗi -


Được cập nhật: hôm qua lúc 13:12:41 | Lượt xem: 523