В этом руководстве по программированию на Python мы научимся разбивать строку с помощью регулярных выражений в Python. Мы будем использовать модуль re, который является частью стандартной библиотеки Python.
- Импорт модуля re
- Определение входной строки
- Определение шаблона регулярного выражения
- Функция re.split()
- Распечатайте результат
- Пример 1. Разделение строки с несколькими пробелами
- Пример 2. Разделение строки на запятые и пробелы
- Пример 3. Разделение строки с использованием различных разделителей.
- Пример 4. Разделение строки с цифрами в качестве разделителей
- Заключение
Импорт модуля re
Нам нужно импортировать модуль re, чтобы использовать функции регулярных выражений:
import re
Определение входной строки
В этом примере мы будем использовать строку «Соединенные Штаты Америки»:
input_string = "United States of America"
Определение шаблона регулярного выражения
Нам нужно определить шаблон регулярного выражения, который мы будем использовать для разделения входной строки в Python. Допустим, мы хотим разделить строку по каждому пробелу. Мы можем использовать шаблон регулярного выражения \s для соответствия любому символу пробела:
pattern = r'\s'
Функция re.split()
Теперь мы будем использовать функцию Python re.split() из модуля re, чтобы разделить входную строку на основе определенного шаблона регулярного выражения:
split_string = re.split(pattern, input_string)
Распечатайте результат
Наконец, мы можем распечатать вывод, чтобы увидеть результат:
print(split_string)
Это даст результат:
['United', 'States', 'of', 'America']
Вот полный код разделения строки с использованием регулярного выражения в Python.
import re # Step 2: Define the input string input_string = "United States of America" # Step 3: Define the regex pattern pattern = r'\s' # Step 4: Use re.split() function to split the string split_string = re.split(pattern, input_string) # Step 5: Print the output print(split_string)
Пример 1. Разделение строки с несколькими пробелами
Входная строка: «Соединенные Штаты\nАмерики»
Шаблон: \s+(соответствует одному или нескольким символам пробела)
import re input_string = "United States\t of \nAmerica" pattern = r'\s+' split_string = re.split(pattern, input_string) print(split_string)
Выход:
['United', 'States', 'of', 'America']
Пример 2. Разделение строки на запятые и пробелы
Строка ввода: «яблоко, банан, виноград, вишня»
Шаблон: \s*,\s*(соответствует запятой с нулем или более пробелами до и после)
import re input_string = "apple, banana,grape, cherry" pattern = r'\s*,\s*' split_string = re.split(pattern, input_string) print(split_string)
Выход:
['apple', 'banana', 'grape', 'cherry']
Пример 3. Разделение строки с использованием различных разделителей.
Строка ввода: «яблоко; банан, виноград|вишня»
Шаблон: \s*[,;|]\s*(соответствует запятой, точке с запятой или вертикальной черте с нулем или более пробелами до и после)
import re input_string = "apple; banana, grape|cherry" pattern = r'\s*[,;|]\s*' split_string = re.split(pattern, input_string) print(split_string)
Выход:
['apple', 'banana', 'grape', 'cherry']
Пример 4. Разделение строки с цифрами в качестве разделителей
Входная строка: «apple1banana22grape333cherry»
Шаблон: \d+(соответствует одной или нескольким цифрам)
import re input_string = "apple1banana22grape333cherry" pattern = r'\d+' split_string = re.split(pattern, input_string) print(split_string)
Выход:
['apple', 'banana', 'grape', 'cherry']
Заключение
В этом уроке мы узнали, как разбить строку с помощью регулярных выражений в Python. Используя мощный модуль re, мы можем эффективно разбивать строки со сложными шаблонами и различными разделителями. Функция re.split() позволяет нам определять и использовать собственные шаблоны регулярных выражений в соответствии с конкретными требованиями и точно разделять входные строки.
Мы рассмотрели различные примеры, чтобы продемонстрировать гибкость и универсальность функции re.split(), включая случаи с несколькими пробелами, различными разделителями и смешанными разделителями.