В этом руководстве по программированию на Python мы научимся разбивать строку с помощью регулярных выражений в Python. Мы будем использовать модуль re, который является частью стандартной библиотеки Python.

Содержание

Импорт модуля re

Нам нужно импортировать модуль re, чтобы использовать функции регулярных выражений:

import re

Определение входной строки

В этом примере мы будем использовать строку «Соединенные Штаты Америки»:

input_string = "United States of America"

Определение шаблона регулярного выражения

Нам нужно определить шаблон регулярного выражения, который мы будем использовать для разделения входной строки в Python. Допустим, мы хотим разделить строку по каждому пробелу. Мы можем использовать шаблон регулярного выражения \s для соответствия любому символу пробела:

pattern = r'\s'

Функция re.split()

Теперь мы будем использовать функцию Python re.split() из модуля re, чтобы разделить входную строку на основе определенного шаблона регулярного выражения:

split_string = re.split(pattern, input_string)

Распечатайте результат

Наконец, мы можем распечатать вывод, чтобы увидеть результат:

print(split_string)

Это даст результат:

['United', 'States', 'of', 'America']

Вот полный код разделения строки с использованием регулярного выражения в Python.

import re

# Step 2: Define the input string
input_string = "United States of America"

# Step 3: Define the regex pattern
pattern = r'\s'

# Step 4: Use re.split() function to split the string
split_string = re.split(pattern, input_string)

# Step 5: Print the output
print(split_string)

Как разделить строку с помощью регулярного выражения

Пример 1. Разделение строки с несколькими пробелами

Входная строка: «Соединенные Штаты\nАмерики»

Шаблон: \s+(соответствует одному или нескольким символам пробела)

import re

input_string = "United    States\t  of \nAmerica"
pattern = r'\s+'

split_string = re.split(pattern, input_string)
print(split_string)

Выход:

['United', 'States', 'of', 'America']

Пример 2. Разделение строки на запятые и пробелы

Строка ввода: «яблоко, банан, виноград, вишня»

Шаблон: \s*,\s*(соответствует запятой с нулем или более пробелами до и после)

import re

input_string = "apple, banana,grape, cherry"
pattern = r'\s*,\s*'

split_string = re.split(pattern, input_string)
print(split_string)

Выход:

['apple', 'banana', 'grape', 'cherry']

Пример 3. Разделение строки с использованием различных разделителей.

Строка ввода: «яблоко; банан, виноград|вишня»

Шаблон: \s*[,;|]\s*(соответствует запятой, точке с запятой или вертикальной черте с нулем или более пробелами до и после)

import re

input_string = "apple; banana, grape|cherry"
pattern = r'\s*[,;|]\s*'

split_string = re.split(pattern, input_string)
print(split_string)

Выход:

['apple', 'banana', 'grape', 'cherry']

Пример 4. Разделение строки с цифрами в качестве разделителей

Входная строка: «apple1banana22grape333cherry»

Шаблон: \d+(соответствует одной или нескольким цифрам)

import re

input_string = "apple1banana22grape333cherry"
pattern = r'\d+'

split_string = re.split(pattern, input_string)
print(split_string)

Выход:

['apple', 'banana', 'grape', 'cherry']

Заключение

В этом уроке мы узнали, как разбить строку с помощью регулярных выражений в Python. Используя мощный модуль re, мы можем эффективно разбивать строки со сложными шаблонами и различными разделителями. Функция re.split() позволяет нам определять и использовать собственные шаблоны регулярных выражений в соответствии с конкретными требованиями и точно разделять входные строки.

Мы рассмотрели различные примеры, чтобы продемонстрировать гибкость и универсальность функции re.split(), включая случаи с несколькими пробелами, различными разделителями и смешанными разделителями.

Добавить комментарий