В этом руководстве по Python Pandas я объясню, что такое функция drop() dataframe Pandas в Python, ее синтаксис, необходимые параметры и возвращаемые значения. Я также объясню, как использовать функцию drop в Python, с помощью нескольких примеров.
Функция drop() в Python удаляет указанные метки из строк и столбцов. Drop — это основная функция, используемая в науке о данных и машинном обучении для очистки набора данных.
При использовании мультииндекса метки на разных уровнях можно удалить, указав уровень.
Синтаксис
Вот синтаксис функции Pandas drop() в Python.
DataFrame.drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise')
Список параметров, необходимых для добавления Pandas в Python:
| Параметры | Объяснение |
|---|---|
| labels | Одиночная метка или список Метки индекса или столбца, которые нужно удалить. |
| axis | axis удалит предоставленную ось; ось может быть 0 или 1. ось = 0 относится к строкам или индексам(вертикалям). ось = 1 относится к столбцам(по горизонтали) по умолчанию ось = 0 |
| index | одиночная метка или список. index — это строка(вертикальные линии) и эквивалентен оси = 0 |
| columns | Одиночная метка или список. Столбцы являются горизонтальными в табличном виде и обозначаются осью = 1. |
| level | int или имя уровня, необязательно Для MultiIndex — уровень, с которого будут удалены метки. |
| inplace | принимает bool (True или False), по умолчанию — False. Inplace вносит изменения тут и там. не нужно присваивать переменную. |
| errors | ошибку можно «игнорировать» или «вызвать». По умолчанию «повышается». Если игнорировать, подавить ошибку и удалить только существующие метки если он поднят, он покажет сообщение об ошибке и не позволит удалить данные. |
Функция drop() в библиотеке Python pandas полезна для удаления указанных строк или столбцов из DataFrame или Series. Функция принимает несколько параметров, включая удаляемые метки, ось (т. е. строки или столбцы) и необходимость изменения исходного DataFrame на месте.
С помощью метода drop() кадра данных Pandas мы можем легко манипулировать структурой наших данных, удаляя ненужные строки или столбцы. Мы также можем объединить несколько функций drop() в Python для одновременного удаления нескольких строк или столбцов.
Важно отметить, что функция Python drop() в Pandas с inplace=True изменяет исходный DataFrame на месте и не возвращает новый объект DataFrame. Это может быть полезно для экономии памяти или предотвращения создания ненужных копий наших данных.
Примеры
Давайте рассмотрим несколько примеров, чтобы лучше понять, как использовать функцию drop() в Pandas на Python.
Для удаления строк
Предположим, у нас есть следующий DataFrame в Python:
import pandas as pd
employee = {
'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 30, 35, 40],
'gender': ['F', 'M', 'M', 'M']
}
employee_df = pd.DataFrame(employee)
print(employee_df)
Выход:
name age gender 0 Alice 25 F 1 Bob 30 M 2 Charlie 35 M 3 David 40 M

Чтобы удалить строку с индексом 1, мы можем использовать следующий код:
employee_df = employee_df.drop(1) print(employee_df)
Выход:
name age gender 0 Alice 25 F 2 Charlie 35 M 3 David 40 M
Ниже приведен скриншот после реализации кода в редакторе Pycharm.

Мы также можем удалить несколько строк одновременно, указав список индексов для удаления в Pandas Python:
import pandas as pd
employee = {
'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 30, 35, 40],
'gender': ['F', 'M', 'M', 'M']
}
employee_df = pd.DataFrame(employee)
print("Original DataFrame:\n", employee_df)
# Drop rows with index 0 and 2
employee_df = employee_df.drop([0, 2])
print("\nModified DataFrame:\n", employee_df)
Выход:
Original DataFrame:
name age gender
0 Alice 25 F
1 Bob 30 M
2 Charlie 35 M
3 David 40 M
Modified DataFrame:
name age gender
1 Bob 30 M
3 David 40 M
Ниже приведен снимок экрана, на котором показаны выходные данные после реализации кода в редакторе Pycharm.

Удаление столбца
Чтобы удалить столбец в Python Pandas, мы можем установить axis=1. Вот пример:
employee_df = employee_df.drop('gender', axis=1)
print(employee_df)
Выход:
name age 0 Alice 25 1 Bob 30 2 Charlie 35 3 David 40
После реализации кода в редакторе Pycharm был предоставлен снимок экрана ниже.

Опять же, мы можем удалить несколько столбцов с помощью Pandas одновременно, указав список имен столбцов в методе Pandas drop() в Python:
employee_df = employee_df.drop(['name', 'age'], axis=1) print(employee_df)
Выход:
gender 0 F 1 M 2 M 3 M
Ниже приведен снимок экрана, демонстрирующий выходные данные, полученные после выполнения кода в редакторе Pycharm.

С аргументом inplace
По умолчанию функция drop() в Python не изменяет исходный DataFrame Pandas. Вместо этого он возвращает новый DataFrame с удаленными указанными строками или столбцами.
Если мы хотим изменить исходный DataFrame на месте, мы можем установить inplace=True.
Вот пример функции drop() dataframe Pandas в Python:
import pandas as pd
employee = {
'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 30, 35, 40],
'gender': ['F', 'M', 'M', 'M']
}
employee_df = pd.DataFrame(employee)
print("Original DataFrame:\n", employee_df)
employee_df.drop(1, inplace=True)
print("\nModified DataFrame:\n", employee_df)
Выход:
Original DataFrame:
name age gender
0 Alice 25 F
1 Bob 30 M
2 Charlie 35 M
3 David 40 M
Modified DataFrame:
name age gender
0 Alice 25 F
2 Charlie 35 M
3 David 40 M
Как видите, строка с индексом 1 («Боб») была удалена из исходного DataFrame на месте.
Важно отметить, что при использовании inplace=True функция возвращает None и не создает новый объект DataFrame.
После выполнения кода в Pycharm результат можно увидеть на снимке экрана ниже.

Заключение
Функция drop() dataframe Pandas в Python — это мощный инструмент, который может помочь нам очищать наши данные и манипулировать ими. Мы можем использовать эту функцию для одновременного удаления ненужных строк или столбцов из набора данных в Pandas, используя метод drop() в Python.