В этом руководстве по Python Pandas я объясню, что такое функция drop() dataframe Pandas в Python, ее синтаксис, необходимые параметры и возвращаемые значения. Я также объясню, как использовать функцию drop в Python, с помощью нескольких примеров.
Функция drop() в Python удаляет указанные метки из строк и столбцов. Drop — это основная функция, используемая в науке о данных и машинном обучении для очистки набора данных.
При использовании мультииндекса метки на разных уровнях можно удалить, указав уровень.
Синтаксис
Вот синтаксис функции Pandas drop() в Python.
DataFrame.drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise')
Список параметров, необходимых для добавления Pandas в Python:
Параметры | Объяснение |
---|---|
labels | Одиночная метка или список Метки индекса или столбца, которые нужно удалить. |
axis | axis удалит предоставленную ось; ось может быть 0 или 1. ось = 0 относится к строкам или индексам(вертикалям). ось = 1 относится к столбцам(по горизонтали) по умолчанию ось = 0 |
index | одиночная метка или список. index — это строка(вертикальные линии) и эквивалентен оси = 0 |
columns | Одиночная метка или список. Столбцы являются горизонтальными в табличном виде и обозначаются осью = 1. |
level | int или имя уровня, необязательно Для MultiIndex — уровень, с которого будут удалены метки. |
inplace | принимает bool (True или False), по умолчанию — False. Inplace вносит изменения тут и там. не нужно присваивать переменную. |
errors | ошибку можно «игнорировать» или «вызвать». По умолчанию «повышается». Если игнорировать, подавить ошибку и удалить только существующие метки если он поднят, он покажет сообщение об ошибке и не позволит удалить данные. |
Функция drop() в библиотеке Python pandas полезна для удаления указанных строк или столбцов из DataFrame или Series. Функция принимает несколько параметров, включая удаляемые метки, ось (т. е. строки или столбцы) и необходимость изменения исходного DataFrame на месте.
С помощью метода drop() кадра данных Pandas мы можем легко манипулировать структурой наших данных, удаляя ненужные строки или столбцы. Мы также можем объединить несколько функций drop() в Python для одновременного удаления нескольких строк или столбцов.
Важно отметить, что функция Python drop() в Pandas с inplace=True изменяет исходный DataFrame на месте и не возвращает новый объект DataFrame. Это может быть полезно для экономии памяти или предотвращения создания ненужных копий наших данных.
Примеры
Давайте рассмотрим несколько примеров, чтобы лучше понять, как использовать функцию drop() в Pandas на Python.
Для удаления строк
Предположим, у нас есть следующий DataFrame в Python:
import pandas as pd employee = { 'name': ['Alice', 'Bob', 'Charlie', 'David'], 'age': [25, 30, 35, 40], 'gender': ['F', 'M', 'M', 'M'] } employee_df = pd.DataFrame(employee) print(employee_df)
Выход:
name age gender 0 Alice 25 F 1 Bob 30 M 2 Charlie 35 M 3 David 40 M
Чтобы удалить строку с индексом 1, мы можем использовать следующий код:
employee_df = employee_df.drop(1) print(employee_df)
Выход:
name age gender 0 Alice 25 F 2 Charlie 35 M 3 David 40 M
Ниже приведен скриншот после реализации кода в редакторе Pycharm.
Мы также можем удалить несколько строк одновременно, указав список индексов для удаления в Pandas Python:
import pandas as pd employee = { 'name': ['Alice', 'Bob', 'Charlie', 'David'], 'age': [25, 30, 35, 40], 'gender': ['F', 'M', 'M', 'M'] } employee_df = pd.DataFrame(employee) print("Original DataFrame:\n", employee_df) # Drop rows with index 0 and 2 employee_df = employee_df.drop([0, 2]) print("\nModified DataFrame:\n", employee_df)
Выход:
Original DataFrame: name age gender 0 Alice 25 F 1 Bob 30 M 2 Charlie 35 M 3 David 40 M Modified DataFrame: name age gender 1 Bob 30 M 3 David 40 M
Ниже приведен снимок экрана, на котором показаны выходные данные после реализации кода в редакторе Pycharm.
Удаление столбца
Чтобы удалить столбец в Python Pandas, мы можем установить axis=1. Вот пример:
employee_df = employee_df.drop('gender', axis=1) print(employee_df)
Выход:
name age 0 Alice 25 1 Bob 30 2 Charlie 35 3 David 40
После реализации кода в редакторе Pycharm был предоставлен снимок экрана ниже.
Опять же, мы можем удалить несколько столбцов с помощью Pandas одновременно, указав список имен столбцов в методе Pandas drop() в Python:
employee_df = employee_df.drop(['name', 'age'], axis=1) print(employee_df)
Выход:
gender 0 F 1 M 2 M 3 M
Ниже приведен снимок экрана, демонстрирующий выходные данные, полученные после выполнения кода в редакторе Pycharm.
С аргументом inplace
По умолчанию функция drop() в Python не изменяет исходный DataFrame Pandas. Вместо этого он возвращает новый DataFrame с удаленными указанными строками или столбцами.
Если мы хотим изменить исходный DataFrame на месте, мы можем установить inplace=True.
Вот пример функции drop() dataframe Pandas в Python:
import pandas as pd employee = { 'name': ['Alice', 'Bob', 'Charlie', 'David'], 'age': [25, 30, 35, 40], 'gender': ['F', 'M', 'M', 'M'] } employee_df = pd.DataFrame(employee) print("Original DataFrame:\n", employee_df) employee_df.drop(1, inplace=True) print("\nModified DataFrame:\n", employee_df)
Выход:
Original DataFrame: name age gender 0 Alice 25 F 1 Bob 30 M 2 Charlie 35 M 3 David 40 M Modified DataFrame: name age gender 0 Alice 25 F 2 Charlie 35 M 3 David 40 M
Как видите, строка с индексом 1 («Боб») была удалена из исходного DataFrame на месте.
Важно отметить, что при использовании inplace=True функция возвращает None и не создает новый объект DataFrame.
После выполнения кода в Pycharm результат можно увидеть на снимке экрана ниже.
Заключение
Функция drop() dataframe Pandas в Python — это мощный инструмент, который может помочь нам очищать наши данные и манипулировать ими. Мы можем использовать эту функцию для одновременного удаления ненужных строк или столбцов из набора данных в Pandas, используя метод drop() в Python.