• Автор записи:
  • Рубрика записи:Pandas
  • Время чтения:3 минут чтения
  • Комментарии к записи:0 комментариев

В этом руководстве по Python Pandas я объясню, что такое функция drop() dataframe Pandas в Python, ее синтаксис, необходимые параметры и возвращаемые значения. Я также объясню, как использовать функцию drop в Python, с помощью нескольких примеров.

Функция drop() в Python удаляет указанные метки из строк и столбцов. Drop — это основная функция, используемая в науке о данных и машинном обучении для очистки набора данных.

При использовании мультииндекса метки на разных уровнях можно удалить, указав уровень.

Содержание

Синтаксис

Вот синтаксис функции Pandas drop() в Python.

DataFrame.drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise')

Список параметров, необходимых для добавления Pandas в Python:

Параметры Объяснение
labels Одиночная метка или список
Метки индекса или столбца, которые нужно удалить.
axis axis удалит предоставленную ось; ось может быть 0 или 1.
ось = 0 относится к строкам или индексам(вертикалям).
ось = 1 относится к столбцам(по горизонтали)
по умолчанию ось = 0
index одиночная метка или список.
index — это строка(вертикальные линии) и эквивалентен оси = 0
columns Одиночная метка или список.
Столбцы являются горизонтальными в табличном виде и обозначаются осью = 1.
level int или имя уровня, необязательно
Для MultiIndex — уровень, с которого будут удалены метки.
inplace принимает bool (True или False), по умолчанию — False.
Inplace вносит изменения тут и там. не нужно присваивать переменную.
errors ошибку можно «игнорировать» или «вызвать». По умолчанию «повышается».
Если игнорировать, подавить ошибку и удалить только существующие метки
если он поднят, он покажет сообщение об ошибке и не позволит удалить данные.

Функция drop() в библиотеке Python pandas полезна для удаления указанных строк или столбцов из DataFrame или Series. Функция принимает несколько параметров, включая удаляемые метки, ось (т. е. строки или столбцы) и необходимость изменения исходного DataFrame на месте.

С помощью метода drop() кадра данных Pandas мы можем легко манипулировать структурой наших данных, удаляя ненужные строки или столбцы. Мы также можем объединить несколько функций drop() в Python для одновременного удаления нескольких строк или столбцов.

Важно отметить, что функция Python drop() в Pandas с inplace=True изменяет исходный DataFrame на месте и не возвращает новый объект DataFrame. Это может быть полезно для экономии памяти или предотвращения создания ненужных копий наших данных.

Примеры

Давайте рассмотрим несколько примеров, чтобы лучше понять, как использовать функцию drop() в Pandas на Python.

Для удаления строк

Предположим, у нас есть следующий DataFrame в Python:

import pandas as pd

employee = {
    'name': ['Alice', 'Bob', 'Charlie', 'David'],
    'age': [25, 30, 35, 40],
    'gender': ['F', 'M', 'M', 'M']
}
employee_df = pd.DataFrame(employee)
print(employee_df)

Выход:

       name  age gender
0     Alice   25      F
1       Bob   30      M
2   Charlie   35      M
3     David   40      M

Для удаления строк

Чтобы удалить строку с индексом 1, мы можем использовать следующий код:

employee_df = employee_df.drop(1)
print(employee_df)

Выход:

       name  age gender
0     Alice   25      F
2   Charlie   35      M
3     David   40      M

Ниже приведен скриншот после реализации кода в редакторе Pycharm.

функция удаления

Мы также можем удалить несколько строк одновременно, указав список индексов для удаления в Pandas Python:

import pandas as pd

employee = {
    'name': ['Alice', 'Bob', 'Charlie', 'David'],
    'age': [25, 30, 35, 40],
    'gender': ['F', 'M', 'M', 'M']
}
employee_df = pd.DataFrame(employee)
print("Original DataFrame:\n", employee_df)

# Drop rows with index 0 and 2
employee_df = employee_df.drop([0, 2])
print("\nModified DataFrame:\n", employee_df)

Выход:

Original DataFrame:
       name  age gender
0    Alice   25      F
1      Bob   30      M
2  Charlie   35      M
3    David   40      M

Modified DataFrame:
     name  age gender
1    Bob   30      M
3  David   40      M

Ниже приведен снимок экрана, на котором показаны выходные данные после реализации кода в редакторе Pycharm.

Выходные данные

Удаление столбца

Чтобы удалить столбец в Python Pandas, мы можем установить axis=1. Вот пример:

employee_df = employee_df.drop('gender', axis=1)
print(employee_df)

Выход:

     name  age
0   Alice   25
1     Bob   30
2  Charlie  35
3   David   40

После реализации кода в редакторе Pycharm был предоставлен снимок экрана ниже.

Удаление столбца

Опять же, мы можем удалить несколько столбцов с помощью Pandas одновременно, указав список имен столбцов в методе Pandas drop() в Python:

employee_df = employee_df.drop(['name', 'age'], axis=1)
print(employee_df)

Выход:

  gender
0      F
1      M
2      M
3      M

Ниже приведен снимок экрана, демонстрирующий выходные данные, полученные после выполнения кода в редакторе Pycharm.

Функция удаления в кадре данных

С аргументом inplace

По умолчанию функция drop() в Python не изменяет исходный DataFrame Pandas. Вместо этого он возвращает новый DataFrame с удаленными указанными строками или столбцами.

Если мы хотим изменить исходный DataFrame на месте, мы можем установить inplace=True.

Вот пример функции drop() dataframe Pandas в Python:

import pandas as pd

employee = {
    'name': ['Alice', 'Bob', 'Charlie', 'David'],
    'age': [25, 30, 35, 40],
    'gender': ['F', 'M', 'M', 'M']
}
employee_df = pd.DataFrame(employee)
print("Original DataFrame:\n", employee_df)
employee_df.drop(1, inplace=True)
print("\nModified DataFrame:\n", employee_df)

Выход:

Original DataFrame:
       name  age gender
0    Alice   25      F
1      Bob   30      M
2  Charlie   35      M
3    David   40      M

Modified DataFrame:
       name  age gender
0    Alice   25      F
2  Charlie   35      M
3    David   40      M

Как видите, строка с индексом 1 («Боб») была удалена из исходного DataFrame на месте.

Важно отметить, что при использовании inplace=True функция возвращает None и не создает новый объект DataFrame.

После выполнения кода в Pycharm результат можно увидеть на снимке экрана ниже.

С аргументом

Заключение

Функция drop() dataframe Pandas в Python — это мощный инструмент, который может помочь нам очищать наши данные и манипулировать ими. Мы можем использовать эту функцию для одновременного удаления ненужных строк или столбцов из набора данных в Pandas, используя метод drop() в Python.

Добавить комментарий