В статистике значение, которое постоянно появляется в определенном наборе, называется mode. Режим или модальное значение — это число, которое чаще всего встречается в наборе данных и имеет высокую частоту. Это один из трех показателей центральной тенденции, наряду со средним и медианным.
Например, набор «4, 2, 6, 6, 8» имеет mode 6. Следовательно, мы можем быстро определить режим, имея конечное число наблюдений. Для данного набора значений может быть один режим, несколько режимов или вообще ни один режим.
- Набор данных называется бимодальным, если в нем присутствуют два mode.
- Набор данных называется тримодальным, если имеется три режима.
- Набор данных называется мультимодальным, если имеется четыре или более режимов.
Метод mode()
Python Scipy содержит метод mode() в модуле scipy.stats, согласно которому предоставленный массив должен быть возвращен как массив, содержащий модальное значение.
Синтаксис:
scipy.stats.mode(a, nan_policy='propagate', axis=0,)
Где параметры:
- a(array_data): n-мерный массив, по которому можно определить режим(ы).
- nan_plociy(): указывает, что делать в случаях, когда входные данные содержат nan («Распространение» — значение по умолчанию). Доступны следующие варианты:
- propagate: возвращается nan;
- raise: выдает ошибку;
- omit: игнорирование значений nan.
- axis (int): направление оси. Значение по умолчанию — 0. Рассмотрим весь массив, если нет.
Метод mode() возвращает два значения mode и count.
Давайте рассмотрим пример, выполнив следующие шаги.
Импортируйте необходимые библиотеки, используя приведенный ниже код Python.
from scipy.stats import mode import numpy as np
Создайте массив данных, используя приведенный ниже код.
data = np.array([[3, 6, 0, 8], [7, 1, 2, 3], [4, 8, 1, 8], [3, 5, 5, 0], [9, 5, 7, 4]])
Предоставьте созданные выше данные методу mode(), используя приведенный ниже код.
mode(data,axis = None)
Режим статистики 2d
Мы уже знаем, как использовать метод mode() из приведенного выше подраздела, здесь мы найдем режим внутри двумерного массива.
Давайте разберемся на примере, выполнив следующие шаги.
Импортируйте необходимые библиотеки, используя приведенный ниже код Python.
import numpy as np from scipy.stats import mode
Создайте двумерный массив, содержащий несколько элементов, используя приведенный ниже код.
twod_array = np.array([[ 1, 2, 7, 1, 3, 4], [5, 4, 1, 1, 2, 1], [3, 3, 1, 2, 2, 1]])
Теперь вычислите режим созданного выше двумерного массива, используя приведенный ниже код.
mode(twod_array)
Возврат режима статистики
Метод mode() статистики Python Scipy возвращает два значения mode и count типа ndarray.
- mode: коллекция модальных значений.
- count: для каждого режима массив счетчиков.
Давайте рассмотрим режим и подсчитаем на примере, выполнив следующие шаги.
Импортируйте необходимые библиотеки, используя приведенный ниже код Python.
from scipy import stats import numpy as np
Создайте массив, содержащий значения, используя приведенный ниже код.
arr = np.array([[2,4,5,2,2],[1,1,7,4,5]])
Передайте созданный выше массив в метод mode(), чтобы вычислить модальное значение массива, используя приведенный ниже код.
mod = stats.mode(arr)
Теперь проверьте возвращаемый режим и количество массива, используя приведенный ниже код.
print("Array of mode",mod[0]) print("Count for each mode",mod[1])
Ось режима статистики
Метод mode() принимает ось параметра для вычисления режима. Другими словами, режим можно вычислить на другой оси массива, указав значение оси. Двумерный массив имеет две соответствующие оси: одна проходит горизонтально по столбцам (ось 1), а другая вертикально по строкам (ось 0).
Давайте возьмем пример и вычислим режим массива на основе осей, выполнив следующие шаги.
Импортируйте необходимые библиотеки, используя приведенный ниже код Python.
from scipy import stats import numpy as np
Создайте массив, содержащий значения, используя приведенный ниже код.
arr = np.array([[3,5,4,2,2],[7,4,1,4,1]])
Передайте созданный выше массив в метод mode() с осью = 1, чтобы вычислить режим массива по горизонтали по столбцам, используя приведенный ниже код.
mod = stats.mode(arr,axis =1)
Проверьте результат, используя приведенный ниже код.
mod
Пример
Мы уже узнали о режиме и о том, как его вычислить с помощью метода mode() Python Scipy. В этом разделе мы сделаем еще один пример, но с одномерным массивом.
Давайте импортируем необходимые библиотеки, используя приведенный ниже код Python.
from scipy.stats import kurtosis
Создайте массив, содержащий несколько значений, режим которых мы хотим вычислить, используя приведенный ниже код.
data = [2,3,5,7,9,5,8,1]
Вычислите режим созданных выше данных, используя приведенный ниже код.
mode(data)
Вывод приведенного выше кода возвращает два результата: значение режима, равное 5, и значение счетчика, равное 2. Это означает, что режим всех данных или массива равен 5, и число 5 встречается два раза по сравнению с другими числами. во всем массиве.