kolmogorovSmirnovTest
kolmogorovSmirnovTest
Появилось в версии v23.4
Применяет критерий Колмогорова–Смирнова к выборкам из двух генеральных совокупностей.
Значения обеих выборок находятся в столбце sample_data. Если sample_index равен 0, то значение в этой строке принадлежит выборке из первой совокупности. В противном случае оно принадлежит выборке из второй совокупности.
Выборки должны быть из непрерывных одномерных распределений вероятностей.
Синтаксис
Параметры
alternative— Альтернативная гипотеза. (Необязательный параметр, по умолчанию: 'two-sided'.) ПустьF(x) and G(x)— функции распределения (CDF) первой и второй выборок соответственно. 'two-sided': нулевая гипотеза состоит в том, что выборки получены из одного и того же распределения, то естьF(x) = G(x)для всех x, а альтернативная — что распределения не идентичны. 'greater': нулевая гипотеза состоит в том, что значения в первой выборке стохастически меньше значений во второй, то есть CDF первого распределения лежит выше и, следовательно, левее CDF второго. Что фактически означает, чтоF(x) >= G(x)для всех x, а альтернативная гипотеза в этом случае —F(x) < G(x)хотя бы для одного x. 'less': нулевая гипотеза состоит в том, что значения в первой выборке стохастически больше значений во второй, то есть CDF первого распределения лежит ниже и, следовательно, правее CDF второго. Что фактически означает, чтоF(x) <= G(x)для всех x, а альтернативная гипотеза в этом случае —F(x) > G(x)хотя бы для одного x.Stringcomputation_method— Метод, используемый для вычисления p-value. (Необязательный параметр, по умолчанию: 'auto'.) 'exact': вычисление выполняется с использованием точного распределения вероятностей статистики критерия. Вычислительно затратен и избыточен, кроме случая малых выборок. 'asymp' ('asymptotic'): вычисление выполняется с использованием аппроксимации. Для больших размеров выборок точные и асимптотические значения p-value очень близки. 'auto': метод 'exact' используется, когда максимальное число наблюдений в выборках меньше 10'000.String
Аргументы
Возвращаемое значение
Возвращает кортеж из двух элементов: вычисленную статистику и вычисленное p-value. Tuple(Float64, Float64)
Примеры
Проверка на одинаковое распределение
Тест на различие распределений
См. также