Решение уравнения с использованием логита.

Механизм решения такого уравнения можно представить следующим образом

Получаются агрегированные данные по переменным X, в которых для каждой группы, характеризуемой значениями Xj=
подсчитывается доля объектов, соответствующих событию {Y=1}. Эта доля является оценкой вероятности
. В соответствии с этим, для каждой группы получается значение логита Zj.
На агрегированных данных оцениваются коэффициенты уравнения Z=B0+B1X1+…+BpXp. К сожалению, дисперсия Z здесь зависит от значений X, поэтому при использовании логита применяется специальная техника оценки коэффициентов - взвешенной регрессии.

Еще одна особенность состоит в том, что в реальных данных очень часто группы по X оказываются однородными по Y, поэтому оценки

Решение уравнения с использованием логита.

оказываются равными нулю или единице. Таким образом, оценка логита для них не определена (для этих значений

В некоторых статистических пакетах такие группы объектов просто-напросто отбрасываются.

В настоящее время в статистическом пакете для оценки коэффициентов используется метод максимального правдоподобия, лишенный этого недостатка. Тем не менее, проблема, хотя и не в таком остром виде остается: если оценки вероятности для многих групп оказываются равными нулю или единице, оценки коэффициентов регрессии имеют слишком большую дисперсию. Поэтому, имея в качестве независимых переменных такие признаки, как душевой доход в сочетании с возрастом, их следует укрупнить по интервалам, приписав объектам средние значения интервалов.

Содержание раздела