Мультиномиальная логистическая регрессия
16.5 Мультиномиальная логистическая регрессия
Этот метод является вариантом логистической регрессии, при которой зависимая переменная не является дихотомической, как при бинарной логистической регрессии, а имеет больше двух категорий. В то время как, при бинарной логистической регрессии независимая переменная может иметь интервальную шкалу, то мультиномиальная логистическая регрессия пригодна только для категориальных независимых переменных, причём имеет значение, относятся ли они к шкале наименований или к порядковой шкале. Конечно же, не исключается возможность задания в качестве ковариат переменных, имеющих интервальную шкалу.
Начиная с 10 версии SPSS для независимых переменных, относящихся к порядковой шкале предусмотрен метод порядковой регрессии (см. гл. 16.6), который в данном случае является предпочтительным.
Для представления метода мольтиномиальной логистической регрессии был сначала взят простой пример с одной независимой переменной. Данные для этого примера "ыли взяты из ALLBUS (общий социологический опрос населения) 1998 года.
-
Откройте файл polein.sav, и при помощи выбора меню Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Frequencies... (Частоты)
достройте частотные таблицы для четырёх переменных, находящихся в этом файле:
Alter (Возраст)
|
Frequency (Частота) |
Percent (Процент) |
Valid Percent (Действи- тельный процент) |
Cumulative Percent (Совокупный процент) | |
Valid (Действи- тельное значение) |
bis 45 Jahre (До 45 лет) |
1306 |
50,1 |
50,1 |
50,1 |
ueber 45 Jahre (Свыше 45 лет) |
1301 |
49,9 |
49,9 |
100,0 | |
Total (Сумма) |
2607 |
100,0 |
100,0 |
|
Politische Links-Rechts-Einschaetzung (Политическая принадлежность к левым или правым)
|
Frequency (Частота) |
Percent (Процент) |
Valid Percent (Действи- тельный процент) |
Cumulative Percent (Совокупный процент) | |
Valid (Действи- тельное значение) |
eher links (Скорее левый) |
740 |
28,4 |
28,4 |
28,4 |
Mitte (Центрист) |
1212 |
46,5 |
46,5 |
74,9 | |
eher rechts (Скорее правый) |
655 |
25,1 |
25,1 |
100,0 | |
Total (Сумма) |
2607 |
100,0 |
100,0 |
|
Schicht (Прослойка)
Frequency (Частота) |
Percent (Процент) |
Valid Percent (Действи- тельный процент) |
Cumulative Percent (Совокупный процент) | ||
Valid (Действи- тельное |
Unterschicht (Нижняя прослойка) |
879 |
33,7 |
33,7 |
33,7 |
значение) |
Mittelschicht (Средняя прослойка) |
1477 |
56,7 |
56,7 |
90,4 |
|
Oberschicht (Верхняя прослойка) |
251 |
9,6 |
9,6 |
100,0 |
|
Total (Сумма) |
2607 |
100,0 |
100,0 |
|
Schulbildung (Школьное образование)
Frequency (Частота) |
Percent (Процент) |
Valid Percent (Действи- тельный процент) |
Cumulative Percent (Совокупный процент) | ||
Valid (Действи- тельное значение) |
Hauptschule (Неполное среднее) |
1499 |
57,5 |
57,5 |
57,5 |
Mittlere Reife (Среднее) |
610 |
23,4 |
23,4 |
80,9 | |
Abitur (Атестат зрелости) |
498 |
19,1 |
19,1 |
100,0 | |
Total (Сумма) |
2607 |
100,0 |
100,0 |
|
Мы хотим рассмотреть переменную polire (Политическая принадлежность к левым или правым) как зависимую переменную, а три остальные — как независимые переменные (факторы). В первом примере в качестве независимой переменной мы возьмем только переменную "Alter" (Возраст). Прежде всего построим таблицу сопряженности для этих двух переменных.
-
Выберите в меню Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Crosstabs... (Таблицы сопряженности)
Переменной alter присвойте статус строчной переменной, a polire — столбцовой переменной, и через выключатель Cells... (Ячейки) активируйте вывод процентных показателей для ячеек.
Alter * Politische Links-Rechts-Einschfltzung Crosstabulation
(Возраст * Политическая принадлежность к левым или правым - таблица сопряженности)
|
Politische Links-Rechts-Einschfltzung (Политическая принадлежность к левым или правым) |
Total (Сумма) | ||||
eher links (Скорее левый) | Mitte (Цент- рист) | eher rechts (Скорее правый) | ||||
Alter (Воз-раст) |
bis 45 Jahre (До 45 лет) | Count (Коли- чество) |
446 | 615 |
245 |
1306 |
% of Total (% от возраста) |
34,2% | 47,1% |
18,8% |
100,0% | ||
ueber 45 Jahre (Свыше 45 лет) | Count % of Total (Коли- чество) |
294 | 597 |
410 |
1301 | |
(% от возраста) |
22,6% | 45,9% |
31,5% |
100,0% | ||
Total (Сум- ма) |
| Count (Коли- чество) |
740 | 1212 |
655 |
2607 |
% of Total (% от возраста) |
28,4% | 46,5% |
25,1% |
100,0% |
Для младшей возрастной категории политическое самоопределение имеет тенденцию склонения симпатий к левым партиям, а для старшей — скорее к правым. Рассмотрим простую мультиномиальную логистическую модель, которая отражает взаимосвязь между политическим самоопределением и возрастом.
Так как политическое самоопределение, как зависимая переменная, включает три категории, то для определения вероятностей отнесения респондентов к этим трем категориям можно сформировать два недублированных логита, причём последняя категория "eher rechts" (скорее правый) будет использоваться как эталонная: