Мультиномиальная логистическая регрессия



16.5 Мультиномиальная логистическая регрессия

Этот метод является вариантом логистической регрессии, при которой зависимая переменная не является дихотомической, как при бинарной логистической регрессии, а имеет больше двух категорий. В то время как, при бинарной логистической регрессии независимая переменная может иметь интервальную шкалу, то мультиномиальная логистическая регрессия пригодна только для категориальных независимых переменных, причём имеет значение, относятся ли они к шкале наименований или к порядковой шкале. Конечно же, не исключается возможность задания в качестве ковариат переменных, имеющих интервальную шкалу.

Начиная с 10 версии SPSS для независимых переменных, относящихся к порядковой шкале предусмотрен метод порядковой регрессии (см. гл. 16.6), который в данном случае является предпочтительным.

Для представления метода мольтиномиальной логистической регрессии был сначала взят простой пример с одной независимой переменной. Данные для этого примера "ыли взяты из ALLBUS (общий социологический опрос населения) 1998 года.

  • Откройте файл polein.sav, и при помощи выбора меню Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Frequencies... (Частоты)

достройте частотные таблицы для четырёх переменных, находящихся в этом файле:

Alter (Возраст)

Frequency (Частота)

Percent (Процент)

Valid Percent (Действи- тельный процент)

Cumulative Percent (Совокупный процент)

Valid (Действи- тельное значение)



bis 45 Jahre (До 45 лет)

1306

50,1

50,1

50,1

ueber 45 Jahre (Свыше 45 лет)

1301

49,9

49,9

100,0

Total (Сумма)

2607

100,0

100,0

Politische Links-Rechts-Einschaetzung (Политическая принадлежность к левым или правым)

Frequency (Частота)

Percent (Процент)

Valid Percent (Действи- тельный процент)

Cumulative Percent (Совокупный процент)

Valid (Действи- тельное значение)

eher links (Скорее левый)

740

28,4

28,4

28,4

Mitte (Центрист)

1212

46,5

46,5

74,9

eher rechts (Скорее правый)

655

25,1

25,1

100,0

Total (Сумма)

2607

100,0

100,0

Schicht (Прослойка)

Frequency (Частота)

Percent (Процент)

Valid Percent (Действи- тельный процент)

Cumulative Percent (Совокупный процент)

Valid (Действи- тельное

Unterschicht (Нижняя прослойка)

879

33,7

33,7

33,7

значение)

Mittelschicht (Средняя прослойка)

1477

56,7

56,7

90,4

Oberschicht (Верхняя прослойка)

251

9,6

9,6

100,0

Total (Сумма)

2607

100,0

100,0

Schulbildung (Школьное образование)

Frequency (Частота)

Percent (Процент)

Valid Percent (Действи- тельный процент)

Cumulative Percent (Совокупный процент)

Valid (Действи- тельное значение)

Hauptschule (Неполное среднее)

1499

57,5

57,5

57,5

Mittlere Reife (Среднее)

610

23,4

23,4

80,9

Abitur (Атестат зрелости)

498

19,1

19,1

100,0

Total (Сумма)

2607

100,0

100,0

Мы хотим рассмотреть переменную polire (Политическая принадлежность к левым или правым) как зависимую переменную, а три остальные — как независимые переменные (факторы). В первом примере в качестве независимой переменной мы возьмем только переменную "Alter" (Возраст). Прежде всего построим таблицу сопряженности для этих двух переменных.

  • Выберите в меню Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Crosstabs... (Таблицы сопряженности)

Переменной alter присвойте статус строчной переменной, a polire — столбцовой переменной, и через выключатель Cells... (Ячейки) активируйте вывод процентных показателей для ячеек.

Alter * Politische Links-Rechts-Einschfltzung Crosstabulation

(Возраст * Политическая принадлежность к левым или правым - таблица сопряженности)

Politische Links-Rechts-Einschfltzung (Политическая принадлежность к левым или правым)

Total (Сумма)

eher links (Скорее левый)

Mitte (Цент- рист) eher rechts (Скорее правый)

Alter (Воз-раст)

bis 45 Jahre (До 45 лет)

Count (Коли- чество)

446

615

245

1306

% of Total (% от возраста)

34,2%

47,1%

18,8%

100,0%

ueber 45 Jahre (Свыше 45 лет)

Count % of Total (Коли- чество)

294

597

410

1301

(% от возраста)

22,6%

45,9%

31,5%

100,0%

Total (Сум- ма)

Count (Коли- чество)

740

1212

655

2607

% of Total (% от возраста)

28,4%

46,5%

25,1%

100,0%

Для младшей возрастной категории политическое самоопределение имеет тенденцию склонения симпатий к левым партиям, а для старшей — скорее к правым. Рассмотрим простую мультиномиальную логистическую модель, которая отражает взаимосвязь между политическим самоопределением и возрастом.

Так как политическое самоопределение, как зависимая переменная, включает три категории, то для определения вероятностей отнесения респондентов к этим трем категориям можно сформировать два недублированных логита, причём последняя категория "eher rechts" (скорее правый) будет использоваться как эталонная:



Содержание раздела