Modèle log-linéaire

La déviance de ce modèle est fondamentalement 0 sur 0 degrés de liberté. Les comtes ajustées correspondent aux dénombrements observés: vous pouvez estimer ce modèle avec OLS en utilisant simplement des valeurs de log naturelles pour la variable dépendante (Y) et l`échelle d`origine pour les variables indépendantes (X). Il est connu comme un modèle log-linéaire. En utilisant le calcul avec un simple modèle log-linéaire, vous pouvez montrer comment les coefficients doivent être interprétés. Commencez par le modèle les étudiants qui ont essayé la marijuana ont estimé la probabilité d`avoir essayé l`alcool qui sont 19 fois la cote estimée pour les étudiants qui n`ont pas essayé la marijuana. Parce que nous adapons un modèle d`association homogène, le ratio de cotes est le même indépendamment du fait qu`ils aient essayé des cigarettes. Nous sommes intéressés par la façon dont la cellule compte dans cette table dépend des niveaux des variables catégorielles. Si nous étions intéressés par la modélisation, disons, l`utilisation de la marijuana en fonction de l`alcool et de l`utilisation de cigarettes, alors nous pourrions effectuer une régression logistique. Mais si nous sommes intéressés à comprendre la relation entre les trois variables sans qu`on soit nécessairement la «réponse», alors nous pourrions vouloir essayer un modèle log-linéaires. Adaptons un modèle plus complexe qui permet aux variables d`être associés les uns aux autres, mais maintient la même association indépendamment du niveau de la troisième variable. Nous appelons cette association homogène. Cela dit, par exemple, l`utilisation de l`alcool et de la marijuana ont une sorte de relation, mais cette relation est la même, peu importe si elles ont essayé ou non des cigarettes. Le montage de ce modèle signifie que nous ajoutons des interactions pour chaque combinaison de variables par paires.

R rend cela facile avec sa notation de formule. Il suffit de placer des parenthèses autour de vos variables et d`ajouter un exposant de 2. Cela se traduit par «toutes les variables et toutes les interactions par paires»: les coefficients de régression dans un modèle log-linéaire ne représentent pas la pente. La valeur null de ce test est que les fréquences attendues satisfont le modèle log-linéaires donné. Manifestement, ils ne le font pas! Ainsi, le modèle semble s`adapter (très bien), mais comment décrivons-nous l`association entre les variables? Quel effet les variables ont-elles les unes sur les autres? Pour y répondre, nous examinons les coefficients des interactions. En exposant les coefficients, nous obtenons des ratios de cotes. Par exemple, examinons le coefficient pour “marijuanayes: alcoyes”. Toutes choses étant égales, nous préférons un modèle plus simple.