Qu'est-ce que la régression linéaire simple et comment elle fonctionne

Les modèles de régression linéaire sont utilisés pour montrer ou prédire la relation entre deux variables ou facteurs. Le facteur prédit (le facteur que l'équation résout pour) est appelée variable dépendante. Les facteurs utilisés pour prédire la valeur de la variable dépendante sont appelés variables indépendantes.

En régression linéaire, chaque observation se compose de deux valeurs. Une valeur correspond à la variable dépendante et une valeur correspond à la variable indépendante. Dans ce modèle simple, une ligne droite approxime la relation entre la variable dépendante et la variable indépendante.

Lorsque deux variables indépendantes ou plus sont utilisées dans l’analyse de régression, le modèle n’est plus un simple modèle linéaire. C'est ce qu'on appelle la régression multiple.

Formule pour un modèle de régression linéaire simple

Les deux facteurs impliqués dans l'analyse de régression linéaire simple sont désignés X et oui. L'équation qui décrit comment oui est liée à X est connu sous le nom de Modèle de régression.

Le modèle de régression linéaire simple est représenté par:

oui = β₀ +β₁X+ε.

Le modèle de régression linéaire contient un terme d'erreur représenté par ε. Le terme d’erreur est utilisé pour tenir compte de la variabilité de oui cela ne peut pas s'expliquer par le relation linéaire entre X et oui. Si ε n’était pas présent, cela signifierait que connaître X fournirait suffisamment d’informations pour déterminer la valeur de oui.

Il existe également des paramètres qui représentent la population étudiée. Ces paramètres du modèle sont représentés par β₀etβ₁.

L'équation de régression linéaire simple est représentée graphiquement par une ligne droite, où:

β₀ est l'ordonnée à l'origine de la droite de régression.
β₁ est la pente.
Ε(oui) est la valeur moyenne ou attendue de oui pour une valeur donnée de X.

Une droite de régression peut montrer une relation linéaire positive, une relation linéaire négative ou aucune relation.

Pas de relation: La ligne représentée graphiquement dans une régression linéaire simple est plate (et non inclinée). Il n'y a aucune relation entre les deux variables.
Relation positive: La droite de régression est inclinée vers le haut, l'extrémité inférieure de la droite se trouvant à l'ordonnée à l'origine (axe) du graphique et l'extrémité supérieure de la ligne s'étendant vers le haut dans le champ du graphique, loin de l'ordonnée à l'origine (axe). Il existe une relation linéaire positive entre les deux variables: à mesure que la valeur de l’une augmente, la valeur de l’autre augmente également.
Relation négative : La ligne de régression est inclinée vers le bas avec l'extrémité supérieure de la ligne à l'origine (axe) du graphique et l'extrémité inférieure de la ligne s'étendant vers le bas dans le champ du graphique, vers l'ordonnée à l'origine (axe). Il existe une relation linéaire négative entre les deux variables: à mesure que la valeur de l’une augmente, la valeur de l’autre diminue.

L'équation de régression linéaire estimée

Si la paramètres de la population étaient connues, l’équation de régression linéaire simple (présentée ci-dessous) pourrait être utilisée pour calculer la valeur moyenne de oui pour une valeur connue de X.

Ε(oui) = β₀ +β₁X+ε.

Cependant, en pratique, les valeurs des paramètres ne sont généralement pas connues et doivent donc être estimées à l'aide de données d'un échantillon de la population. Les paramètres de population sont estimés en utilisant exemples de statistiques. Le exemples de statistiques sont représentés par β₀ et β₁. Lorsque les statistiques de l'échantillon sont remplacées par les paramètres de population, l'équation de régression estimée est formée.

L'équation de régression estimée est la suivante:

(ŷ) = β₀ +β₁X+ε.

Note: (ŷ) est prononcé ton chapeau.

Le graphique de l’équation de régression simple estimée est appelé droite de régression estimée.

β₀est l'ordonnée à l'origine de la droite de régression.
β₁est la pente.
(ŷ) est la valeur estimée de oui pour une valeur donnée de X.

Limites de la régression linéaire simple

Même les meilleures données ne racontent pas une histoire complète.

L'analyse de régression est couramment utilisée dans la recherche pour établir qu'il existe une corrélation entre les variables. Mais la corrélation n'est pas la même chose que la causalité: une relation entre deux variables ne signifie pas que l’une provoque l’autre. Même une ligne dans une simple régression linéaire qui correspond bien aux points de données peut ne pas garantir une relation de cause à effet.

L'utilisation d'un modèle de régression linéaire vous permettra de découvrir s'il existe une relation entre les variables. Pour comprendre exactement quelle est cette relation et si une variable en entraîne une autre, vous aurez besoin de recherches et d’analyses statistiques supplémentaires.

Qu'est-ce que la régression linéaire simple et comment elle fonctionne

Formule pour un modèle de régression linéaire simple

L'équation de régression linéaire estimée

Limites de la régression linéaire simple

Exemples de clôture de lettres commerciales

Œuvres créatives que vous pouvez et ne pouvez pas protéger

Les exigences d’un bail immobilier valide