Lineárne regresné modely sa používajú na zobrazenie alebo predpovedanie vzťahu medzi dvoma premenné alebo faktory. Faktor, ktorý sa predpovedá (faktor, ktorý rovnica rieši pre) sa nazýva závislá premenná. Faktory, ktoré sa používajú na predpovedanie hodnoty závislej premennej, sa nazývajú nezávislé premenné.
Pri lineárnej regresii každý pozorovanie pozostáva z dvoch hodnôt. Jedna hodnota je pre závislú premennú a jedna hodnota pre nezávislú premennú. In tento jednoduchý model, priama čiara aproximuje vzťah medzi závislou premennou a nezávisle premennou.
Keď sa v regresnej analýze použijú dve alebo viac nezávislých premenných, model už nie je jednoduchý lineárny. Toto je známe ako viacnásobná regresia.
Vzorec pre jednoduchý model lineárnej regresie
Označujú sa dva faktory, ktoré sú zahrnuté v jednoduchej lineárnej regresnej analýze X a r. Rovnica, ktorá popisuje ako r súvisí X je známy ako regresný model.
Jednoduchý lineárny regresný model predstavuje:
r = β0 +β1X+ε.
Lineárny regresný model obsahuje chybový člen, ktorý je reprezentovaný ε. Chybový termín sa používa na zohľadnenie variability v
Existujú aj parametre, ktoré predstavujú skúmanú populáciu. Títo parametre modelu sú zastúpené β0 aβ1.
Jednoduchá lineárna regresná rovnica je vykreslená ako priamka, kde:
- β0 je priesečník y regresnej priamky.
- β1 je sklon.
- Ε(r) je stredná alebo očakávaná hodnota r pre danú hodnotu X.
Regresná čiara môže vykazovať pozitívny lineárny vzťah, negatívny lineárny vzťah alebo žiadny vzťah.
- Žiadna súvislosť: Čiara zobrazená v grafe v jednoduchej lineárnej regresii je plochá (nie je šikmá). Medzi týmito dvoma premennými neexistuje žiadny vzťah.
- Pozitívny vzťah: Regresná čiara má sklon nahor so spodným koncom čiary na priesečníku y (osi) grafu a horný koniec čiary siahajúci nahor do poľa grafu, preč od priesečníka x (os). Medzi týmito dvoma premennými existuje pozitívny lineárny vzťah: so zvyšujúcou sa hodnotou jednej sa zvyšuje aj hodnota druhej.
- Negatívny vzťah: Regresná čiara sa zvažuje nadol s horným koncom čiary na priesečníku y (osi) grafu a spodný koniec čiary siahajúci nadol do poľa grafu, smerom k priesečníku x (os). Medzi týmito dvoma premennými existuje negatívny lineárny vzťah: keď sa hodnota jednej zvyšuje, hodnota druhej klesá.
Odhadovaná lineárna regresná rovnica
Ak parametre populácie boli známe, na výpočet strednej hodnoty by sa mohla použiť jednoduchá lineárna regresná rovnica (uvedená nižšie). r za známu hodnotu X.
Ε(r) = β0 +β1X+ε.
V praxi však hodnoty parametrov vo všeobecnosti nie sú známe, takže sa musia odhadnúť pomocou údaje zo vzorky obyvateľov. Parametre populácie sa odhadujú pomocou vzorová štatistika. The vzorová štatistika sú zastúpené β0 a β1. Keď sú parametre populácie nahradené štatistikou vzorky, vytvorí sa odhadovaná regresná rovnica.
Odhadovaná regresná rovnica je:
(ŷ) = β0 +β1X+ε.
Poznámka: (ŷ) sa vyslovuje y klobúk.
Graf odhadnutej jednoduchej regresnej rovnice sa nazýva odhadovaná regresná priamka.
- β0je priesečník y regresnej priamky.
- β1je sklon.
- (ŷ) je odhadovaná hodnota r pre danú hodnotu X.
Limity jednoduchej lineárnej regresie
Ani tie najlepšie údaje nehovoria úplný príbeh.
Regresná analýza sa bežne používa vo výskume na zistenie, že medzi premennými existuje korelácia. ale korelácia nie je to isté ako príčinná súvislosť: vzťah medzi dvoma premennými neznamená, že jedna spôsobuje vznik druhej. Dokonca aj čiara v jednoduchej lineárnej regresii, ktorá dobre zapadá do údajových bodov, nemusí zaručiť vzťah príčiny a následku.
Použitie lineárneho regresného modelu vám umožní zistiť, či vzťah medzi premennými vôbec existuje. Aby ste presne pochopili, o aký vzťah ide a či jedna premenná spôsobuje druhú, budete potrebovať ďalší výskum a štatistickú analýzu.