Vad enkel linjär regression är och hur det fungerar

click fraud protection

Linjära regressionsmodeller används för att visa eller förutsäga sambandet mellan två variabler eller faktorer. Faktorn som förutsägs (faktorn som ekvationen löser för) kallas den beroende variabeln. De faktorer som används för att förutsäga värdet på den beroende variabeln kallas de oberoende variablerna.

I linjär regression, var och en observation består av två värden. Ett värde är för den beroende variabeln och ett värde är för den oberoende variabeln. I denna enkla modell, en rät linje approximerar förhållandet mellan den beroende variabeln och den oberoende variabeln.

När två eller flera oberoende variabler används i regressionsanalys är modellen inte längre en enkel linjär. Detta är känt som multipel regression.

Formel för en enkel linjär regressionsmodell

De två faktorer som är involverade i enkel linjär regressionsanalys betecknas x och y. Ekvationen som beskriver hur y är relaterat till x är känt som regressionsmodell.

Den enkla linjära regressionsmodellen representeras av:

y = β0 +β1x+ε.

Den linjära regressionsmodellen innehåller en felterm som representeras av ε. Feltermen används för att redogöra för variabiliteten i y som inte kan förklaras av linjärt förhållande mellan x och y. Om ε inte var närvarande skulle det betyda att veta x skulle ge tillräckligt med information för att fastställa värdet av y.

Det finns också parametrar som representerar populationen som studeras. Dessa modellens parametrar representeras av β0 ochβ1.

Den enkla linjära regressionsekvationen ritas som en rät linje, där:

  1. β0 är regressionslinjens y-avsnitt.
  2. β1 är sluttningen.
  3. Ε(y) är medelvärdet eller förväntat värde för y för ett givet värde av x.

En regressionslinje kan visa ett positivt linjärt samband, ett negativt linjärt samband eller inget samband.

  1. Ingen relation: Den grafiska linjen i en enkel linjär regression är platt (inte lutande). Det finns inget samband mellan de två variablerna.
  2. Positivt förhållande: Regressionslinjen sluttar uppåt med den nedre änden av linjen vid y-skärningen (axeln) för grafen och den övre änden av linjen sträcker sig uppåt in i graffältet, bort från x-skärningen (axel). Det finns ett positivt linjärt samband mellan de två variablerna: när värdet på den ena ökar, ökar också värdet på den andra.
  3. Negativt förhållande: Regressionslinjen sluttar nedåt med den övre änden av linjen vid y-skärningen (axeln) för grafen och den nedre änden av linjen sträcker sig nedåt in i graffältet, mot x-skärningen (axel). Det finns ett negativt linjärt samband mellan de två variablerna: när värdet på den ena ökar, minskar värdet på den andra.

Den beräknade linjära regressionsekvationen

Om parametrar för befolkningen var kända, kunde den enkla linjära regressionsekvationen (visas nedan) användas för att beräkna medelvärdet av y för ett känt värde av x.

Ε(y) = β0 +β1x+ε.

I praktiken är dock parametervärden i allmänhet inte kända så de måste uppskattas med hjälp av data från ett prov av populationen. Populationsparametrarna uppskattas med hjälp av exempelstatistik. De exempelstatistik representeras av β0 och β1. När urvalsstatistiken ersätts med populationsparametrarna, bildas den uppskattade regressionsekvationen.

Den uppskattade regressionsekvationen är:

(ŷ) = β0 +β1x+ε.

Notera: (ŷ) uttalas y hatt.

Grafen för den uppskattade enkla regressionsekvationen kallas den uppskattade regressionslinjen.

  1. β0är regressionslinjens y-avsnitt.
  2. β1är sluttningen.
  3. (ŷ) är det uppskattade värdet av y för ett givet värde av x.

Gränser för enkel linjär regression

Inte ens de bästa uppgifterna berättar en fullständig historia.

Regressionsanalys används ofta i forskning för att fastställa att det finns en korrelation mellan variabler. Men korrelation är inte detsamma som orsakssamband: ett samband mellan två variabler betyder inte att den ena orsakar den andra. Även en linje i en enkel linjär regression som passar datapunkterna väl kanske inte garanterar ett orsak-och-verkan-samband.

Genom att använda en linjär regressionsmodell kan du upptäcka om det överhuvudtaget finns ett samband mellan variabler. För att förstå exakt vad det förhållandet är, och om en variabel orsakar en annan, behöver du ytterligare forskning och statistisk analys.

Special Forces Senior Sergeant (MOS 18Z)

Arméns specialstyrkor MOS 18 – är en blandning av jobb inom specialstyrkornas Operational Detachment Alpha (ODA) som utgör en liten enhets taktik (12 man) team med oöverträffad skicklighet i specialkrigföring. 18Z är ODA: s seniorsergeant och lät...

Läs mer

Grunderna i Wisconsins säkerhetsdepositionslag

Om du är en hyresgäst i delstaten Wisconsin kan du behöva betala en deposition innan du flyttar in. Det finns vissa regler hyresvärdar måste följa med när de hämtar, gör avdrag från och återlämnar denna deposition. Lär dig åtta juridiska grundkra...

Läs mer

Topp globala varuhusåterförsäljare

När man tittar på listor över de största varuhuskedjorna och lågprisvaruhuskedjorna runt om i världen tycks USA ha positionen som ledande inom detaljhandeln med varuhus. Största andelen av den totala industriförsäljningen Många av de största am...

Läs mer