Co to jest prosta regresja liniowa i jak działa

click fraud protection

Modele regresji liniowej służą do pokazania lub przewidywania związku między dwoma zmienne lub czynniki. Czynnik, który jest przewidywany (czynnik, który równanie rozwiązuje dla) nazywa się zmienną zależną. Czynniki używane do przewidywania wartości zmiennej zależnej nazywane są zmiennymi niezależnymi.

W regresji liniowej każdy obserwacja składa się z dwóch wartości. Jedna wartość dotyczy zmiennej zależnej, a druga wartości zmiennej niezależnej. W ten prosty model, linia prosta przybliża związek między zmienną zależną a zmienną niezależną.

Kiedy w analizie regresji wykorzystuje się dwie lub więcej zmiennych niezależnych, model nie jest już prostym modelem liniowym. Nazywa się to regresją wielokrotną.

Wzór na prosty model regresji liniowej

Wyznaczono dwa czynniki biorące udział w prostej analizie regresji liniowej X I y. Równanie opisujące jak y odnosi się do X jest znany jako Model regresji.

Prosty model regresji liniowej reprezentowany jest przez:

y = β0 +β1X+ε.

Model regresji liniowej zawiera składnik błędu reprezentowany przez ε. Termin błędu służy do uwzględnienia zmienności

y tego nie da się wytłumaczyć zależność liniowa między X I y. Gdyby ε nie było obecne, oznaczałoby to tę wiedzę X dostarczyłoby wystarczających informacji do określenia wartości y.

Istnieją również parametry reprezentujące badaną populację. Te parametry modelu są reprezentowani przez β0 Iβ1.

Proste równanie regresji liniowej przedstawiono na wykresie w postaci linii prostej, gdzie:

  1. β0 jest punktem przecięcia z osią y linii regresji.
  2. β1 jest nachylenie.
  3. Ε(y) to średnia lub oczekiwana wartość y dla danej wartości X.

Linia regresji może wykazywać dodatnią zależność liniową, ujemną zależność liniową lub brak zależności.

  1. Brak relacji: Linia wykreślona w prostej regresji liniowej jest płaska (nie nachylona). Nie ma związku między tymi dwiema zmiennymi.
  2. Pozytywna relacja: Linia regresji nachyla się w górę, a dolny koniec linii znajduje się w punkcie przecięcia z osią y wykresu i górnego końca linii rozciągającej się w górę do pola wykresu, z dala od punktu przecięcia x (oś). Pomiędzy obiema zmiennymi istnieje dodatnia zależność liniowa: wraz ze wzrostem wartości jednej wzrasta także wartość drugiej.
  3. Negatywna relacja: Linia regresji opada w dół, a jej górny koniec znajduje się w punkcie przecięcia z osią y wykresu i dolnego końca linii rozciągającej się w dół do pola wykresu, w kierunku punktu przecięcia z osią x (oś). Pomiędzy tymi dwiema zmiennymi istnieje ujemna zależność liniowa: wraz ze wzrostem wartości jednej wartość drugiej maleje.

Szacowane równanie regresji liniowej

Jeśli parametry populacji były znane, do obliczenia średniej wartości można zastosować proste równanie regresji liniowej (pokazane poniżej). y dla znanej wartości X.

Ε(y) = β0 +β1X+ε.

W praktyce jednak wartości parametrów na ogół nie są znane, dlatego należy je oszacować za pomocą dane z próbki populacji. Parametry populacji szacuje się za pomocą przykładowe statystyki. The przykładowe statystyki są reprezentowani przez β0 I β1. Gdy statystyki próbki zastąpią parametry populacji, utworzone zostanie oszacowane równanie regresji.

Szacowane równanie regresji to:

(ŷ) = β0 +β1X+ε.

Notatka: (ŷ) jest wymawiane twój kapelusz.

Wykres oszacowanego prostego równania regresji nazywany jest estymowaną linią regresji.

  1. β0jest punktem przecięcia z osią y linii regresji.
  2. β1jest nachylenie.
  3. (ŷ) to szacunkowa wartość y dla danej wartości X.

Granice prostej regresji liniowej

Nawet najlepsze dane nie opowiadają pełnej historii.

Analiza regresji jest powszechnie stosowana w badaniach w celu ustalenia, czy istnieje korelacja między zmiennymi. Ale korelacja to nie to samo, co przyczynowość: związek między dwiema zmiennymi nie oznacza, że ​​jedna powoduje wystąpienie drugiej. Nawet linia prostej regresji liniowej, która dobrze pasuje do punktów danych, może nie gwarantować związku przyczynowo-skutkowego.

Zastosowanie modelu regresji liniowej pozwoli Ci odkryć, czy w ogóle istnieje związek pomiędzy zmiennymi. Aby dokładnie zrozumieć, na czym polega ta zależność i czy jedna zmienna powoduje drugą, potrzebne będą dodatkowe badania i analizy statystyczne.

Użyj analizy kluczowych czynników pod kątem ważności i wydajności

Jeśli jesteś menedżerem o ograniczonych zasobach, wprowadzenie ulepszeń, o których wiesz, że ostatecznie przyniosą korzyści Twojej organizacji, będzie wyzwaniem. Aby uzyskać jak największy zwrot z każdej wydanej złotówki, jedną z opcji określenia...

Czytaj więcej

Jak znaleźć prawnika

Jeśli chcesz zatrudnić prawnika, nie zabraknie Ci talentu prawniczego. Stany Zjednoczone zamieszkuje 5% światowej populacji i 70% prawników. Szkoły prawnicze przyznają średnio 43 588 dyplomów J.D. rocznie, co oznacza wzrost o 11,5% od 2000 r., a ...

Czytaj więcej

Wysoki rok stażu w armii amerykańskiej

W wojsku, przez całą karierę żołnierza, lotnika, Morskilub żeglarza, od członków tego oczekuje się awans w randze i płacenie stopni co kilka lat. Osoba zaciągnięta musi zostać awansowana w określonych ramach czasowych swojej kariery lub musi oddz...

Czytaj więcej