Co to jest prosta regresja liniowa i jak działa

Modele regresji liniowej służą do pokazania lub przewidywania związku między dwoma zmienne lub czynniki. Czynnik, który jest przewidywany (czynnik, który równanie rozwiązuje dla) nazywa się zmienną zależną. Czynniki używane do przewidywania wartości zmiennej zależnej nazywane są zmiennymi niezależnymi.

W regresji liniowej każdy obserwacja składa się z dwóch wartości. Jedna wartość dotyczy zmiennej zależnej, a druga wartości zmiennej niezależnej. W ten prosty model, linia prosta przybliża związek między zmienną zależną a zmienną niezależną.

Kiedy w analizie regresji wykorzystuje się dwie lub więcej zmiennych niezależnych, model nie jest już prostym modelem liniowym. Nazywa się to regresją wielokrotną.

Wzór na prosty model regresji liniowej

Wyznaczono dwa czynniki biorące udział w prostej analizie regresji liniowej X I y. Równanie opisujące jak y odnosi się do X jest znany jako Model regresji.

Prosty model regresji liniowej reprezentowany jest przez:

y = β₀ +β₁X+ε.

Model regresji liniowej zawiera składnik błędu reprezentowany przez ε. Termin błędu służy do uwzględnienia zmienności

y tego nie da się wytłumaczyć zależność liniowa między X I y. Gdyby ε nie było obecne, oznaczałoby to tę wiedzę X dostarczyłoby wystarczających informacji do określenia wartości y.

Istnieją również parametry reprezentujące badaną populację. Te parametry modelu są reprezentowani przez β₀Iβ₁.

Proste równanie regresji liniowej przedstawiono na wykresie w postaci linii prostej, gdzie:

β₀ jest punktem przecięcia z osią y linii regresji.
β₁ jest nachylenie.
Ε(y) to średnia lub oczekiwana wartość y dla danej wartości X.

Linia regresji może wykazywać dodatnią zależność liniową, ujemną zależność liniową lub brak zależności.

Brak relacji: Linia wykreślona w prostej regresji liniowej jest płaska (nie nachylona). Nie ma związku między tymi dwiema zmiennymi.
Pozytywna relacja: Linia regresji nachyla się w górę, a dolny koniec linii znajduje się w punkcie przecięcia z osią y wykresu i górnego końca linii rozciągającej się w górę do pola wykresu, z dala od punktu przecięcia x (oś). Pomiędzy obiema zmiennymi istnieje dodatnia zależność liniowa: wraz ze wzrostem wartości jednej wzrasta także wartość drugiej.
Negatywna relacja: Linia regresji opada w dół, a jej górny koniec znajduje się w punkcie przecięcia z osią y wykresu i dolnego końca linii rozciągającej się w dół do pola wykresu, w kierunku punktu przecięcia z osią x (oś). Pomiędzy tymi dwiema zmiennymi istnieje ujemna zależność liniowa: wraz ze wzrostem wartości jednej wartość drugiej maleje.

Szacowane równanie regresji liniowej

Jeśli parametry populacji były znane, do obliczenia średniej wartości można zastosować proste równanie regresji liniowej (pokazane poniżej). y dla znanej wartości X.

Ε(y) = β₀ +β₁X+ε.

W praktyce jednak wartości parametrów na ogół nie są znane, dlatego należy je oszacować za pomocą dane z próbki populacji. Parametry populacji szacuje się za pomocą przykładowe statystyki. The przykładowe statystyki są reprezentowani przez β₀ I β₁. Gdy statystyki próbki zastąpią parametry populacji, utworzone zostanie oszacowane równanie regresji.

Szacowane równanie regresji to:

(ŷ) = β₀ +β₁X+ε.

Notatka: (ŷ) jest wymawiane twój kapelusz.

Wykres oszacowanego prostego równania regresji nazywany jest estymowaną linią regresji.

β₀jest punktem przecięcia z osią y linii regresji.
β₁jest nachylenie.
(ŷ) to szacunkowa wartość y dla danej wartości X.

Granice prostej regresji liniowej

Nawet najlepsze dane nie opowiadają pełnej historii.

Analiza regresji jest powszechnie stosowana w badaniach w celu ustalenia, czy istnieje korelacja między zmiennymi. Ale korelacja to nie to samo, co przyczynowość: związek między dwiema zmiennymi nie oznacza, że jedna powoduje wystąpienie drugiej. Nawet linia prostej regresji liniowej, która dobrze pasuje do punktów danych, może nie gwarantować związku przyczynowo-skutkowego.

Zastosowanie modelu regresji liniowej pozwoli Ci odkryć, czy w ogóle istnieje związek pomiędzy zmiennymi. Aby dokładnie zrozumieć, na czym polega ta zależność i czy jedna zmienna powoduje drugą, potrzebne będą dodatkowe badania i analizy statystyczne.

Co to jest prosta regresja liniowa i jak działa

Wzór na prosty model regresji liniowej

Szacowane równanie regresji liniowej

Granice prostej regresji liniowej

Użyj analizy kluczowych czynników pod kątem ważności i wydajności

Jak znaleźć prawnika

Wysoki rok stażu w armii amerykańskiej