Модели линеарне регресије се користе за приказивање или предвиђање односа између два варијабли или фактори. Фактор који се предвиђа (фактор који једначина решава за) се назива зависна варијабла. Фактори који се користе за предвиђање вредности зависне променљиве називају се независним променљивим.
У линеарној регресији, сваки посматрање састоји се од две вредности. Једна вредност је за зависну променљиву, а једна вредност за независну променљиву. У овај једноставан модел, права линија апроксимира однос између зависне променљиве и независне променљиве.
Када се у регресионој анализи користе две или више независних променљивих, модел више није једноставан линеарни. Ово је познато као вишеструка регресија.
Формула за једноставан модел линеарне регресије
Означена су два фактора који су укључени у једноставну линеарну регресиону анализу Икс и и. Једначина која описује како и повезано са Икс је познат као регресиони модел.
Једноставан модел линеарне регресије је представљен са:
и = β0 +β1Икс+ε.
Модел линеарне регресије садржи термин грешке који је представљен са ε. Термин грешке се користи да би се објаснила варијабилност у и то се не може објаснити линеарни однос између Икс и и. Да ε није присутно, то би значило да се зна Икс дало би довољно информација за одређивање вредности и.
Постоје и параметри који представљају популацију која се проучава. Ове параметри модела представљају β0 иβ1.
Једноставна једначина линеарне регресије је графички приказана као права линија, где је:
- β0 је и-пресек линије регресије.
- β1 је нагиб.
- Ε(и) је средња или очекивана вредност и за дату вредност од Икс.
Регресиона линија може показати позитивну линеарну везу, негативну линеарну везу или никакву везу.
- Нема веза: Графичка линија у једноставној линеарној регресији је равна (није нагнута). Нема везе између две варијабле.
- Позитивна веза: Линија регресије се нагиње нагоре са доњим крајем линије на пресеку и (оси) граф и горњи крај линије која се протеже нагоре у поље графикона, даље од пресека к (оса). Између две променљиве постоји позитивна линеарна веза: како се вредност једне повећава, тако се повећава и вредност друге.
- Негативан однос: Регресиона линија пада надоле са горњим крајем линије на пресеку и (оси) граф и доњи крај линије која се протеже надоле у поље графика, према к-пресеку (оса). Између две променљиве постоји негативна линеарна веза: како се вредност једне повећава, вредност друге опада.
Процењена једначина линеарне регресије
Ако је параметри становништва били познати, једноставна једначина линеарне регресије (приказана испод) могла би се користити за израчунавање средње вредности и за познату вредност од Икс.
Ε(и) = β0 +β1Икс+ε.
У пракси, међутим, вредности параметара генерално нису познате па се морају проценити коришћењем подаци из узорка становништва. Параметри популације се процењују коришћењем узорак статистике. Тхе узорак статистике представљају β0 и β1. Када се статистика узорка замени параметрима популације, формира се процењена регресиона једначина.
Процењена једначина регресије је:
(ŷ) = β0 +β1Икс+ε.
Белешка: (ŷ) се изговара и шешир.
График процењене једначине једноставне регресије назива се процењена линија регресије.
- β0је и-пресек линије регресије.
- β1је нагиб.
- (ŷ) је процењена вредност и за дату вредност од Икс.
Границе једноставне линеарне регресије
Чак ни најбољи подаци не говоре потпуну причу.
Регресиона анализа се обично користи у истраживањима како би се утврдило да постоји корелација између варијабли. Али корелација није исто што и узрочност: однос између две променљиве не значи да једна изазива појаву друге. Чак и линија у једноставној линеарној регресији која се добро уклапа у тачке података можда не гарантује узрочно-последичну везу.
Коришћење модела линеарне регресије ће вам омогућити да откријете да ли веза између променљивих уопште постоји. Да бисте тачно разумели шта је тај однос и да ли једна варијабла изазива другу, биће вам потребно додатно истраживање и статистичка анализа.