Matematikmi boli vytvorené rôzne typy regresných analýz v závislosti od typu premenných do nich vstupujúcich, alebo od charakteru dát s ktorými analýza pracuje. Tu je krátky prehľad vybraných regresných analýz používaných začínajúcimi užívateľmi.
- Jednoduchá lineárna regresná analýza
- Viacnásobná lineárna regresná analýza
- Hierarchická regresná analýza
- Logistická regresná analýza
- Pre 2 výstupy (binominálna)
- Pre N výstupov (multinominálna)
- S ordinálnym výstupom
Regresná analýza skúma príčinné vzťahy medzi premennými. Tento vzťah aj regresia dokáže matematicky vyčísliť pomocou regresnej rovnice na rozdiel od korelácie, ktorá len konštatuje, že nejaký vzťah existuje. Pri regresnej analýze pracujeme s dvomi premennými: nezávislou a závislou premennou. Nezávislá premenná (Independent variable – IV, označovaná aj X) je premenná, ktorá ovplyvňuje závislú premennú. Nazýva sa tiež prediktor alebo determinant. Môžeme mať 1 prediktor vtedy hovoríme o jednoduchej regresnej analýze, alebo viac prediktorov a vtedy hovoríme o viacnásobnej regresnej analýze. Závislá premenná (Dependent variable -DV, označovaná aj Y) je premenná, ktorá závisí od nezávislej premennej.
Pred aplikáciou a následne prijatím výsledkov regresnej analýzy je nevyhnutné overiť tieto predpoklady a podmienky aplikácie, aby sme výsledky analýzy mohli považovať za platné:
- Najskôr si dôkladne premyslíme a skontrolujeme, či nami stanovená nezávislá premenná môže z hľadiska logickej racionálnej úvahy kauzálne, príčinne vplývať na našu závislú premennú. Následne si overíme , aký typ je moja závislá premenná, či je nominálna, ordinálna alebo kardinálna. Potom aplikujeme konkrétnu metódu regresnej analýzy.
- Miera autokorelácie rezidúií, meraná pomocou Durbin Watsonovho testu = DW. Používaným pravidlom je, že testovacie štatistické hodnoty v rozsahu 1,5 až 2,5 sú relatívne normálne. Dôležité je, aby test nebol štatisticky významný (p>0,05). Následne, ak je toto splnené, môžeme interpretovať výsledky samotnej regresnej analýzy. Keby sme mali porušený tento predpoklad, tak na dané dáta používam následne logistickú regresnú analýzu.
- Tolerancia = T – meria multikolinearitu. Používa sa pri viacnásobnej regresnej analýze.
Vysoká tolerancia (napr. 0,84 a viac až k 1) = nízka multikolinearita
Nízka tolerancia (napr. 0,19) = vysoká (závažná) multikolinearita
- Inflačný faktor rozptylu = VIF – rovnako meria multikolinearitu a používa sa pri viacnásobnej regresnej analýze. VIF 1 znamená, že medzi j-tým prediktorom a ostatnými premennými prediktora neexistuje žiadna korelácia. Všeobecným pravidlom je, že hodnoty VIF presahujúce 4 vyžadujú ďalšie skúmanie, zatiaľ čo hodnoty VIF presahujúce 10 sú znakmi vážnej multikolinearity vyžadujúcej korekciu.
- Ak je moja závislá premenná nominálna vždy používam logistickú regresnú analýzu: binominálnu (2 kategórie závislej premennej), alebo multinominálnu (viac kategórií závislej premennej).
- Ak je moja závislá premenná ordinálna alebo kardinálna aplikujem lineárnu regresnú analýzu. Pri jej aplikácii, však musím skontrolovať vyššie uvedené predpoklady – Assumption checks (autokoreláciu, mulitikolinearitu, normalitu, Q – Q graf). Ak sú porušené tieto predpoklady, potom znova robím logistickú regresnú analýzu.