Kvantitatiivsete andmete analüüsimise aluseks olev statistika
Lineaarse regressiooni mudelit kasutatakse kahe muutuja või teguri suhte näitamiseks või ennustamiseks. Prognoositav tegur (faktor, mille võrrand lahendab ) nimetatakse sõltuv muutuja. Funktsioone, mida kasutatakse sõltuva muutuja väärtuse ennustamiseks, nimetatakse sõltumatuteks muutujateks.
Hea info ei anna alati täielikku lugu. Uuringutes kasutatakse sageli regressioonanalüüsi, sest see näitab, et muutujate vahel on korrelatsioon.
Kuid korrelatsioon ei ole sama kui põhjuslik seos . Isegi lihtsa lineaarse regressiooniga joon, mis sobib hästi andmepunktidega, ei pruugi põhjustada põhjuslikke tagajärgi seostades midagi lõplikku.
Lihtsa lineaarse regressiooni korral koosneb iga vaatlus kahest väärtusest. Üks väärtus on sõltuva muutuja jaoks ja üks väärtus on sõltumatu muutuja jaoks.
- Lihtne lineaarne regressioonianalüüs Regressioonanalüüsi lihtsaim vorm kasutab sõltuvat muutujat ja üht sõltumatut muutujat. Selles lihtsas mudelis võrdleb sirge suhte sõltuva muutuja ja sõltumatu muutuja vahel.
- Mitu regressioonanalüüsi Kui regressioonanalüüsis kasutatakse kahte või enamat sõltumatut muutujat, ei ole mudel enam lihtne lineaarne.
Lihtne lineaarne regressioonimudel
Lihtne lineaarne regressioonimudel on kujutatud järgmiselt: y = ( β 0 + β 1 + Ε
Matemaatilise kokkuleppe kohaselt on kaks tegurit, mis on seotud lihtsa lineaarse regressiooni analüüsiga, tähistatud x ja y .
Võrrand, mis kirjeldab, kuidas y on seotud x-ga, nimetatakse regressioonimudeliks . Lineaarne regressioonimudel sisaldab ka veateget , mida tähistab E , või kreeka tähtedega epsilon. Vigade tähist kasutatakse y-i varieeruvuse arvestamiseks, mida ei saa seletada x- y lineaarse suhtega .
Seal on ka parameetreid, mis esindavad uuritavat elanikkonda. Need mudeli parameetrid, mida tähistab ( β 0+ β 1 x ).
Lihtne lineaarne regressioonimudel
Lihtne lineaarne regressioonivõrrand on kujutatud järgmiselt: E ( y ) = ( β 0 + β 1 x ).
Lihtne lineaarne regressioonivõrrand on joonistatud sirgjoonena.
( β 0 on regressiooniliini y ristmik.
β 1 on kalle.
E ( y ) on konkreetse x väärtuse keskmine või oodatav väärtus y .
Regressiooniliin võib näidata positiivset lineaarset suhet, negatiivset lineaarset suhet või seost puudub. Kui lihtsa lineaarse regressiooniga graafiline joon on tasane (mitte kaldu), pole kahe muutuja vahel mingit seost. Kui regressiooniliin tõuseb graafi y- ristmikul (teljel) joone alumise otsaga ülespoole ja graafi väljale pikeneb joon ülaosas, jääb x- ristmikust (telgist) eemal positiivne lineaarne suhe . Kui regressioonjoon gradiendi y- ristmikul (teljel) jookseb ülemise otsa alla ja graafi väljale ulatuva joone alumine ots on x- ristlõike (telje) suunas olemas negatiivne lineaarne suhe.
Hinnanguline lineaarne regressiooni võrrand
Kui elanikkonna parameetrid olid teada, siis saab x-i teadaoleva väärtuse jaoks keskväärtuse arvutamiseks kasutada lihtsat lineaarse regressiooni võrrandit (allpool näidatud).
E ( y ) = ( β 0 + β 1 x ).
Praktikas pole parameetri väärtused siiski teada, seega tuleb neid hinnata, kasutades populatsiooni näidise andmeid . Rahvastiku parameetreid hinnatakse proovide statistikat kasutades . Proovi statistikat tähistab b 0 + b 1. Kui populatsiooniparameetrite asemel on proovistatistika, moodustatakse hinnanguline regressioonivõrrand.
Hinnanguline regressioonvõrrand on toodud allpool.
( ŷ ) = ( β 0 + β 1 x
( ŷ ) hääldatakse y hat .
Hinnangulise lihtsa regressiooni võrrandi graafik on hinnanguline regressiooniliin.
B 0 on y ristmik.
B1 on kalle.
Ŷ ) on konkreetse väärtuse x hinnanguline väärtus y .
Tähtis märkus: Regressioonanalüüsi ei kasutata muutujate põhjus- ja tagajärgede seoste tõlgendamiseks. Regressioonanalüüs võib siiski näidata, kuidas muutujad on seotud või millisel määral muutujad on üksteisega seotud .
Sellisel juhul kaldub regressioonanalüüs tegema olulisi suhteid, mis annavad teadlastele lähemal uurimist.
Tuntud ka kui: bivariate regressioon, regressioonanalüüs
Näited: madalaima ruutude meetod on statistiline meetod prooviandmete kasutamiseks hinnangulise regressioonivõrrandi väärtuse leidmiseks. Madalaimate ruutude meetodit pakkus välja Carl Friedrich Gauss, kes sündis 1777. aastal ja suri 1855. aastal. Vähimruumide meetodit kasutatakse endiselt laialdaselt.
Allikad:
Anderson, DR, Sweeney, DJ ja Williams, TA (2003). Äri- ja majandusuuringute põhialused (3. väljaanne) Mason, Ohio: Edelaosa, Thompsoni õpe.
______. (2010). Selgitatakse: regressioonanalüüs. MIT News.
McIntyre, L. (1994). Sigaretiandmete kasutamine mitme regressiooniga tutvumiseks. Statistika Hariduse Väljaanne, 2 (1).
Mendenhall, W. ja Sincich, T. (1992). Inseneride ja teaduste statistika (3. väljaanne), New York, NY: Dellen Publishing Co
Panchenko, D. 18.443 Taotluste statistika, sügis 2006, § 14, lihtne lineaarne regressioon. (Massachusettsi Tehnoloogiainstituut: MIT OpenCourseWare)