Vaadake, mis lihtsal sirgel regressioonil on ja kuidas see toimib

Kvantitatiivsete andmete analüüsimise aluseks olev statistika

Courtesy Colin Broug, fotograaf. © 10. juuni 2010 Stock.xchng

Lineaarse regressiooni mudelit kasutatakse kahe muutuja või teguri suhte näitamiseks või ennustamiseks. Prognoositav tegur (faktor, mille võrrand lahendab ) nimetatakse sõltuv muutuja. Funktsioone, mida kasutatakse sõltuva muutuja väärtuse ennustamiseks, nimetatakse sõltumatuteks muutujateks.

Hea info ei anna alati täielikku lugu. Uuringutes kasutatakse sageli regressioonanalüüsi, sest see näitab, et muutujate vahel on korrelatsioon.

Kuid korrelatsioon ei ole sama kui põhjuslik seos . Isegi lihtsa lineaarse regressiooniga joon, mis sobib hästi andmepunktidega, ei pruugi põhjustada põhjuslikke tagajärgi seostades midagi lõplikku.

Lihtsa lineaarse regressiooni korral koosneb iga vaatlus kahest väärtusest. Üks väärtus on sõltuva muutuja jaoks ja üks väärtus on sõltumatu muutuja jaoks.

Lihtne lineaarne regressioonimudel

Lihtne lineaarne regressioonimudel on kujutatud järgmiselt: y = ( β 0 + β 1 + Ε

Matemaatilise kokkuleppe kohaselt on kaks tegurit, mis on seotud lihtsa lineaarse regressiooni analüüsiga, tähistatud x ja y .

Võrrand, mis kirjeldab, kuidas y on seotud x-ga, nimetatakse regressioonimudeliks . Lineaarne regressioonimudel sisaldab ka veateget , mida tähistab E , või kreeka tähtedega epsilon. Vigade tähist kasutatakse y-i varieeruvuse arvestamiseks, mida ei saa seletada x- y lineaarse suhtega .

Seal on ka parameetreid, mis esindavad uuritavat elanikkonda. Need mudeli parameetrid, mida tähistab ( β 0+ β 1 x ).

Lihtne lineaarne regressioonimudel

Lihtne lineaarne regressioonivõrrand on kujutatud järgmiselt: E ( y ) = ( β 0 + β 1 x ).

Lihtne lineaarne regressioonivõrrand on joonistatud sirgjoonena.

( β 0 on regressiooniliini y ristmik.

β 1 on kalle.

E ( y ) on konkreetse x väärtuse keskmine või oodatav väärtus y .

Regressiooniliin võib näidata positiivset lineaarset suhet, negatiivset lineaarset suhet või seost puudub. Kui lihtsa lineaarse regressiooniga graafiline joon on tasane (mitte kaldu), pole kahe muutuja vahel mingit seost. Kui regressiooniliin tõuseb graafi y- ristmikul (teljel) joone alumise otsaga ülespoole ja graafi väljale pikeneb joon ülaosas, jääb x- ristmikust (telgist) eemal positiivne lineaarne suhe . Kui regressioonjoon gradiendi y- ristmikul (teljel) jookseb ülemise otsa alla ja graafi väljale ulatuva joone alumine ots on x- ristlõike (telje) suunas olemas negatiivne lineaarne suhe.

Hinnanguline lineaarne regressiooni võrrand

Kui elanikkonna parameetrid olid teada, siis saab x-i teadaoleva väärtuse jaoks keskväärtuse arvutamiseks kasutada lihtsat lineaarse regressiooni võrrandit (allpool näidatud).

E ( y ) = ( β 0 + β 1 x ).

Praktikas pole parameetri väärtused siiski teada, seega tuleb neid hinnata, kasutades populatsiooni näidise andmeid . Rahvastiku parameetreid hinnatakse proovide statistikat kasutades . Proovi statistikat tähistab b 0 + b 1. Kui populatsiooniparameetrite asemel on proovistatistika, moodustatakse hinnanguline regressioonivõrrand.

Hinnanguline regressioonvõrrand on toodud allpool.

( ŷ ) = ( β 0 + β 1 x

( ŷ ) hääldatakse y hat .

Hinnangulise lihtsa regressiooni võrrandi graafik on hinnanguline regressiooniliin.

B 0 on y ristmik.

B1 on kalle.

Ŷ ) on konkreetse väärtuse x hinnanguline väärtus y .

Tähtis märkus: Regressioonanalüüsi ei kasutata muutujate põhjus- ja tagajärgede seoste tõlgendamiseks. Regressioonanalüüs võib siiski näidata, kuidas muutujad on seotud või millisel määral muutujad on üksteisega seotud .

Sellisel juhul kaldub regressioonanalüüs tegema olulisi suhteid, mis annavad teadlastele lähemal uurimist.

Tuntud ka kui: bivariate regressioon, regressioonanalüüs

Näited: madalaima ruutude meetod on statistiline meetod prooviandmete kasutamiseks hinnangulise regressioonivõrrandi väärtuse leidmiseks. Madalaimate ruutude meetodit pakkus välja Carl Friedrich Gauss, kes sündis 1777. aastal ja suri 1855. aastal. Vähimruumide meetodit kasutatakse endiselt laialdaselt.

Allikad:

Anderson, DR, Sweeney, DJ ja Williams, TA (2003). Äri- ja majandusuuringute põhialused (3. väljaanne) Mason, Ohio: Edelaosa, Thompsoni õpe.

______. (2010). Selgitatakse: regressioonanalüüs. MIT News.

McIntyre, L. (1994). Sigaretiandmete kasutamine mitme regressiooniga tutvumiseks. Statistika Hariduse Väljaanne, 2 (1).

Mendenhall, W. ja Sincich, T. (1992). Inseneride ja teaduste statistika (3. väljaanne), New York, NY: Dellen Publishing Co

Panchenko, D. 18.443 Taotluste statistika, sügis 2006, § 14, lihtne lineaarne regressioon. (Massachusettsi Tehnoloogiainstituut: MIT OpenCourseWare)