Multivarijantna analiza

Vidi također: Metode istraživanja

Naše stranice Jednostavna statistička analiza , Razvoj i ispitivanje hipoteza i Intervali značajnosti i povjerenja objasniti neke jednostavnije tehnike korištene za statističku analizu. Ova stranica raspravlja o nekim naprednijim tehnikama, koje uključuju nekoliko varijabli, a ne samo jednu ili dvije.

U stvarnom životu, za razliku od laboratorijskih istraživanja, vjerojatno ćete otkriti da na vaše podatke utječu mnoge stvari, osim varijable koju želite testirati. Postoje korelacije između predmeta koje nikada niste uzeli u obzir, a svijet je složen.

Svrha napredne statističke analize je pojednostaviti neke veze, a istovremeno stvoriti učinkovitiji model onoga što vidite.




Postoje četiri načina za pojednostavljivanje analize

  • Oblikovati
  • Korištenje poduzorka
  • Korištenje statističkih kontrola
  • Multivarijantna analiza

1. Dizajn

Možete dizajnirati svoje istraživanje tako da uzročni čimbenici postanu neovisni jedni o drugima. Na primjer, ako mislite da možda postoji veza između dobi i plaće, slučajni uzorak zaposlenika riskirat će kombiniranjem učinaka oba. Ako, međutim, stanovništvo podijelite u skupine prema dobi, a zatim nasumično uzorkujete jednak broj iz svake skupine, osamostalili ste dob i plaću.

2. Korištenje poduzorka

Ovdje odabirete svoj uzorak da bude jednak po svim potencijalno zbunjujućim čimbenicima. Na primjer, vrsta posla može utjecati na plaću, pa ako želite proučiti učinke drugog čimbenika na plaću, možete odabrati samo ljude koji rade isti posao.

3. Korištenje statističkih kontrola

Ako sumnjate da mogu biti povezane tri varijable, možete kontrolirati da jedan testira korelacije između druge dvije. Učinkovito prilagodite statističku vrijednost kontrole konstantnom i testirate postoji li još uvijek veza između druge dvije varijable. Možda ćete primijetiti da promatrana veza ostaje visoka (stvarna je) ili se znatno smanjuje (stvarne veze vjerojatno nema). Postoji i treći slučaj: gdje nema odnosa dok ne kontrolirate treću varijablu, što znači da kontrolna varijabla maskira odnos između druge dvije.

4. Multivarijantna analiza

Multivarijacijska analiza uključuje mnoge statističke metode koje su osmišljene tako da vam omoguće uključivanje više varijabli i ispitivanje doprinosa svake od njih.

Čimbenici koje uključite u svoju multivarijantnu analizu i dalje će ovisiti o tome što želite proučavati. Neke studije će htjeti promatrati doprinos određenih čimbenika, a druge studije za kontrolu tih čimbenika kao (više ili manje) smetnju.

Dvije vrste varijabli

U multivarijantnoj analizi prvo je što treba odlučiti o ulozi varijabli.

Dvije su mogućnosti:

što znači crta ispod nje
  • Varijabla uzroci efekt: prediktorska varijabla
  • Varijabla je utjecalo : zavisna varijabla

To je funkcija vašeg modela, a ne samih varijabli, a ista varijabla može biti ili u različitim studijama.

Odnosi između varijabli obično su prikazani slikom sa strelicama:

Dijagram koji prikazuje odnos između varijabli.

Varijable također možete promatrati izravno ili zaključiti iz onoga što se događa. Oni su poznati kao latentne varijable .

što je oznaka u matematici

Primjer: Uspjeh u školi


Teško je izmjeriti uspjeh u školi ': to je latentna varijabla .

Možete odlučiti da ' uspjeh u školi 'sastoji se od akademskog uspjeha, zajedno s određenom mjerom društvenog uspjeha (možda prosječno trajanje prijateljstva ili veličina' grupe prijateljstva '), plus jedan uloženi napor (koji biste mogli mjeriti kao percepciju ili učenika ili učitelja). To su vaše promatrane varijable.

The model mjerenja ispituje odnos između promatrane i latentne varijable.


Subjektivne i objektivne varijable


Kad god istražujete, vjerojatno će biti uključene različite vrste podataka. Na primjer, ovdje postoje i objektivni podaci (akademski uspjeh, prosječno trajanje prijateljstva) i subjektivni podaci (opaženi trud). Vrsta podataka koju odaberete utjecati će na kvalitetu vašeg istraživanja, kao i na zaključke koje možete izvući.

O tome ima više na našoj stranici na Vrste podataka .

Ideja koja stoji iza takvih modela je da postoje korelacije između promatrane i latentne varijable (da biste razumjeli više, možda biste željeli pročitati našu stranicu na Korelacije ).

Pretpostavlja se da su ove korelacije uzrokovane zajednički čimbenici . Što je veći utjecaj uobičajenih čimbenika ( opterećenje faktora ), veća je korelacija između latentne i promatrane varijable. Stoga ove korelacije morate izmjeriti kako biste procijenili pouzdanost, što možete učiniti na nekoliko načina. Jedna od najčešćih je upotreba konstrukcije tzv Cronbachova alfa (koji će vam izračunati većina statističkih softverskih paketa). Ovim se procjenjuje mjeri li vaša promatrana varijabla zapravo latentnu varijablu koja vas zanima, odnosno je li promatrana varijabla pouzdan test za latentnu varijablu. Vrijednost 0,70 ili više daje dobru razinu pouzdanosti modelu.

Cronbachova alfa koristi se za mjerenje korelacija između varijabli. Vrijednost 0,70 ili više daje dobru razinu pouzdanosti modelu.


Analiziranje mjernih modela u multivarijabilnoj analizi

Postoje razne metode analize za ovakve mjerne modele. Oni uključuju Potvrdna faktorska analiza i Analiza istraživačkog faktora , a obično se provode putem računala.

Pojedinosti kako izvršiti svaku od njih izvan su dosega ove stranice, ali osnovna ideja je da mjere koliko varijaciju viđenu u ukupnoj konstrukciji uzrokuje svaki čimbenik.

Uzročni modeli

Uzročni modeli promatraju način na koji su varijable povezane jedna s drugom. Iako nije moguće nedvojbeno dokazati uzročnost, uzročni modeli omogućuju vam da kažete odgovara li predloženi odnos podacima i koliko dobro.

kako promijeniti postotak u broj

Snaga ili slabost bilo kojeg uzročnog modela je odabir varijabli. Ako propustite glavni uzročni čimbenik, vaši će zaključci biti ograničeni ili netočni. Stoga vrijedi odvojiti vrijeme za što pažljivije definiranje svog modela.

Treba postići ravnotežu između jednostavnosti i uključivanja više varijabli kako bi se postiglo bolje prilagođavanje. Očito je da ne želite propustiti glavnu uzročnu varijablu, a uključivanje više varijabli uvijek će bolje odgovarati. No trebate razmotriti isplati li se dodatna složenost radi poboljšanja kvalitete modela.


Prikladne metode analize za uzročno-posljedične modele obično su ono što se naziva generaliziranim linearnim modelima, koje uključuju logistička regresijska analiza , višestruka regresijska analiza , multivarijatna analiza kovarijance (MANCOVA) i multivarijacijska analiza varijance (MANOVA) .

Sve ove metode daju vam mjeru kolika je razlika u ovisnim varijablama uzrokovana prediktorima, a time i je li vaš model dobar.

Opet, postoje računalni paketi koji mogu napraviti ove analize umjesto vas, ali svakako razumijete što radite i ispravno tumačite rezultate.

Modeliranje strukturnih jednadžbi okuplja mjerne modele i uzročne modele. To je tehnika računalnog modeliranja koja odgovara strukturnoj jednadžbi modela. Ova je tehnika komplicirana, ali u osnovi uspoređuje moguće modele i identificira onaj koji najbolje odgovara podacima.

Složeno područje

Svijet je složeno mjesto, a ponekad je jedini način da se shvati što se događa upotreba naprednih statističkih tehnika za modeliranje.

Međutim, i ove su složene i ne biste se trebali upuštati u njih bez razumijevanja osnova. Ako to ne učinite, onda je dobra ideja konzultirati nekoga tko to čini, obično statističara. Čak i ako ste već koristili tehniku, još je uvijek dobro pozvati statističara da pogleda što planirate i nakon toga provjeri svoje rezultate u slučaju nejasnih pogrešaka.

Loša analiza vrlo će brzo potkopati dobro istraživanje.

Nastavi na:
Uzorkovanje i dizajn uzoraka
Razumijevanje korelacija