Jednostavna statistička analiza

Vidi također: Dizajniranje istraživanja

Nakon što prikupite kvantitativne podatke, imat ćete puno brojeva. Sada je vrijeme da izvršite statističku analizu kako biste osmislili i izvukli neke zaključke iz svojih podataka.

Širok je raspon mogućih tehnika koje možete koristiti.

volumena i površina 3d oblika

Ova stranica pruža kratki sažetak nekih od najčešćih tehnika sažimanja podataka i objašnjava kada biste koristili svaku od njih.



Sažimanje podataka: grupiranje i vizualizacija

Prvo što treba učiniti s bilo kojim podacima je sažeti ga, što znači predstaviti ga na način koji najbolje govori priču.

Polazište je obično grupiranje sirovih podataka u kategorije i / ili njihova vizualizacija. Na primjer, ako mislite da bi vas mogle zanimati razlike prema godinama, prvo što treba učiniti je grupiranje podataka u dobnim kategorijama, možda desetogodišnjim ili petogodišnjim dijelovima.

Jedna od najčešćih tehnika koja se koristi za sažimanje je upotreba grafovi , posebno trakasti grafikoni, koji prikazuju svaku podatkovnu točku redom, ili histogrami, koji su trakasti grafikoni grupirani u šire kategorije.

U nastavku je prikazan primjer koji koristi tri skupa podataka, grupirana u četiri kategorije. To bi, na primjer, mogli biti „muškarci“, „žene“ i „drugi / nije naveden spol“, grupirani po dobnim kategorijama 20–29, 30–39, 40–49 i 50–59.

Primjer histograma

Alternativa histogramu je a linijski grafikon , koji ucrtava svaku podatkovnu točku i spaja ih crtom. Isti podaci kao na trakasti grafikonu prikazani su na linijskom grafikonu u nastavku.

Primjer linijskog grafikona

Nije teško ručno nacrtati histogram ili linijski grafikon, kao što se sjećate iz škole, ali proračunske tablice izvući će ga brzo i jednostavno nakon što unesete podatke u tablicu, čime ćete uštedjeti probleme. Oni će vas čak i provesti kroz postupak.

Vizualizirajte svoje podatke


Važno kod crtanja grafa je da vam daje trenutnu 'sliku' podataka. To je važno jer vam odmah pokazuje jesu li vaši podaci grupirani, šire li se, teže li visokim ili niskim vrijednostima ili su skupljeni oko središnje točke. Pokazat će vam i imate li ‘outliers’, odnosno vrlo visoke ili vrlo niske vrijednosti podataka, koje biste možda željeli izuzeti iz analize ili barem ponovno posjetiti kako biste provjerili jesu li točne.

Uvijek je vrijedno nacrtati grafikon prije nego što započnete bilo kakvu daljnju analizu, samo da biste pogledali svoje podatke.


Također možete prikazati grupirane podatke u a kružni graf , kao što je ovaj.

Primjer tortnog grafikona

Okrugli grafikoni najbolje se koriste kada vas zanima relativna veličina svake skupine i koliki udio ulazi u svaku kategoriju, jer vrlo jasno ilustriraju koje su skupine veće.

Pogledajte našu stranicu: Grafikoni i grafikoni za više informacija o različitim vrstama grafikona i grafikona.

Mjere lokacije: Prosjeci

The prosječno daje vam podatke o veličini učinka bilo čega što testirate, drugim riječima, bio on velik ili mali. Postoje tri mjere prosjeka: srednja, srednja i modus.

Pogledajte našu stranicu na Prosjeci za više o izračunavanju svakog i za brzi kalkulator.

Kad većina ljudi kaže prosjek, oni govore o znači . Prednost mu je što koristi sve dobivene vrijednosti podataka i može se koristiti za daljnju statističku analizu. Međutim, mogu ga iskriviti ‘outlieri’, vrijednosti koje su netipično velike ili male.

Kao rezultat toga, istraživači ponekad koriste medijan umjesto toga. To je sredina svih podataka. Medijana nije iskrivljena ekstremnim vrijednostima, ali je je teže koristiti za daljnju statističku analizu.

The način rada je najčešća vrijednost u skupu podataka. Ne može se koristiti za daljnju statističku analizu.

Vrijednosti srednje vrijednosti, medijana i modusa su ne isti, zbog čega je zaista važno biti jasan o kojem 'prosjeku' govorite.

Procjena sažetih mjera: robusnost i učinkovitost


Postoje dvije konstrukcije (ideje ili koncepti) koje se obično koriste za procjenu sažetih mjera kao što su srednja vrijednost, medijan i način rada. Ovi su robusnost i učinkovitost .

  • Robusnost je mjera koliko je sumarna mjera osjetljiva na promjene u kvaliteti podataka.

    Te promjene u kvaliteti podataka mogu nastati bilo izvanrednim vrijednostima, ekstremnim vrijednostima na bilo kojem kraju, bilo iz radnji poduzetih tijekom analize, poput grupiranja podataka za daljnju analizu. Robusna mjera NIJE osjetljiva na ove promjene. Medijan je stoga robusniji od srednje vrijednosti jer na njega ne utječu izvanredni uvjeti, a grupiranje će vjerojatno dovesti do vrlo malo promjena.

  • Učinkovitost je mjera koliko dobro sažeta mjera koristi sve podatke.

    Učinkovitija mjera koristi više podataka. Srednja vrijednost je stoga vrlo učinkovita, jer koristi sve podatke.

    neprikladne vrste poruka za aktivno slušanje uključuju poruke koje

Stoga su ove dvije mjere često kontradiktorne: snažnija mjera vjerojatno će biti manje učinkovita.

Morat ćete odlučiti što je važnije u vašoj analizi.

Mjere širenja: opseg, varijanca i standardno odstupanje

Istraživači često žele pogledati širenje podataka, odnosno koliko su podaci široko raspoređeni na cijeloj mogućoj mjernoj ljestvici.

Za to se često koriste tri mjere:

The domet je razlika između najveće i najmanje vrijednosti. Istraživači često citiraju interkvartilni Raspon , što je raspon srednje polovice podataka, od 25%, donjeg kvartila, do 75%, gornjeg kvartila vrijednosti (medijan je vrijednost od 50%). Da biste pronašli kvartile, upotrijebite isti postupak kao i za medijan, ali uzmite četvrtinu i tri četvrtine umjesto srednje točke.

The standardna devijacija mjeri prosječni raspon oko srednje vrijednosti i stoga daje osjećaj 'tipične' udaljenosti od srednje vrijednosti.

The varijance je kvadrat standardne devijacije. Izračunavaju se prema:

  1. izračunavanje razlike svake vrijednosti iz srednje vrijednosti;
  2. kvadriranje svakog (kako bi se uklonila bilo koja razlika između onih iznad i ispod srednje vrijednosti);
  3. zbrajanje kvadratnih razlika;
  4. dijeleći s brojem predmeta minus jedan.

To daje varijance .

Da bi se izračunao standardna devijacija , uzmite kvadratni korijen varijance.

Koso

The iskriviti mjeri koliko je skup podataka simetričan ili ima više visokih vrijednosti ili više niskih vrijednosti. Uzorak s nižim vrijednostima opisuje se kao negativno iskrivljen, a uzorak s većim vrijednostima kao pozitivno iskrivljen.

Općenito govoreći, što je iskrivljeniji uzorak, to će se manje poklapati srednja vrijednost, medijan i način rada.

Naprednija analiza

Nakon što izračunate neke osnovne vrijednosti mjesto , poput srednje vrijednosti ili medijana, širenje , kao što su opseg i varijance, i utvrdila razinu iskriviti , možete prijeći na napredniju statističku analizu i početi tražiti uzorke u podacima.

Nastavi na:
Vrste podataka
Multivarijantna analiza