4 Dažnai naudojamos dispersijos priemonės

Yra keturios dažniausiai taikomos priemonės, rodančios kintamumą (arba dispersiją) priemonių rinkinyje. Jie yra: 1. Diapazonas 2. Kvartilinis nuokrypis 3. Vidutinis nuokrypis 4. Standartinis nuokrypis.

# 1 priemonė.

Diapazonas yra intervalas tarp didžiausio ir žemiausio taško. Diapazonas yra kintamųjų ar skirtingų matmenų, tarp jų ir kintamumo, matas ir nesuteikia idėjos apie stebėjimų plitimą aplink tam tikrą centrinę vertę.

Simboliškai R = Hs - Ls. Kur R = intervalas;

Hs yra „Aukščiausias balas“, o Ls yra mažiausias balas.

Diapazono apskaičiavimas (neapskaityti duomenys):

1 pavyzdys:

Dešimties berniukų balai teste yra:

17, 23, 30, 36, 45, 51, 58, 66, 72, 77.

2 pavyzdys:

Dešimties mergaičių rezultatai teste yra:

48, 49, 51, 52, 55, 57, 50, 59, 61, 62.

I pavyzdyje aukščiausias rezultatas yra 77, o mažiausias rezultatas - 17.

Taigi diapazonas yra skirtumas tarp šių dviejų balų:

. . . Diapazonas = 77 - 17 = 60

Panašiai, II pavyzdyje

Diapazonas = 62 - 48 = 14

Čia matome, kad berniukų balai yra plačiai išsklaidyti. Taigi berniukų balai labai skiriasi, tačiau mergaičių balai labai skiriasi (žinoma, jie skiriasi mažiau). Taigi berniukų balų įvairovė yra daugiau nei mergaičių balų įvairovė.

Diapazono apskaičiavimas (grupuoti duomenys):

3 pavyzdys:

Raskite sekančio platinimo duomenų diapazoną:

Sprendimas:

Šiuo atveju aukščiausia 70-79 klasės aukščiausia riba yra Hs = 79, 5, o žemiausia 20-29 klasės mažiausia tikroji riba yra Ls = 19, 5

Todėl diapazonas R = Hs - Ls

= 79, 5 - 19, 5 = 60, 00

Diapazonas yra kintamumo indeksas. Kai diapazonas yra didesnis, grupė yra labiau kintama. Kuo mažesnis diapazonas, tuo homogeniškesnė grupė. Diapazonas yra labiausiai paplitęs balų (arba priemonių) „sklaidos“ arba „išsklaidymo“ matas. Kai norime apytiksliai palyginti dviejų ar daugiau grupių kintamumą, galime apskaičiuoti diapazoną.

Diapazonas, palyginti su aukščiau, yra neapdorotas arba yra absoliutus dispersijos matas ir yra netinkamas palyginimui, ypač kai serija yra dviem skirtingais vienetais. Palyginimui, diapazono koeficientas apskaičiuojamas padalijus diapazoną iš didžiausių ir mažiausių elementų sumos.

Privalumai:

1. Diapazonas gali būti apskaičiuojamas gana lengvai.

2. Tai paprasčiausias sklaidos matas.

3. Jis apskaičiuojamas tada, kai norime apytiksliai palyginti du ar daugiau grafikų su kintamumu.

Apribojimai:

1. Diapazonas nėra pagrįstas visomis serijos pastabomis. Jame atsižvelgiama tik į kraštutinius atvejus.

2. Tai padeda mums apytiksliai palyginti dvi ar daugiau kintamumo grupių.

3. Diapazonas atsižvelgia į du serijos kraštutinius balus.

Taigi, kai N yra mažas arba kai dažnio pasiskirstyme yra didelių spragų, diapazonas kaip kintamumo matas yra gana nepatikimas.

4 pavyzdys:

A - 3, 5, 8, 11, 20, 22, 27, 33 grupės balai

Čia intervalas = 33 - 3 = 30

B grupės 3, 5, 8, 11, 20, 22, 27, 93 balai

Čia intervalas = 93 - 3 = 90.

Tiesiog palyginkite A ir B grupių balų seriją. A grupėje, jei vienas balas 33 (paskutinis balas) keičiamas į 93, diapazonas yra plačiai keičiamas. Taigi vienas aukštas rezultatas gali padidinti diapazoną nuo mažo iki aukšto. Todėl diapazonas nėra patikimas kintamumo matas.

4. Jį labai veikia mėginių ėmimo svyravimai. Jo vertė niekada nėra stabili. Klasėje, kurioje studentų aukštis svyruoja nuo 150 cm iki 180 cm, jei leidžiama nykštukė, kurios aukštis yra 90 cm, diapazonas būtų nuo 90 cm iki 180 cm.

5. Diapazonas tikrai nepateikia serijos ir išsklaidymo. Asimetrinis ir simetriškas pasiskirstymas gali būti toks pat, bet ne tas pats dispersija. Jis yra nedidelio tikslumo ir turėtų būti naudojamas atsargiai.

Tačiau neturėtume pamiršti, kad diapazonas yra neapdorotas sklaidos matas ir yra visiškai netinkamas tiksliams ir tiksliems tyrimams.

# 2. Ketvirtoji nukrypimas:

Diapazonas yra intervalas arba atstumas matavimo skalėje, apimantis 100 procentų atvejų. Diapazono apribojimai atsirado dėl jos priklausomybės tik nuo dviejų kraštutinių verčių.

Yra keletas dispersijos priemonių, kurios nepriklauso nuo šių dviejų kraštutinių vertybių. Dažniausiai tai yra kvartilinis nuokrypis, pagrįstas intervalu, kuriame yra vidutinis 50 procentų atvejų tam tikrame pasiskirstyme.

Kvartilinis nuokrypis yra pusė skalės atstumo tarp trečiojo kvartilio ir pirmojo kvartilio. Tai yra pusiau kvartilinis platinimo diapazonas:

Prieš pradėdami nukrypti nuo kvartilio, turime žinoti ketvirčių ir kvartilų reikšmę.

Pavyzdžiui, bandymo rezultatai 20 balų ir šie balai išdėstomi mažėjančia tvarka. Padalinkime balų pasiskirstymą į keturias lygias dalis. Kiekviena dalis pristatys „ketvirtį“. Kiekviename ketvirtyje bus 25% (arba 1/4 N) atvejų.

Kadangi balai išdėstomi mažėjančia tvarka,

5 geriausi balai bus pirmąjį ketvirtį,

Kiti 5 balai bus antrąjį ketvirtį,

Kiti 5 balai bus trečiąjį ketvirtį ir

Mažiausi 5 balai bus ketvirtąjį ketvirtį.

Siekiant geriau ištirti serijos sudėtį, gali prireikti jį padalyti į tris, keturis, šešis, septynis, aštuonis, devynis, dešimt ar šimtus dalių.

Paprastai serija suskirstyta į keturias, dešimt ar šimtą dalių. Vienas elementas seriją skirsto dviem dalimis: trys elementai iš keturių dalių (kvartiliai), devyni elementai iš dešimties dalių (deciliai) ir devyniasdešimt devyni elementai iš šimto dalių (procentiliai).

Taigi serijoje yra trys kvartilai, devyni deciliai ir devyniasdešimt devyni procentiliai. Antrasis kvartilis arba 5-oji decilė arba 50-oji procentilė yra mediana (žr. Pav.).

Elemento, padalijančio pirmąją serijos pusę (vertes, mažesnes už medianą), vertė į dvi lygias dalis vadinama Pirmuoju kvartetu (Q 1 ) arba Žemutiniu kvartilu. Kitaip tariant, Q 1 yra taškas, žemiau kurio yra 25% atvejų. Q1 yra 25-asis procentilis.

Antrasis kvartilis (Mdn) arba vidurinis kvartilis yra mediana. Kitaip tariant, tai yra taškas, žemiau kurio yra 50% balų. Mediana yra 50 procentilė.

Objekto, padalijančio antrąją serijos pusę (vertes, kurios yra didesnės už medianą), vertė į dvi lygias dalis vadinama Trečiuoju kvartetu (Q 3 ) arba Aukštesniu kvartilu. Kitaip tariant, Q 3 yra taškas, žemiau kurio yra 75% balų. Q3 yra 75-asis procentilis.

Pastaba:

Studentas turi aiškiai atskirti ketvirtį ir kvartilį. Ketvirtis yra intervalas; tačiau kvartilis yra skalės taškas. Ketvirčiai numeruojami iš viršaus į apačią (arba nuo aukščiausio taško iki žemiausio taško), tačiau kvartilai yra sunumeruoti nuo apačios iki viršaus.

Kvartilinis nuokrypis (Q) yra pusė skalės atstumo tarp Trečiojo kvartilio (Q 3 ) ir Pirmojo kvartilio (Q 1 ):

L = Ci apatinė riba, kurioje yra Q 3,

3N / 4 = 3/4 iš Nor 75% N.

F = visų dažnių, esančių žemiau „L“, skaičius;

fq = ci dažnis, ant kurio Q3 yra, ir i = ci dydis arba ilgis

L = apatinė Ci riba, kur yra Q 1,

N / 4 = vienas ketvirtis (arba 25%) N,

F = visų dažnių, esančių žemiau „L“, skaičius;

fq = ci, kuriam priklauso Q 1, dažnis,

ir i = ci dydis arba ilgis

Tarp kvartilų diapazonas:

Diapazonas tarp trečiojo kvartilio ir pirmojo kvartilio yra žinomas kaip tarpkvartilinis diapazonas. Simboliškai tarp kvartilių diapazonas = Q 3 - Q 1 .

Pusiau kvartalų diapazonas:

Tai pusė atstumo tarp trečiojo kvartilio ir pirmojo kvartilio.

Taigi, SI R. = Q3 - Q 1/4

Q arba kvartilinis nukrypimas kitaip vadinamas pusiau kvartiliu diapazonu (arba SIR)

Taigi, Q = Q3 - Q 1/2

Jei palyginsime Q 3 ir Q 1 formulę su mediano formule, bus aišku, kad:

i. Mediano atveju mes naudojame N / 2, o Q 1 - N / 4, o Q3 - 3N / 4.

ii. Mediano atveju mes naudojame fm, kad būtų pažymėtas ci dažnis, ant kurio slypi mediana; bet Q1 ir Q3 atveju mes naudojame fq, nurodant ci dažnį, ant kurio yra Q 1 arba Q 3 .

Q skaičiavimas (grupuojami duomenys):

Norint apskaičiuoti Q, pirmiausia reikia apskaičiuoti Q 3 ir Q 1 . Q 1 ir Q 3 apskaičiuojami taip pat, kaip apskaičiavome medianą.

Vieninteliai skirtumai yra:

(i) mediano atveju skaičiavome 50% atvejų (N / 2) iš apačios, bet

(ii) Q 1 atveju mes turime skaičiuoti 25% atvejų (arba N / 4) iš apačios ir

(iii) Q 3 atveju mes turime skaičiuoti 75% atvejų (arba 3N / 4) iš apačios.

5 pavyzdys:

Išsiaiškinkite šių punktų Q, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 Q.

Yra 20 balų.

25% N = 20/4 = 5

Q 1 yra taškas, žemiau kurio yra 25% atvejų. Šiame pavyzdyje Q 1 yra taškas, žemiau kurio yra 5 atvejai. Iš paprasčiausio užsakytų duomenų patikrinimo nustatyta, kad yra mažiau nei 24, 5 atvejų. Taigi Q1 = 24, 5

Taip pat Q3 yra taškas, žemiau kurio yra 75% lengvatų.

75% N = 3/4 x 20 = 15

Mes matome, kad žemiau 34, 5, 15 atvejų

Taigi Q3 = 34, 5.

Simetriniu pasiskirstymu mediana yra pusiaukelėje skalėje nuo Q 1 ir Q 3 . Todėl reikšmė Q 1 + Q arba Q 3 - Q suteikia medianą. Tačiau apskritai pasiskirstymas nėra simetriškas, todėl Q 1 + Q arba Q 3 - Q nesuteikia medianos vertės.

Q (grupuotų duomenų) skaičiavimas:

6 pavyzdys:

Lentelėje rodomi 36 studentų rezultatai, gauti bandymo metu. Raskite balų ketvirtinį nuokrypį.

1 skiltyje, mes ėmėmės klasės intervalo, 2 skiltyje, mes ėmėmės dažnio, o 3 skiltyje buvo parašyti kumuliaciniai dažniai, pradedant nuo apačios.

Čia N = 36, todėl Q 1 atveju turime imtis N / 4 = 36/4 = 9 atvejų, o Q3 - 3N / 4 = 3 x 36/4 = 27 atvejai. Žiūrint į 3 stulpelį, cf = 9 bus įtraukta į ci 55 - 59, kurios faktinė riba yra 54, 5 - 59, 5. Q1 būtų tarp 54, 5 - 59, 5 intervalo.

Q 1 vertė turi būti apskaičiuojama taip:

Apskaičiuojant Q 3, cf = 27 bus įtraukta į ci 65 - 69, kurių faktinės ribos yra 64. 5 - 69, 5. Taigi Q3 būtų 64, 5 - 69, 5 intervale, o jo vertė apskaičiuojama taip:

Kvartilio nukrypimo interpretavimas:

Vertinant kvartilinio nuokrypio vertę, geriau, jei yra vidutinės, Q 1 ir Q 3 reikšmės, kartu su Q. Jei Q vertė yra didesnė, dispersija bus daugiau, bet vėlgi vertė priklauso nuo skalės matavimo. Dvi Q vertės turi būti lyginamos tik tuo atveju, jei naudojama skalė. Q, išmatuotas pagal 20 balų, negali būti lyginamas tiesiogiai su Q balais iš 50.

Jei žinoma mediana ir Q, galime pasakyti, kad 50% atvejų yra tarp „Median - Q“ ir „Median + Q“. Tai yra vidutinis 50% atvejų. Čia mes žinome apie tik 50% atvejų. Kaip mažesnė 25 proc. Atvejų ir viršutinė 25 proc.

Kartais nežinomi kraštutiniai atvejai ar vertybės, tokiu atveju vienintelė mūsų turima alternatyva yra apskaičiuoti vidutinį ir kvartilinį nuokrypį kaip centrinės, tendencijos ir dispersijos matą. Per medianą ir kvartilius galime daryti išvadą apie pasiskirstymo simetriją ar įstrižumą. Todėl gaukime idėją apie simetriškus ir iškreiptus paskirstymus.

Simetriniai ir nelygūs paskirstymai:

Pasiskirstymas yra simetriškas, kai dažniai yra simetriškai paskirstyti aplink centrinės tendencijos matą. Kitaip tariant, galime pasakyti, kad pasiskirstymas yra simetriškas, jei vienodos atstumo vertės dviejose centrinės tendencijos matavimo pusėse yra vienodos.

7 pavyzdys:

Suraskite, ar nurodytas paskirstymas yra simetriškas, ar ne.

Čia centrinės tendencijos, vidutinio ir vidutinio dydžio matas yra 5. Jei pradėsime lyginti abiejų pusių vertybių dažnį, matome, kad vertės 4 ir 6, 3 ir 7, 2 ir 8, 1 ir 9, 0 ir 10 turi tokį patį dažnių skaičių. Taigi paskirstymas yra visiškai simetriškas.

Simetriniu pasiskirstymu vidurkis ir mediana yra vienodos, o mediana yra vienodo atstumo nuo dviejų kvartilių, ty Q3 - mediana = mediana - Q 1 .

Jei pasiskirstymas nėra simetriškas, tada nukrypimas nuo simetrijos reiškia jo įstrižumą. Skewness rodo, kad kreivė yra labiau pasukta į vieną pusę nei kita. Taigi vienoje pusėje kreivė bus ilgesnė.

Sakoma, kad įstrižumas yra teigiamas, jei ilgesnė uodega yra dešinėje pusėje ir sakoma neigiama, jei ilgesnė uodega yra kairėje pusėje.

Toliau pateikiami paveikslai rodo teigiamai iškreiptą ir neigiamą kreivę:

Q3 - Mdn> Mdn - Q 1 rodo + ve vingį

Q 3 - Mdn <Mdn - Q 1 reiškia - vangumą

Q3 - Mdn = Mdn - Q 1 rodo nulinį nelygumą

Q privalumai:

1. Tai labiau reprezentatyvus ir patikimesnis kintamumo matas nei bendras diapazonas.

2. Tai geras balų tankio indeksas pasiskirstymo viduryje.

3. Kvartilai yra naudingi norint nurodyti pasiskirstymą.

4. Kaip ir mediana, Q taikomas atvirojo galo paskirstymams.

5. Kai yra vidutinė tendencija, kai mediana yra pageidautina, kaip dispersijos matas yra pageidautinas kvartilinis nuokrypis.

Q apribojimai:

1. Tačiau, kaip ir vidutinė, kvartilinis nuokrypis nėra tinkamas algebriniam gydymui, nes jame neatsižvelgiama į visas pasiskirstymo vertes.

2. Jis skaičiuoja tik trečiąjį ir pirmąjį kvartilį ir kalba apie diapazoną. Nuo Q 'mes negalime gauti tikro vaizdo apie tai, kaip balai yra išsklaidyti nuo centrinės vertės. Tai yra „Q“ nesuteikia jokios idėjos apie balų sudėtį. Dviejų serijų „Q“ gali būti lygios, tačiau serijos gali būti gana skirtingos.

3. Apskritai ji pateikia dispersijos idėją.

4. Ji ignoruoja balus virš trečiojo kvartilio ir balų, esančių žemiau pirmojo kvartilio. Tai tiesiog kalba apie vidutinį 50% paskirstymą.

Q naudojimas:

1. Kai mediana yra centrinės tendencijos matas;

2. Kai pasiskirstymas yra neišsamus bet kuriame gale;

3. Kai yra išsibarsčiusių ar ekstremalių balų, kurie neproporcingai paveiktų SD;

4. Kai koncentracija aplink medianą - vidutinis 50% atvejų yra svarbiausias dalykas.

Kvartilinio nuokrypio koeficientas:

Kvartilinis nuokrypis yra absoliutus dispersijos matas ir tam, kad jis būtų santykinis, apskaičiuojame „kvartilinio nuokrypio koeficientą“. Koeficientas apskaičiuojamas dalinant kvartilinį nuokrypį su kvartilių vidurkiu.

Ją pateikia:

Kvartilinio nuokrypio koeficientas = Q 3 - Q 1 / Q 3 + Q 1

Kai Q3 ir Q 1 reiškia atitinkamai viršutines ir apatines kvartiles.

# 3 priemonė. Vidutinis nuokrypis (AD) arba vidutinis nukrypimas (MD):

Kaip jau aptarėme diapazoną, o „Q“ apytiksliai suteikia mums šiek tiek įvairovės idėją. Dviejų serijų diapazonas gali būti tas pats arba dviejų serijų kvartilinis nuokrypis gali būti toks pat, tačiau dvi serijos gali būti nevienodos. Nei intervalas, nei „Q“ kalba apie serijos sudėtį. Šiose dviejose priemonėse neatsižvelgiama į atskirus balus.

Vidutinio nuokrypio arba „vidutinio nuokrypio“ metodas, kaip kartais vadinamas, yra linkęs pašalinti rimtą abiejų metodų trūkumą („Range“ ir „Q“). Vidutinis nuokrypis taip pat vadinamas pirmuoju dispersijos momentu ir yra pagrįstas visais serijos elementais.

Vidutinis nuokrypis yra serijos, apskaičiuotos pagal tam tikrą centrinės tendencijos (vidurkis, mediana arba režimas), nuokrypių aritmetinis vidurkis, visi nukrypimai laikomi teigiamais. Kitaip tariant, visų aritmetinio vidurkio reikšmių nuokrypių vidurkis yra žinomas kaip vidutinis nuokrypis arba vidutinis nuokrypis. (Paprastai nukrypimas paimtas iš paskirstymo vidurkio.)

Kur ∑ yra bendra suma;

X yra rezultatas; M yra vidurkis; N yra bendras balų skaičius.

„D“ reiškia atskirų balų nukrypimą nuo vidurkio.

Vidutinio nuokrypio skaičiavimas (grupuojami duomenys):

8 pavyzdys:

Rasti vidutinį šių variacijų rinkinio nuokrypį:

X = 55, 45, 39, 41, 40, 48, 42, 53, 41, 56

Sprendimas:

Norint rasti vidutinį nuokrypį, mes pirmiausia apskaičiuojame vidurkį tam tikram stebėjimo rinkiniui.

Nukrypimai ir absoliutus nuokrypiai pateikti 4.2 lentelėje:

9 pavyzdys:

Raskite toliau pateiktų balų vidurkį:

25, 36, 18, 29, 30, 41, 49, 26, 16, 27

Nustatyta, kad pirmiau pateiktų balų vidurkis yra 29, 7.

Skaičiuojant vidutinį nuokrypį:

Pastaba:

Jei taikote tam tikrą algebrą, galite matyti, kad ∑ (X - M) yra nulis

Vidutinio nukrypimo skaičiavimas (sugrupuoti duomenys):

10 pavyzdys:

Raskite vidutinį šių dažnių pasiskirstymo nuokrypį:

Čia, 1 stulpelyje, rašome ci, 2 skiltyje, rašome atitinkamus dažnius, 3 skiltyje 4 stulpelyje rašome ci, kurie žymimi „X“, vidurinius taškus. rašome ci reikšmių ir vidutinių taškų rezultatą, pažymėtą X, 5 skiltyje rašome ci vidurio taškų absoliučius nuokrypius nuo vidurkio, kuris žymimas | d | ir 6 skiltyje parašome absoliučių nuokrypių ir dažnių produktą, žymimą | fd |.

Vidutinis nuokrypis:

1. Vidutinis nuokrypis yra paprasčiausias sklaidos matas, kuriame atsižvelgiama į visas tam tikro pasiskirstymo vertes.

2. Jį lengvai supranta net ir asmuo, kuris nėra gerai susipažinęs su statistika.

3. Labai didelę įtaką ekstremalių daiktų vertė neturi.

4. Tai vidutinis atskirų balų nuokrypių vidurkis.

Apribojimai:

1. Vidutinis nuokrypis ignoruoja nuokrypių algebrinius požymius ir todėl negali toliau matematinio apdorojimo. Taigi, jis naudojamas tik kaip aprašomasis kintamumo matas.

2. Iš tiesų MD nėra bendro naudojimo. Jis retai naudojamas šiuolaikinėje statistikoje ir paprastai dispersija tiriama pagal standartinį nuokrypį.

MD naudojimas:

1. Kai norima pasverti visus nukrypimus pagal jų dydį.

2. Kai reikia žinoti, kokiu mastu priemonės paskirstomos abiejose pusėse.

3. Kai ypatingi nuokrypiai nepagrįstai įtakoja standartinį nuokrypį.

Vidutinio nuokrypio aiškinimas:

Norint išaiškinti vidutinį nuokrypį, visada geriau jį išnagrinėti kartu su atvejų vidurkiu ir skaičiumi. Reikalingas vidurkis, nes vidutinis ir vidutinis nuokrypis yra atitinkamai taškas ir atstumas toje pačioje matavimo skalėje.

Be vidurkio vidutinis nuokrypis negali būti aiškinamas, nes nėra matavimo matavimo skalės ar matavimo vieneto. Atvejų skaičius yra svarbus, nes nuo jo priklauso dispersijos matas. Mažiau atvejų tikėtina, kad priemonė bus daugiau.

Du pavyzdžiai:

Pirmuoju atveju vidutinis nuokrypis yra beveik 25% vidutinio, o antruoju atveju - mažesnis. Tačiau pirmojo atvejo vidutinis nuokrypis gali būti didesnis dėl mažiau atvejų. Taigi du aukščiau nurodyti vidutiniai nuokrypiai rodo beveik panašią dispersiją.

# 4. Standartinis nuokrypis arba SD ir variacijos:

Iš kelių sklaidos priemonių dažniausiai naudojama priemonė yra „standartinis nuokrypis“. Tai taip pat yra svarbiausia, nes yra vienintelė dispersijos priemonė, pritaikyta algebriniam gydymui.

Čia taip pat atsižvelgiama į visų reikšmių nukrypimus nuo paskirstymo vidurkio. Ši priemonė patiria mažiausių trūkumų ir pateikia tikslius rezultatus.

Jis pašalina trūkumą ignoruojant algebrinius ženklus, o apskaičiuojant elementų nuokrypius nuo vidurkio. Užuot ignoravę ženklus, nukreipiame nukrypimus, tokiu būdu visus juos teigiamai įvertinus.

Jis skiriasi nuo AD keliais aspektais:

i. Apskaičiuojant AD arba MD, mes nepaisome ženklų, o ieškant SD, vengiame ženklų sunkumo, atskiriant atskirus nukrypimus;

ii. Skaičiuojant SD naudojami kvadratiniai nuokrypiai visada imami iš vidurkio, niekada ne iš mediana ar režimo.

„Standartinis nuokrypis arba SD yra atskirų taškų kvadratinių nuokrypių vidurkio kvadratinė šaknis nuo paskirstymo vidurkio“.

Kad būtų aiškiau, turėtume atkreipti dėmesį į tai, kad skaičiuojant SD, mes išskiriame visus nukrypimus atskirai. Raskite jų sumą, padalinkite sumą iš viso balų skaičiaus ir tada raskite kvadratinių nuokrypių vidurkio kvadratinę šaknį.

Taigi SD taip pat vadinama „šaknų vidurkio nuokrypiais nuo vidurkio“ ir paprastai žymima maža graikų raidė σ (sigma).

Simboliškai standartinių nuokrypių nenustatytiems duomenims skirtumas yra toks:

Kur d = atskirų balų nukrypimas nuo vidurkio;

(Kai kurie autoriai naudoja „x“ kaip atskirų balų nukrypimą nuo vidurkio)

∑ = bendra suma; N = bendras atvejų skaičius.

Vidutinis kvadratinis nuokrypis vadinamas dispersija. Arba paprastais žodžiais nukrypimo standarto kvadratas vadinamas antrąja dispersijos ar variacijos momentu.

SD skaičiavimas (grupuojami duomenys):

Yra du SD skaičiavimo būdai, kaip neregistruoti duomenys:

a) Tiesioginis metodas.

b) Trumpas metodas.

a) Tiesioginis metodas:

Suraskite toliau pateiktų balų standartinį nuokrypį:

X = 12, 15, 10, 8, 11, 13, 18, 10, 14, 9

Šis metodas naudoja formulę (18) SD suradimui, kuris apima šiuos veiksmus:

1 žingsnis:

Apskaičiuokite pateiktų duomenų aritmetinį vidurkį:

2 žingsnis:

Ant kiekvieno stulpelio 2 stulpelyje užrašykite nuokrypio d, ty X - M, vertę. Čia nustatomi balų nuokrypiai nuo 12. Dabar pamatysite, kad ∑d arba ∑ (X - M) yra lygus nuliui. Pagalvokite, kodėl taip yra? Patikrink Tai. Jei taip nėra, išsiaiškinkite skaičiavimo klaidą ir ją ištaisykite.

3 žingsnis:

Nukreipkite nuokrypius ir užrašykite d 2 reikšmę kiekviename 3 skiltyje. Suraskite kvadratinių nuokrypių sumą. ∑d 2 = 84.

4.5 lentelė. SD apskaičiavimas:

Reikalingas standartinis nuokrypis yra 2.9.

4 veiksmas:

Apskaičiuokite kvadratinių nuokrypių vidurkį ir tada nustatykite teigiamą kvadratinę šaknį, kad gautumėte standartinio nuokrypio vertę, ty σ.

Naudojant formulę (19), Variancija bus σ 2 = ∑d 2 / N = 84/10 = 8.4

b) Trumpas metodas:

Daugeliu atvejų pateiktų duomenų aritmetinis vidurkis yra dalinė vertė, o tada nukrypimų ir kvadratų nustatymo procesas tampa nuobodus ir kalkinantis, skaičiuojant SD.

Siekiant palengvinti skaičiavimą tokiose situacijose, nukrypimai gali būti imami iš prielaidų. Tada koreguota trumpalaikė SD skaičiavimo formulė bus

kur,

d = rezultato nukrypimas nuo prielaidos vidurkio, ty AM; ty d = (X - AM).

d 2 = nuokrypio kvadratas.

∑d = nukrypimų suma.

∑d 2 = kvadratinių nuokrypių suma.

N = balų skaičius arba skirtumai.

Apskaičiavimo procedūra paaiškinta šiame pavyzdyje:

11 pavyzdys:

Suraskite SD pagal 4.5 lentelėje pateiktus balus X = 12, 15, 10, 8, 11, 13, 18, 10, 14, 9.

Sprendimas:

Paimkime prisiimtą vidutinę AM = 11.

Nukrypimai ir nuokrypiai, reikalingi formulėje, pateikiami šioje lentelėje:

Vertės iš lentelės formulės, SD

Trumpas pjūvio metodas suteikia tokį patį rezultatą, kaip ir naudojant ankstesnį pavyzdį naudojant tiesioginį metodą. Tačiau trumpasis metodas mažina skaičiavimo darbą situacijose, kai aritmetinis vidurkis nėra sveikas skaičius.

SD (grupuotų duomenų) skaičiavimas:

a) Ilgalaikis metodas / tiesioginis metodas:

12 pavyzdys:

Raskite SD tokiam platinimui:

Čia taip pat pirmas žingsnis yra rasti vidurkį M, kuriam mes turime paimti c.i vidurio taškus, pažymėtus X ', ir rasti produktą f X.'. Vidutinis yra by f x '/ N. Antrasis žingsnis yra rasti X 'klasės intervalų vidurio taškų nuokrypius nuo vidurkio, ty X'-M, žymimo d.

Trečiasis žingsnis yra nukrypti nuo kvadrato ir rasti kvadratinių nuokrypių ir atitinkamo dažnio rezultatą.

Norėdami išspręsti pirmiau minėtą problemą, ci yra parašyti 1 stulpelyje, dažniai įrašomi 2 skiltyje, c.i's vidurio taškai, ty X 'yra įrašyti 3 stulpelyje, f X' produktas parašytas 4 stulpelyje, nukrypimas nuo 4 stulpelio, nukrypimas X 'iš vidurkio parašyta 5 skiltyje, kvadratinis nuokrypis d 2 yra parašytas 6 stulpelyje, o produktas f d 2 įrašytas 7 stulpelyje,

Kaip parodyta žemiau:

Taigi vidurio taškų nuokrypiai turi būti imami iš 11.1.

Taigi reikalaujamas standartinis nuokrypis yra 4, 74.

b) Trumpas metodas:

Kartais, taikant tiesioginį metodą, pastebima, kad nukrypimai nuo faktinio vidurkio du kartus po kablelio, o d2 ir fd2 reikšmes sunku apskaičiuoti. Kad būtų išvengta šios problemos, standartinį nuokrypį apskaičiuojame pagal trumpą metodą.

Šiame metode, užuot atsižvelgus į nukrypimus nuo faktinės vidurkio, mes nukrypstame nuo tinkamai pasirinktos prielaidos vidurkio, tarkim AM

Toliau naudojama formulė naudojama SD skaičiavimui:

kur d yra nukrypimas nuo prielaidos vidurkio.

Toliau nurodyti veiksmai yra susiję su standartinio nuokrypio skaičiavimu:

(i) gauti nukrypimus nuo skirtumų nuo prielaidos vidurkio AM kaip d = (X - AM)

(ii) Padauginkite šiuos nukrypimus nuo atitinkamų dažnių, kad gautumėte stulpelį fd . Šio stulpelio suma suteikia ∑ fd.

fd su atitinkamu nuokrypiu (d)

(iii) Padauginkite, kad gautumėte stulpelį fd 2 . Šios stulpelio suma bus ∑ fd 2 .

(iv) Norėdami rasti SD, naudokite formulę (22)

13 pavyzdys:

Naudojant trumpojo metalo metodą, žr. 4.7 lentelėje pateiktų duomenų SD.

Sprendimas:

Paimkime prisiimtą vidurkį AM = 10. Kiti skaičiavimai, reikalingi SD skaičiavimui, pateikti 4.8 lentelėje.

Vertybių išėmimas iš lentelės

Naudojant formulę (19), dispersija

c) Pakopinio nuokrypio metodas:

Šiuo metodu 1 stulpelyje rašome ci; 2 skiltyje rašome dažnius; 3 stulpelyje rašome d reikšmes, kur d = X'-AM / i; 4 stulpelyje rašome fd produktą, o 5 skiltyje parašome fd 2 reikšmes, kaip parodyta toliau:

Čia tariamas vidurkis yra ci 9-11 vidurio taškas, ty 10, taigi nuokrypiai d buvo paimti iš 10 ir padalinti iš 3, ci ilgis SD formulė žingsnio nuokrypio metodu yra

kur i = c.i's ilgis,

f = dažnis;

d = ci 's vidurio taškų nuokrypiai nuo prielaidos vidurkio (AM) klasės intervale (i) vienetų, kurie gali būti nurodyti:

Vertybių išėmimas iš lentelės

Apskaičiavimo tvarka taip pat gali būti nurodyta taip:

Kombinuotas standartinis nuokrypis ( σ com b ):

Kai du balų rinkiniai sujungti į vieną partiją, galima apskaičiuoti viso paskirstymo σ iš dviejų komponentų pasiskirstymų σ.

Formulė yra:

kur σ 1, = paskirstymo SD 1

σ 2 = paskirstymo SD 2

d 1 = (M 1 - M šukos )

d 2 = (M 2 - M šukos )

N 1 = Pasiskirstymo atvejų skaičius 1.

N 2 = Pasiskirstymo atvejų skaičius 2.

Pavyzdys iliustruoja formulės naudojimą.

14 pavyzdys:

Tarkime, mums suteikiamos priemonės ir SD pasiekimų teste dviem skirtingo dydžio klasėms, ir prašoma surasti kombinuotos grupės o.

Duomenys yra tokie:

Pirma, mes tai randame

Formulė (24) gali būti išplėsta iki bet kokio paskirstymo skaičiaus. Pavyzdžiui, trijų paskirstymų atveju tai bus

SD savybės:

1. Jei kiekviena variacijos vertė padidinama ta pačia pastovia verte, pasiskirstymo SD reikšmė lieka nepakitusi:

Šį poveikį aptarsime SD, atsižvelgdami į iliustraciją. Lentelėje (4.10) pateikiami originalūs 5 studentų balai teste, kurio aritmetinis vidurkis yra 20.

Nauji balai (X ') taip pat pateikiami toje pačioje lentelėje, kurią mes gauname pridedant pastovią 5 kiekvienam pradiniam rezultatui. Naudojant nerūšiuotų duomenų formulę, pastebime, kad balų SD išlieka ta pati abiejose situacijose.

Taigi, SD vertė abiejose situacijose išlieka tokia pati.

2. Kai iš kiekvienos variacijos yra atimama pastovi vertė, naujos paskirstymo SD reikšmė lieka nepakitusi:

Studentai taip pat gali ištirti, kad kai atimame pastovią vertę iš kiekvieno balo, vidurkis sumažėja pastoviu, bet SD yra tas pats. Būtent dėl ​​to, kad „ d “ išlieka nepakitusi.

3. Jei kiekviena stebima vertė dauginama iš pastoviosios vertės, naujų stebėjimų SD taip pat bus padauginta iš tos pačios konstanta:

Padauginsime kiekvieną pradinio paskirstymo rezultatą (4.10 lentelė) iki 5.

Taigi naujos platinimo SD bus padauginta iš tos pačios konstanta (čia tai yra 5).

4. Jei kiekviena stebima reikšmė yra padalinta iš pastovios vertės, naujų stebėjimų SD taip pat bus padalinta iš tos pačios konstanta. Studentai gali išnagrinėti pavyzdį:

Taigi, darant išvadą, SD nepriklauso nuo kilmės pasikeitimo (papildymas, atimtis), bet priklauso nuo skalės pokyčio (dauginimo, padalijimo).

Santykinės dispersijos matavimai (variacijos koeficientas):

Dispersijos priemonės suteikia mums idėją apie tai, kiek balai yra išsklaidyti pagal jų centrinę vertę. Todėl du dažnio pasiskirstymai, turintys tas pačias centrines reikšmes, gali būti lyginami tiesiogiai su įvairiomis dispersijos priemonėmis.

Jei, pavyzdžiui, klasėje atliekant tyrimą, berniukų vidutinis balas M 1 = 60, kai SD σ 1 = 15, o mergaičių vidutinis balas yra M 2 = 60, kai SD σ 2 = 10. Akivaizdu, kad mergaitės, turinčios mažiau SD, yra nuoseklesni balai, palyginti su vidutiniais balais nei berniukai.

Turime situacijų, kai du ar daugiau skirstinių, turinčių nevienodas priemones arba skirtingus matavimo vienetus, turi būti lyginami pagal jų išsklaidymą ar kintamumą. Tokiems palyginimams naudojame santykinio dispersijos koeficientus arba variacijos koeficientus (CV).

Formulė yra:

(Variacijos koeficientas arba santykinio kintamumo koeficientas)

V nurodo procentą, kuris yra σ bandymo vidurkis. Tai yra santykis, nepriklausantis nuo matavimo vienetų.

V yra apribotas jo vartojimu dėl tam tikrų aiškinimo aiškumų. Jis yra priimtinas, kai naudojamas su santykio skalėmis - skalėmis, kuriose vienetai yra lygūs ir yra tikras nulis arba atskaitos taškas.

Pavyzdžiui, V gali būti naudojamas be abejonių su fizinėmis svarstyklėmis, kurios susijusios su linijiniu dydžiu, svoriu ir laiku.

Du atvejai atsiranda naudojant V su santykio skalėmis:

(1) Kai vienetai yra skirtingi, ir. \ T

(2) kai M yra nevienodi, skalės vienetai yra vienodi.

1. Kai vienetai skiriasi:

15 pavyzdys:

10 metų berniukų grupės vidutinis aukštis yra 137 cm. o o yra 6, 2 cm. Ta pati berniukų grupė yra vidutiniškai 30 kg. su 3, 5 kg. Kuriame bruože grupė yra kintama?

Sprendimas:

Akivaizdu, kad mes negalime tiesiogiai palyginti centimetrų ir kilogramų, tačiau galime palyginti santykinį dviejų paskirstymų variabilumą pagal V.

Šiame pavyzdyje dvi grupės ne tik skiriasi vidutiniu, bet ir matavimo vienetais, kurie yra cm. pirmuoju atveju ir kg. antroje. Variacijų koeficientas gali būti naudojamas grupių skirtingumui tokioje situacijoje palyginti.

Mes apskaičiuojame:

Taigi, iš pirmiau pateikto skaičiavimo matyti, kad šie berniukai yra maždaug du kartus didesni (11, 67 / 4, 53 = 2, 58) kaip aukštis.

2. Kai priemonės yra nevienodos, tačiau skalės vienetai yra vienodi :

Tarkime, kad mes turime šiuos duomenis apie berniukų ir vyrų grupės testą:

Tada palyginkite:

i) Abiejų grupių veikimas bandyme.

(ii) dviejų grupių balų kintamumas.

Sprendimas:

i) Kadangi berniukų grupės vidutinis balas yra didesnis nei vyrų, berniukų grupė geriau atliko bandymą.

(ii) Dviejų grupių palyginimui tarp balų kintamumo, apskaičiuojamas variacijos koeficientas V berniukų = 26, 67 ir V vyrų = 38, 46.

Todėl vyrų grupių balų įvairovė yra didesnė. Berniukų grupės moksleiviai, turintys mažesnę CV, yra nuoseklesni už vidutinį rezultatą, lyginant su vyrų grupe.

SD ir pastabų plitimas:

Simetriniu (normaliu) paskirstymu,

i) Vidutinė ± 1 SD apima 68, 26% balų.

Vidutinė ± 2 SD apima 95, 44% balų.

Vidutinė ± 3 SD apima 99, 73% balų.

(ii) Dideliuose mėginiuose (N = 500) diapazonas yra maždaug 6 kartus didesnis už SD.

Jei N yra apie 100, diapazonas yra maždaug 5 kartus didesnis už SD.

Jei N yra apie 50, diapazonas yra maždaug 4, 5 karto didesnis už SD.

Jei N yra apie 20, diapazonas yra maždaug 3, 7 karto didesnis už SD

Standartinio nuokrypio aiškinimas:

Standartinis nuokrypis apibūdina balų pasiskirstymo pobūdį. Kai balai yra plačiau paplitę, SD yra daugiau ir kai balai yra mažiau išsklaidyti, SD yra mažesnė. Norint išaiškinti dispersijos matavimo vertę, turime suprasti, kad didesnė „ σ “ reikšmė, tuo labiau išsklaidytos yra vidutinės vertės.

Kaip ir vidutinio nuokrypio atveju, standartinio nuokrypio aiškinimui reikalinga M ir N vertė.

Toliau pateiktuose pavyzdžiuose pateikiamos reikalingos σ, vidutinės ir N vertės:

Čia dispersija yra daugiau 2 pavyzdyje, palyginti su 1 pavyzdžiu. Tai reiškia, kad 2 pavyzdyje vertės yra labiau išsklaidytos, palyginti su 1 pavyzdžio vertėmis.

SD privalumai:

1. SD yra griežtai apibrėžta ir jos vertė visada yra aiški.

2. Tai plačiausiai naudojama ir svarbi sklaidos priemonė. Jis užima svarbią vietą statistikoje.

3. Kaip ir vidutinis nukrypimas, jis pagrįstas visomis paskirstymo vertėmis.

4. Čia neatsižvelgiama į nukrypimų požymius, o jie yra pašalinami kvadratuojant kiekvieną nukrypimą.

5. Tai yra pagrindinis kintamumo matas, nes jis yra tinkamas algebriniam gydymui ir naudojamas koreliacijos darbe ir tolesnėje statistinėje analizėje.

6. Tai mažiau paveikia mėginių ėmimo svyravimai.

7. Tai patikimas ir tiksliausias kintamumo matas. SD visada yra tokia pati, kaip patikimiausias centrinės tendencijos matas.

8. Jame yra standartinis matavimo vienetas, turintis panašią reikšmę iš vieno bandymo į kitą. Be to, normalioji kreivė yra tiesiogiai susijusi su SD

Apribojimai:

1. Tai nėra lengva apskaičiuoti ir jis nėra lengvai suprantamas.

2. Tai suteikia daugiau svorių ekstremaliems elementams ir mažiau tiems, kurie yra artimi vidutinei daliai. Kai ekstremalaus rezultato nuokrypis yra kvadratas, tai sukelia didesnę vertę.

SD naudojimas:

Naudojamas standartinis nuokrypis:

i) Kai norima tiksliausia, patikima ir stabili kintamumo priemonė.

(ii) Kai reikia skirti daugiau svorio kraštutiniams nukrypimams nuo vidurkio.

(iii) Kai vėliau apskaičiuojamas koreliacijos koeficientas ir kita statistika.

(iv) Kai apskaičiuojami patikimumo matai.

(v) Kai balai turi būti tinkamai interpretuojami atsižvelgiant į įprastą kreivę.

vi) Kai skaičiuojami standartiniai balai.

(vii) Kai norime išbandyti dviejų statistinių duomenų skirtumo reikšmę.

(viii) Kai apskaičiuojamas variacijos koeficientas, dispersija ir kt.