Hipotezė apie dviejų disprersijų lygybę priklausomoms imtims

9 lapkričio, 2009

Tarkime, kad 62 studentai laikė tiksliųjų ir humanitarinių mokslų testus (kiekvieno testo maksimalus balų skaičius yra 100). Testų rezultatai koreliuoja (r=0.84). Norima patikrinti, ar abiejų testų rezultatai vienodai homogeniški. Tiksliųjų mokslų testo rezultatų dispersija s^{2}_{x}=100,2, o humanitarinių mokslų s^{2}_{y}=91,7. Nagrinėjamu atveju turime dvi priklausomas imtis. Išvada grindžiama tuo, kad normuotas dispersijų įverčių skirtumas turi asimptotinį Stjudento skirstinį. Suformuluosime nagrinėjamo uždavinio etapus:

Duomenys. Dvi intervalinių duomenų imtys (x_{1},x_{2},...,x_{n}) ir(y_{1},y_{2},...,y_{n}) gautos matuojant du nepriklausomus normaliuosius atsitiktinius dydžius, kurių dispersijos yra \sigma_{x}^{2} ir \sigma_{y}^{2}.

Statistinė hipotezė:

H_{0}:\sigma_{x}^{2}=\sigma_{y}^{2},\\H_{1}:\sigma_{x}^{2}\neq{\sigma_{y}^{2}}.

Kriterijaus statistika.Apskaičiuojame

t=\frac{s_{x}^{2}-s_{y}^{2}}{\sqrt{4s_{x}^{2}s_{y}^{2}(1-r^{2})/(n-2)}},

čia s^{2}_{x}s^{2}_{x} yra imčių dispersijos, r – imčių koreliacija.

Sprendimo priėnimo taisyklė. Tegul reikšmingumo lygmuo \alpha. Hipotezė H_{0} atmetama (dispersijos statistiškai reikšmingai skiriasi), jeigu |t|\leq{t_{\alpha/2}(n-2)}. Čia t_{\alpha/2}(n-2) yra Stjudento skirstinio su (n-2) laisvės laipsnių \alpha/2 lygmens kritinė reikšmė.

Pavyzdys. Grįžkime prie minėto uždavinio. Tegul \alpha=0,05. Apskaičiuojame

t=\frac{100,2-91,7}{\sqrt{4\cdot{100,2}\cdot{91,7}(1-0,84^{2})/60}}=0,6329

Kadangi t<2=t_{0,025}(60), duomenys nepatvirtina, kad dispersijos skiriasi.

Hipotezė apie proporciją mažoms imtims

9 lapkričio, 2009

Tarkime, kad stebime binominį atsitiktinį dydį X\sim{B(1,p)} su nežinomu parametru p. Atsitiktinę imtį sudaro nepriklausomi atsitiktiniai dydžiai {(X_{1}, X_{2},...,X_{n})}, turintys tą patį skirstinį kaip ir X. Imties elementų suma S_{n} turi binominį skirstinį su parametrais n ir p, t.y.

S_{n}=X_{1}+X_{2}+...+X{n}\sim{B(n,p)}.

Nagrinėjamo uždavinio sprendimo etapai:

Duomenys.Dvireikšmių duomenų aibę sudaro nuliai (matuotos savybės nerasta) ir vienetai (matuota savybė rasra).

Statistinė hipotezė.

H_{0}:p=a,\\H_{1}:p\neq{a}.

Kriterijaus statistika. Apskaičiuojame

P(S_{n}\geq{m}) ir P(S_{n}\leq{m}),

čia S_{n}\sim{B(n,a)}, o m yra imties vienetų skaičius.

Sprendinio priėmimo taisyklė. Tegul reikšmingumo lygmuo  lygus \alpha. Hipotezė H_{0} atmetama (taigi p statistiškai skiriasi nuo a), jeigu P(S_{n}\geq{m})<\frac{\alpha}{2} arba P(S_{n}\leq{m})<\frac{\alpha}{2}. Kitais atvejais H_{0} atmetama.

Pavyzdys. Kauliuką metus 9 kartus, vieną kartą atsivertė 6 akutės. Ar galime teigti, kad 6 akučių atsivertimo tikimybė nelygi 1/6? (\alpha={0,05}.)

Sprendimas. Statistinė hipotezė:

H_{0}:p=1/6,\\H_{1}:p\neq{1/6}.

Kadangi n=9, o a=1/6, tai X\sim{B(9;1/6)} , kai H_{0} teisinga. Randame

P(S_{n}\geq{1})=1-P(S_{n}=0)=1-(5/6)^{9}=0,806,

P(S_{n}\leq{1})=P(S_{n}=0)+P(S_{n}=1)=(5/6)^{9}+9(1/6)(5/6)^{8}=0,542.

Kadangi nė viena iš apskaičiuotųjų tikimybių nėra mažesnė už 0,025, tai H_{0} atmetame. Taigi negavome patvirtinimo, kad 6 akučių atsivertimo tikimybė nelygi 1/6. Jeigu vis dėlto įtariame kauliuko asimetriją, bandymą turėtume kartoti daugiau kartų.

Išvada. Didelėms imtims toks kriterijus netinkamas, nes skaičiavimų apimtys labai didelės.

Kokybės įvairovės indeksas

3 lapkričio, 2009

Sklaidos matas, kuris taikomas kategoriniams kintamiesiems , vadinamas kokybės įvairovės indeksu ir žymimas IQV.

IQV=\frac{k(n^{2}-(f^{2}_{1}+f^{2}_{2}+...+f^{2}_{k})}{n^{2}(k-1)},

čia k – kategorijų skaičius, n – stebėjimų skaičius, f_{j} – j – osios kategorijos stebėjimų skaičius (j – osios kategorijos dažnis). Kokybinės įvairovės indeksas kinta nuo 0 (nėra reikšmių sklaidos) iki 1 (maksimali reikšmių sklaida).

Pavyzdys. Tarkime, turime informaciją apie trijų rajonų gyventojų tautybę. Šiuos rajonus pavadinkim atitinkamai A, B ir C rajonais. A rajone gyvena 900 lietuvių, 0 lenkų ir 0 rusų. B rajone gyvena 600 lietuvių, 200 lenkų ir 100 rusų. C rajone gyvena 300 lietuvių, 300 lenkų ir 300 rusų.

A rajono

IQV_{1}=\frac{3(900^{2}-(900^{2}+0^{2}+0^{2}))}{900^{2}\cdot2}=0

B rajono

IQV_{2}=\frac{3(900^{2}-(600^{2}+200^{2}+100^{2}))}{900^{2}\cdot2}=0,74

C rajono

IQV_{3}=\frac{3(900^{2}-(300^{2}+300^{2}+300^{2}))}{900^{2}\cdot2}=1

A rajonas tautiniu požiūriu yra vienalytis . B rajono IQV_{2}=0,74, todėl jo tautinė gyventojų įvairovė gana didelė, o C – didžiausia, t.y. jame visų tautybių žmonių gyvena po lygiai.

Kitimo koeficientas

3 lapkričio, 2009

Kitimo (variacijos) koeficientas skaičiuojamas tik santykių skalės kintamiesiems, turintiems teigiamus vidurkius:

\overline{x} >0

Kitimo koeficientas yra bedimensinis dydis. Jis naudojamas lyginant skirtingų duomenų aibių sklaidas. Prieš nurodant kitimo koeficiento radimo formulę, tarkime, kad \sigma, \varsigma – standartiniai nuokrypiai, o \mu, \bar{x} – vidurkiai.

Populiacijos kitimo koeficientas CV=\frac{\sigma}{\mu}

Imties kitimo koeficientas cv=\frac{\varsigma}{\overline{x}}

Procentinis populiacijos kitimo koeficientas  CVP=\frac{\sigma}{\mu}100\%

Procentinis imties kitimo koeficientas   cvp=\frac{\varsigma}{\overline{x}}100\%

Pavyzdys. Svarbi akcijų charakteristika yra kainos stabilumas. Tarkime, tris mėnesius stebėjus akcijų kainų kitimą, buvo nustatyta vidutinė firmos A akcijų kaina – 20 Lt ir jų standartinis nuokrypis – 40 Lt. Firmos B vidutinė akcijų kaina – 48 Lt, standartinis nuokrypis – 12 Lt.

Firmos A akcijų sklaida didesnė nei firmos B. Tačiau labai skiriasi patys akcijų vidurkiai . Galima apskaičiuoti abiejų firmų akcijų kainų kitimą vidurkių atžvilgiu.

Firmos A

cvp=\frac{40}{200}100\%=20\%

Firmos B

cvp=\frac{12}{48}100\%=25\%

Taigi vidurkio atžvilgiu firmos A akcijos stabilesnės už firmos B akcijas.

Išvada. Kitimo koeficientas būtų patogus ir lyginant skirtingais vienetais matuotų duomenų aibių sklaidą.

Kintamųjų klasifikacija

28 spalio, 2009

Duomenų analizės metodo parinkimas labai priklauso nuo jų prigimties. Taigi šiame straipsnyje paaiškinsime, , kaip yra klasifikuojami duomenys. Bet prieš tai mums reikia aptarti kintamojo sąvoką. Populiacijos, kartu ir imties, elementus vienija tiriamasis požymis. Matuodami šį požymį, gauname tam tikrą dydį, kuriis kinta kartu su imties nariais. Šį dydį ir vadinsime kintamuoju.

Pagal matuojamo reiškinio prigimtį kintamieji skirstomi į kiekybinius ir kokybinius. Kiekybinio kintamojo reikšmė – tai atsakymas, kiek tiriamo požymio turi populiacijos elementas, tuo tarpu kokybiniai kintamieji nusako dydžius, kurių neįmanoma įvertinti skaičiais. Kiekybinių kintamųjų pavyzdžiai – laikas, aukštis, šeimos gausumas, metinė infliacija, sesijos pažymių vidurkis ir pan. Kokybinių kintamųjų pavyzdžiai – lytis, tautybė ir pan. Svarbu paminėti, kad jei kokybinio kintamojo reikšmes koduojam skaitmenimis, tai kintamojo prasmė nepasikeičia. Pavyzdžiui, kalbant apie lytį, galime koduoti pagal tokią taisyklę: “vyras“ = 1, “moteris“ = 2.

Kiekybiniai kintamieji savo ruožtu yra skirstomi į tolydžiuosius ir diskrečiuosius.

Kiekybinis kintamasis yra vadinamas tolydžiuoju, jei jo reikšmių skirtumas gali būti kiek norima mažas.

Kiekybinis kintamasis, kurio reikšmių skirtumas yra ne mažesnis už tam tikrą minimalų pokytį, vadinamas diskrečiuoju kintamuoju.

Laikas, masė ,aukštis – tolydieji kintamieji; šeimos gausumas, korektūros klaidų skaičius, banko klientų skaičius – diskretieji kintamieji.

Išvada. Kokybinių ir kiekybinių kintamųjų analizės metodai traktuojami skirtingai. Pavyzdžiui, kokybiniai kintamieji negali būti sudedami, dauginami, vidurkinami.

Imties sąvoka

27 spalio, 2009

Prieš pradedant kalbėti apie imtį, reikia suprasti šios sąvokos reikšmę. Dažnai šis statistinis dydis yra maišomas su populiacijos sąvoka. Todėl pereikime prie šių savokų apibrėžimų.

Populiacija – objektų, kurių savybės tiriamos, aibė.

Imtis – tai populiacijos dalis, kuri naudojama statistiniame tyrime.

Kaip matome, gali būti ir toks atvejis, kad imties didumas ( elementų skaičius imtyje) gali sutapti su populiacijos didumu, tačiau jokiu būdu negali būti taip, kad populiacijos didumas yra mažesnis už imties didumą.

Populiacijos elementai tyrimui parenkami ne bet kaip, o iš anksto pasirinktu imties sudarymo būdu. Todėl imtys pagal sudarymo būdą yra skirstomos į netikimybines ir tikimybines imtis.

Netikimybinė imtis – imtis, kai negalime apskaičiuoti elemento tikimybės patekti į imtį.

Tikimybibinė imtis –  imtis, kai elementai atrenkami atsitiktiniu būdu ir kiekvieno elemento tikimybė patekti į imtį yra vienoda.

Savo ruožtu šios dvi imčių rūšys yra skirstomos į atskiras imčių rūšis.

Netikimybinės imtys:

Eksperimentinė imtis . Elementai į imtį įtraukiami atsižvelgus į ekspertų nuomonę. Tokios imtys dažniausiai yra nereprezentatyvios ir jų rezultų neįmanoma apibendrinti visai populiacijai.

Kvotinė imtis. Atsižvelgus į populiacijos sandarą, iš anksto numatomos imties elementų kvotos. Pavyzdžiui, numatoma, kad imtį sudarys 80 lietuvių, 10 rusų, 7 lenkai ir 3 baltarusiai.

Proginė imtis. Į imtį įtraukiami pirmi pasitaikę populiacijos elementai. Tokia imtis yra visiškai nereprezentatyvi.

Tikimybinės imtys:

Sisteminė imtis. Jos sudarymo principas yra toks: 1) atsižvelgus į populiacijos dydį ir numatomą pačios imties dydį, parenkamas išrinkimo žingsnis, 2) visi elementai išrikiuojami į eilę, 3) iš kelių pirmųjų elementų atsitiktiu būdu parenkamas pirmas imties elementas, 4) pasirinktu žingsniu parenkami visi likę elementai.

Sluoksninė imtis. Visa populiacija suskirstoma į sluoksnius (stratus). Kiekviename sluoksnyje naudojamas paprastosios atsitiktinės grąžintinės imties sudarymo būdas.

Lizdinė imtis. Visa populiacija suskirstoma į panašias pagal tam tikrą požymį grupes – lizdus (klasterius). Iš visų lizdų aibės paprastosios atsitiktinės imties būdu parenkama dalis. Į imtį pakliūna visi atrinktųjų lizdų elementai.

Paprastoji atsitiktinė grąžintinė imtis. Kiekvienu imties sudarymo momentu visiems populiacijos elementams patekti į imtį galimybės yra vienodos. Klasikinė vienodas galimybes teikianti situacija yra tokia: 1) visi populiacijos elementai sunumeruojami, 2) elementų numeriai užrašomi ant rutulių, 3) rutuliai sudedami į dėžę ir gerai sumaišomi, 4) ištraukiamas pirmas pasitaikęs rutulys, 5) elementas, atitinkantis ant rutulio užrašytąjį numerį, įtraukiamas į imtį.

Išvada. Prieš atliekant  tam tikrą tyrimą, reikia iš anksto pasirinkti imties sudarymo būdą, kad būtent tie tyrimui atrinkti populiacijos elementai, atsakytų į norimą išsiaiškinti tyrimo klausimą ryšium su imties sudarymo kaina, imties paprastumu ir laiku, kurio prireikia imčiai sudaryti.

Hello world!

26 spalio, 2009

Welcome to WordPress.com. This is your first post. Edit or delete it and start blogging!