Ciele
- Naučiť sa aplikovať jednovýberový test zhody strednej hodnoty \(\mu\) so známou konštantou \(\mu_0\), pričom smerodajnú odchýlku \(\sigma\) poznáme.
- Naučiť sa aplikovať jednovýberový test zhody strednej hodnoty \(\mu\) so známou konštantou \(\mu_0\), pričom smerodajnú odchýlku \(\sigma\) nepoznáme.
- Naučiť sa aplikovať jednovýberový test zhody rozptylu \(\sigma^2\) so známou konštantou \(\sigma^2_0\).
- Naučiť sa aplikovať dvojvýberový test zhody dvoch rozptylov \(\sigma^2_1\) a \(\sigma^2_2\).
- Naučiť sa aplikovať dvojvýberový test zhody dvoch stredných hodnôt \(\mu_1\) a \(\mu_2\), pričom smerodajné odchýlky \(\sigma_1\) a \(\sigma_2\) poznáme.
- Naučiť sa aplikovať dvojvýberový test zhody dvoch stredných hodnôt \(\mu_1\) a \(\mu_2\), pričom smerodajné odchýlky \(\sigma_1\) a \(\sigma_2\) nepoznáme a platí \(\sigma_1=\sigma_2\).
- Naučiť sa aplikovať dvojvýberový test zhody dvoch stredných hodnôt \(\mu_1\) a \(\mu_2\), pričom smerodajné odchýlky \(\sigma_1\) a \(\sigma_2\) nepoznáme a platí \(\sigma_1\not=\sigma_2\).
- Naučiť sa aplikovať párový test zhody stredných hodnôt \(\mu_1\) a \(\mu_2\).
Úvod
-
V tejto časti sa budeme zaoberať aplikáciou výberových štatistík pri porovnávaní niektorého parametra základného štatistického
súboru s nejakou konkrétnou číselnou hodnotou a tiež pri porovnávaní parametrov toho istého druhu v dvoch rôznych základných
súboroch, ktoré majú normálne rozdelenie.
- Pravostranná: \(H_1: Q\gt\ Q_0\), ktorá vymedzuje obor hodnôt parametra \(Q\) napravo od hodnoty \(Q_0\).
- Ľavostranná: \(H_1: Q\lt\ Q_0\), ktorá vymedzuje obor hodnôt parametra \(Q\) naľavo od hodnoty \(Q_0\).
- Obojstranná: \(H_1: Q\not=\ Q_0\), ktorá sa od predchádzajúcich jednostranných alternatívnych hypotéz líši tým, že len popiera platnosť nulovej hypotézy.
- Formulácia hypotéz \(H_0\) a \(H_1\).
- Voľba hladiny významnosti \(\alpha\).
- Výpočet hodnoty testovacej charakteristiky \(G\) na základe daných hodnôt náhodného výberu.
- Určenie kritickej oblasti \(K_\alpha\).
- Vyhodnotenie testu, ktoré spočíva buď v zamietnutí \(H_0\), a teda prijatí \(H_1\) alebo v prijatí \(H_0\).
Teraz uvedieme základné pojmy testovania štatistických hypotéz.
Tvrdenia, týkajúce sa rozdelenia (jeho parametrov alebo jeho tvaru) náhodných veličín, sa nazývajú štatistickými hypotézami. Postup, ktorým overujeme či daná hypotéza platí alebo nie, sa nazýva testom štatistickej hypotézy. Hypotézu, ktorej platnosť overujeme, nazývame nulovou hypotézou (testovanou hypotézou) a označujeme ju \(H_0\). Proti testovanej hypotéze postavíme tzv. alternatívnu hypotézu (alternatívu), ktorú označujeme \(H_1\).
Test nulovej hypotézy \(H_0\) proti alternatíve \(H_1\) je postupom, ktorý na základe náhodného výberu z daného rozdelenia a na zvolenej hladine významnosti \(\alpha\) (t. j. so zvolenou spoľahlivosťou \(1-\alpha\)) vedie buď k zamietnutiu nulovej hypotézy (t. j. k prijatiu alternatívy) alebo k nezamietnutiu nulovej hypotézy (t. j. k zamietnutiu alternatívy).
Tvar nulovej hypotézy je napr. \(H_0: Q=Q_0\), resp. \(H_0: Q-Q_0=0\) (odtiaľ pochádza jej názov), pričom \(Q\) je parameter základného súboru a \(Q_0\) je konkrétna konštanta.
V praxi sa proti nulovej hypotéze stavajú obvykle tieto tri typy alternatívnych hypotéz:
K testu nulovej hypotézy proti alternatíve použijeme testovaciu štatistiku (charakteristiku). Testovacia štatistika \(G\) je konkrétna funkcia náhodného výberu, ktorá má pre každú hypotézu \(H_0\) a \(H_1\) špeciálny tvar a rozdelenie pravdepodobnosti. Štatistika \(G\) sa nazýva aj testovacím kritériom.
Obor hodnôt, ktorý môže štatistika \(G\) nadobudnúť, rozdelíme na dva disjunktné intervaly: na obor \(K_\alpha\), ktorý sa nazýva kritickým oborom (kritickou oblasťou, oblasťou zamietnutia \(H_0\)) a na obor doplnkový. Kritická oblasť \(K_\alpha\) je určená kvantilom testovacej charakteristiky \(G\).
Ak hodnota testovacej charakteristiky \(G\), vypočítaná z výberových hodnôt, padne do kritickej oblasti \(K_\alpha\), zamietame testovanú hypotézu \(H_0\), t. j. prijímame alternatívnu hypotézu \(H_1\). Ak hodnota testovacej charakteristiky \(G\) nepadne do kritickej oblasti \(K_\alpha\), testovanú hypotézu \(H_0\) nezamietame. Hovoríme o teste hypotézy \(H_0\) založenom na kritickom obore \(K_\alpha\).
Pretože testovanú nulovú hypotézu \(H_0\) prijímame alebo zamietame na základe výsledkov získaných náhodným výberom, môže byť jej prijatie alebo zamietnutie správne alebo nesprávne.
Nesprávne zamietnutie testovanej hypotézy \(H_0\), t. j. nesprávne prijatie alternatívnej hypotézy \(H_1\) nazývame chybou prvého druhu (je to vlastne hladina významnosti \(\alpha\)). K tejto chybe dochádza vtedy, keď hodnota testovacej charakteristiky padne do kritickej oblasti, ale pritom v skutočnosti platí hypotéza \(H_0\).
Nesprávne prijatie testovanej hypotézy \(H_0\), t. j. jej nezamietnutie v prípade, že platí alternatívna hypotéza \(H_1\) nazývame chybou druhého druhu. K tejto chybe dochádza vtedy, keď hodnota testovacej charakteristiky nepadne do kritickej oblasti a pritom v skutočnosti platí hypotéza \(H_1\).
Pri testovaní štatistických hypotéz je vhodné dodržiavať túto postupnosť krokov:
Postup
-
Jednovýberový \(Y\)-test zhody strednej hodnoty \(\mu\) so známou konštantou \(\mu_0\), pričom smerodajnú odchýlku \(\sigma\) poznáme
Predpokladáme, že náhodná premenná \(X\) základného súboru má normálne rozdelenie pravdepodobnosti s parametrami \(\mu\) a \(\sigma\), t. j. \(X\sim norm(\mu,\,\sigma)\), pričom hodnotu \(\sigma\) poznáme. Nech \(n\) je rozsah náhodného výberu a \(\bar{x}\) je výberový priemer.
Nulová hypotéza bude mať tvar \(H_0: \mu=\mu_0\), kde \(\mu_0\) je známa konštanta.
Testovacia charakteristika \(Y=\dfrac{\bar{x}-\mu_0}{\sigma}\cdot\sqrt{n}\) má normované normálne rozdelenie pravdepodobnosti za predpokladu, že platí hypotéza \(H_0\).
Kritická oblasť \(K_{\alpha}\) je:- \((y_{1-\alpha} \ ; \infty) \) pre \(H_1: \mu\gt\mu_0\)
- \((-\infty\ ; - y_{1-\alpha} ) \) pre \(H_1: \mu\lt\mu_0\)
-
\((-\infty\ ; - y_{1-\alpha/2} ) \cup (y_{1-\alpha/2} \ ; \infty) \) pre \(H_1: \mu\not= \mu_0\),
kde \(y_\beta\) je \(\beta\)-kvantil normovaného normálneho rozdelenia pravdepodobnosti (viď predchádzajúce cvičenie 11).
Príklad:
Pri tradičnom spôsobe opracovania strojových súčiastok sa dosahovali priemerné hodnoty 4,4 dôležitej kvalitatívnej vlastnosti so smerodajnou odchýlkou \(\sigma=0{,}4\). Pokusne sa zavádza nová, lacnejšia metóda opracovania súčiastok, ktorou opracovali 20 súčiastok a boli dosiahnuté takéto výsledky: 4,5; 4,3; 4,1; 4,9; 4,6; 3,6; 4,7; 5,1; 4,8; 4,0; 3,7; 4,4; 4,9; 4,9; 5,2; 5,1; 4,7; 4,9; 4,6; 4,8. Na hladine významnosti \(\alpha =0{,}05\) otestujte hypotézu či nová metóda vedie k zvýšeniu hodnoty sledovanej kvalitatívnej vlastnosti. Predpokladáme normálne rozdelenie základného súboru, z ktorého bol realizovaný náhodný výber. -
Jednovýberový \(t\)-test zhody strednej hodnoty \(\mu\) so známou konštantou \(\mu_0\), pričom smerodajnú odchýlku \(\sigma\) nepoznáme
Predpokladáme, že náhodná premenná \(X\) základného súboru má normálne rozdelenie pravdepodobnosti s parametrami \(\mu\) a \(\sigma\), t. j. \(X\sim norm(\mu,\,\sigma)\), pričom hodnotu \(\sigma\) nepoznáme. Nech \(n\) je rozsah náhodného výberu, \(\bar{x}\) je výberový priemer a \(s\) je výberová smerodajná odchýlka.
Nulová hypotéza bude mať tvar \(H_0: \mu=\mu_0\), kde \(\mu_0\) je známa konštanta.
Testovacia charakteristika \(t=\dfrac{\bar{x}-\mu_0}{s}\cdot\sqrt{n}\) má Studentovo \(t\)-rozdelenie pravdepodobnosti s \(\gamma=n-1\) stupňami voľnosti za predpokladu, že platí hypotéza \(H_0\).
Kritická oblasť \(K_{\alpha}\) je:- \(\left(t_{1-\alpha,\,n-1}\, ;\infty\right ) \) pre \(H_1: \mu\gt\mu_0\)
- \((-\infty\ ; - t_{1-\alpha,\,n-1} ) \) pre \(H_1: \mu\lt\mu_0\)
-
\((-\infty\ ; - t_{1-\alpha/2,\,n-1} ) \cup (t_{1-\alpha/2,\,n-1} \ ; \infty) \) pre \(H_1: \mu\not= \mu_0\),
kde \(t_{\beta,\,n-1}\) je \(\beta\)-kvantil Studentovho \(t\)-rozdelenia pravdepodobnosti s \(\gamma=n-1\) stupňami voľnosti.
Príklad:
Meral sa percentuálny obsah cínu vo vzorkách rudy. Výsledky sú v tabuľke: \[ \begin{array}{|c|c|c|c|c|c|c|c|c|c|c|} \hline z_i \a 30 \a 35 \a 40\a 45 \a 50\a 55 \a 60\a 65\a 70\a 75 \\ \hline n_i \a 4 \a 6 \a 8 \a 15 \a 25 \a 20 \a 8\a 7\a 5 \a 2 \\ \hline \end{array} \] Predpokladáme, že obsah cínu má normálne rozdelenie. Odborníci predpokladajú, že ruda obsahuje v priemere 50 % cínu. Na hladine významnosti \(\alpha =0{,}05\) overte túto hypotézu odborníkov. -
Jednovýberový \(\chi^2 \)-test zhody rozptylu \(\sigma^2\) so známou konštantou \(\sigma^2_0\)
Predpokladáme, že náhodná premenná \(X\) základného súboru má normálne rozdelenie pravdepodobnosti s parametrami \(\mu\) a \(\sigma\), t. j. \(X\sim norm(\mu,\,\sigma)\). Nech \(n\) je rozsah náhodného výberu a \(s^2\) je výberový rozptyl.
Nulová hypotéza bude mať tvar \(H_0: \sigma^2=\sigma^2_0\), kde \(\sigma^2_0\) je známa konštanta.
Testovacia charakteristika \(\chi^2 =\dfrac{n-1}{\sigma^2_{0}}\cdot s^2\) má \(\chi^2\)-rozdelenie pravdepodobnosti (čítaj chíkvadrát) ) s \(\gamma=n-1\) stupňami voľnosti za predpokladu, že platí hypotéza \(H_0\).
Kritická oblasť \(K_{\alpha}\) je:- \((\chi^2_{1-\alpha,\,n-1}\, ;\infty ) \) pre \(H_1: \sigma^2\gt \sigma^2_0\)
- \((0\ ; \chi^2_{\alpha,\,n-1})\) pre \(H_1: \sigma^2\lt \sigma^2_0\)
-
\((0\ ; \chi^2_{\alpha/2,\,n-1}\ ) \cup (\chi^2_{1-\alpha/2,\,n-1} \ ; \infty) \) pre \(H_1: \sigma^2\not= \sigma^2_0\),
kde \(\chi^2_{\beta,\,n-1}\) je \(\beta\)-kvantil \(\chi^2\)-rozdelenia s \(\gamma=n-1\) stupňami voľnosti.
Príklad:
Presnosť nastavenia automatického obrábacieho stroja je charakterizovaná smerodajnou odchýlkou dĺžky súčiastok. Ak je táto hodnota väčšia ako \(\sqrt{20}\) mm, automat treba znova nastaviť. Meranie kontrolných súčiastok dalo tieto výsledky v milimetroch: 792, 803, 790, 804, 801, 803, 798, 799, 806, 797, 802, 796, 802, 801, 798, 799, 806, 809, 797, 803. Posúďte či treba urobiť nové nastavenie, ak použijeme hladinu významnosti \(\alpha =0{,}05\). Predpokladáme normálne rozdelenie základného súboru, z ktorého bol realizovaný náhodný výber. -
Dvojvýberový \(F\)-test zhody dvoch rozptylov \(\sigma^2_1\) a \(\sigma^2_2\)
Predpokladáme, že náhodná premenná \(X_1\) jedného základného súboru má normálne rozdelenie pravdepodobnosti s parametrami \(\mu_1\) a \(\sigma_1\), t. j. \(X_1\sim norm(\mu_1,\,\sigma_1)\) a náhodná premenná \(X_2\) druhého základného súboru má normálne rozdelenie pravdepodobnosti s parametrami \(\mu_2\) a \(\sigma_2\), t. j. \(X_2\sim norm(\mu_2,\,\sigma_2)\).
Nech sú dané dva nezávislé výbery z oboch základných súborov s rozsahmi \(n_1\) a \(n_2\), ktorých výberové rozptyly sú \(s^2_1\) a \(s^2_2\).
Nulová hypotéza bude mať tvar \(H_0: \sigma_1^2=\sigma_2^2\).
Testovacia charakteristika \(F=\dfrac{s_1^2}{s_2^2}\) má Fisherovo \(F\)-rozdelenie pravdepodobnosti s \(\gamma_1=n_1-1\) a \(\gamma_2=n_2-1\) stupňami voľnosti za predpokladu, že platí hypotéza \(H_0\).
Kritická oblasť \(K_{\alpha}\) je:- \(\left(F_{1-\alpha,\,\gamma_1,\,\gamma_2}\, ;\infty\right ) \) pre \(H_1: \sigma_1^2\gt\sigma_2^2\)
- \((0\ ; F_{\alpha,\,\gamma_1,\,\gamma_2})\) pre \(H_1: \sigma_1^2\lt\sigma_2^2\)
-
\((0\ ; F_{\alpha/2,\,\gamma_1,\,\gamma_2}) \cup (F_{1-\alpha/2,\,\gamma_1,\,\gamma_2} \ ; \infty) \) pre \(H_1: \sigma_1^2\not=\sigma_2^2\),
kde \(F_{\beta,\,\gamma_1,\,\gamma_2}\) je \(\beta\)-kvantil \(F\)-rozdelenia pravdepodobnosti s \(\gamma_1=n_1-1\) a \(\gamma_2=n_2-1\) stupňami voľnosti.
Poznámka:
Pre úsporu miesta sa v štandardných štatistických tabuľkách uvádzajú iba niektoré kvantily Fisherovho rozdelenia. Teda ak máme k dispozícii len takýto druh tabuliek, nenájdeniu niektorých kvantilov sa môžeme vyhnúť voľbou poradia premenných \(X_1\) a \(X_2\) tak, aby jednostranná alternatívna hypotéza mala tvar \(H_1: \sigma_1^2\gt\sigma_2^2\), resp. v prípade obojstrannej alternatívnej hypotézy zvolíme indexy \(_1\) a \(_2\) tak, aby platilo \( s_1 \gt s_2\), t. j. \( F \gt 1\). V prípade hľadania kvantilov napr. pomocou MATLABu nemáme žiadne obmedzenie.Príklad: Vážením sme získali údaje o presnom množstve automaticky balených výrobkov. Výsledky v gramoch pred nastavením baliaceho automatu sú: 243,2; 244,8; 253,1; 247,5; 251,0; 251,7; 254,0; 252,5; 252,8; 250,1; 247,3; 250,9; 253,2; 252,7. Výsledky v gramoch po nastavení baliaceho automatu sú: 250,4; 250,2; 251,1; 249,3; 249,9; 250,2; 251,1. Na hladine významnosti \(\alpha =0{,}05\) testujte hypotézu \(H_0: \sigma_1^2=\sigma_2^2\) proti \(H_1: \sigma_1^2\gt \sigma_2^2\). Predpokladáme normálne rozdelenie oboch základných súborov, z ktorých boli realizované náhodné výbery. -
Dvojvýberový \(Y\)-test zhody dvoch stredných hodnôt \(\mu_1\) a \(\mu_2\), pričom poznáme smerodajné odchýlky \(\sigma_1\) a \(\sigma_2\)
Predpokladáme, že náhodná premenná \(X_1\) jedného základného súboru má normálne rozdelenie pravdepodobnosti s parametrami \(\mu_1\) a \(\sigma_1\), t. j. \(X_1\sim norm(\mu_1,\,\sigma_1)\) a náhodná premenná \(X_2\) druhého základného súboru má normálne rozdelenie pravdepodobnosti s parametrami \(\mu_2\) a \(\sigma_2\), t. j. \(X_2\sim norm(\mu_2,\,\sigma_2)\), pričom hodnoty smerodajných odchýlok \(\sigma_1\) a \(\sigma_2\) poznáme.
Nech sú dané dva nezávislé výbery z oboch základných súborov s rozsahmi \(n_1\) a \(n_2\), ktorých výberové priemery sú \(\bar{x}_1\) a \(\bar{x}_2\).
Nulová hypotéza bude mať tvar \(H_0: \mu_1=\mu_2\).
Testovacia charakteristika \(Y=\dfrac{\bar{x}_1-\bar{x}_2}{\sqrt{n_2\cdot \sigma_1^2+n_1\cdot \sigma_2^2}}\cdot\sqrt{n_1\cdot n_2}\) má normované normálne rozdelenie pravdepodobnosti za predpokladu, že platí hypotéza \(H_0\).
Kritická oblasť \(K_{\alpha}\) je:- \((y_{1-\alpha} \ ; \infty) \) pre \(H_1: \mu_1\gt\mu_2\)
- \((-\infty\ ; - y_{1-\alpha} ) \) pre \(H_1: \mu_1\lt\mu_2\)
-
\((-\infty\ ; - y_{1-\alpha/2} ) \cup (y_{1-\alpha/2} \ ; \infty) \) pre \(H_1: \mu_1\not= \mu_2\),
kde \(y_\beta\) je \(\beta\)-kvantil normovaného normálneho rozdelenia pravdepodobnosti.
Príklad:
Prístroj meral dobu reakcie na svetelný signál v stotinách sekundy u desiatich náhodne vybraných vodičov z povolania, pričom bol zistený výberový priemer \(\bar{x}_1=34\) a tiež u dvadsiatich nových absolventov autoškoly, kde bol zistený výberový priemer \(\bar{x}_2=42\), pričom poznáme disperzie \(\sigma_1^2=3\) a \(\sigma_2^2=6\). Na hladine významnosti \(\alpha =0{,}05\) uvážte či doba reakcie na svetelný signál závisí od dĺžky praxe vodiča. Predpokladáme normálne rozdelenie oboch základných súborov, z ktorých boli realizované náhodné výbery. -
Dvojvýberový \(t\)-test zhody dvoch stredných hodnôt \(\mu_1\) a \(\mu_2\), pričom pre neznáme smerodajné odchýlky \(\sigma_1\) a \(\sigma_2\) platí \(\sigma_1=\sigma_2\)
Predpokladáme, že náhodná premenná \(X_1\) jedného základného súboru má normálne rozdelenie pravdepodobnosti s parametrami \(\mu_1\) a \(\sigma_1\), t. j. \(X_1\sim norm(\mu_1,\,\sigma_1)\) a náhodná premenná \(X_2\) druhého základného súboru má normálne rozdelenie pravdepodobnosti s parametrami \(\mu_2\) a \(\sigma_2\), t. j. \(X_2\sim norm(\mu_2,\,\sigma_2)\), pričom hodnoty smerodajných odchýlok \(\sigma_1\) a \(\sigma_2\) nepoznáme, ale predpokladáme \(\sigma_1=\sigma_2\).Poznámka: Predpoklad \(\sigma_1=\sigma_2\) je potrebné overiť \(F\)-testom.Nech sú dané dva nezávislé výbery z oboch základných súborov s rozsahmi \(n_1\) a \(n_2\), ktorých výberové priemery sú \(\bar{x}_1\), \(\bar{x}_2\) a výberové rozptyly sú \(s^2_1\) a \(s^2_2\).
Nulová hypotéza bude mať tvar \(H_0: \mu_1=\mu_2\).
Ak je splnený predpoklad \(\sigma_1=\sigma_2\), použijeme testovaciu charakteristiku \[ t=\frac{\bar{x}_1-\bar{x}_2}{\sqrt{(n_1-1)\cdot s_1^2+(n_2-1)\cdot s_2^2}}\cdot \sqrt{\frac{n_1\cdot n_2\cdot (n_1+n_2-2)}{n_1+n_2}}, \] ktorá má Studentovo \(t\)-rozdelenie pravdepodobnosti s \(\gamma=n_1+n_2-2\) stupňami voľnosti za predpokladu, že platí hypotéza \(H_0\).
Kritická oblasť \(K_{\alpha}\) je:- \(\left(t_{1-\alpha,\,\gamma}\, ;\infty\right ) \) pre \(H_1: \mu_1\gt\mu_2\)
- \((-\infty\ ; - t_{1-\alpha,\,\gamma} ) \) pre \(H_1: \mu_1\lt\mu_2\)
-
\((-\infty\ ; - t_{1-\alpha/2,\,\gamma} ) \cup (t_{1-\alpha/2,\,\gamma} \ ; \infty) \) pre \(H_1: \mu_1\not= \mu_2\),
kde \(t_{\beta,\,\gamma}\) je \(\beta\)-kvantil Studentovho \(t\)-rozdelenia pravdepodobnosti s \(\gamma=n_1+n_2-2\) stupňami voľnosti.
Poznámka:
Ak je \(n_1\gt 30\) a tiež \(n_2\gt 30\), tak môžeme použiť dvojvýberový \(Y\)-test (viď cieľ 5), kde položíme \(\sigma_1\approx s_1\) a \(\sigma_2\approx s_2\).
Tento postup volíme vtedy, keď máme k dispozícii len klasické tabuľky, pretože pre veľké výberové súbory nie sú tabelované hodnoty kvantilov \(t\)-rozdelenia, t. j. v tomto prípade Studentovo rozdelenie aproximujeme normovaným normálnym rozdelením.Príklad:
Jednou z rozhodujúcich vlastností pre akosť ľanového vlákna je hmotnosť stonky. Čím je stonka ťažšia, tým je vlákno kvalitnejšie. Aby sa preukázal vplyv istej metódy ošetrenia ľanu na akosť vlákna, bolo vykonaných 10 meraní na ošetrenom pozemku: 47,5; 57,7; 47,1; 38,8; 45,2; 49,8; 43,4; 50,8; 41,5; 38,8 a 12 meraní na kontrolnom neošetrenom pozemku: 49,2; 44,1; 44,1; 38,1; 40,9; 32,1; 36,8; 39,5; 67,2; 41,8; 46,9; 42,3. Za predpokladu normálneho rozdelenia hmotnosti stonky testujte hypotézu \(H_0: \mu_1=\mu_2\) proti hypotéze \(H_1: \mu_1\gt \mu_2\) na hladine významnosti \(\alpha = 0{,}05\). -
Dvojvýberový \(t\)-test zhody dvoch stredných hodnôt \(\mu_1\) a \(\mu_2\), pričom pre neznáme smerodajné odchýlky \(\sigma_1\) a \(\sigma_2\) platí \(\sigma_1\not=\sigma_2\)
Predpokladáme, že náhodná premenná \(X_1\) jedného základného súboru má normálne rozdelenie pravdepodobnosti s parametrami \(\mu_1\) a \(\sigma_1\), t. j. \(X_1\sim norm(\mu_1,\,\sigma_1)\) a náhodná premenná \(X_2\) druhého základného súboru má normálne rozdelenie pravdepodobnosti s parametrami \(\mu_2\) a \(\sigma_2\), t. j. \(X_2\sim norm(\mu_2,\,\sigma_2)\), pričom hodnoty smerodajných odchýlok \(\sigma_1\) a \(\sigma_2\) nepoznáme, ale predpokladáme \(\sigma_1\not=\sigma_2\).Poznámka: Predpoklad \(\sigma_1\not=\sigma_2\) je potrebné overiť \(F\)-testom.Nech sú dané dva nezávislé výbery z oboch základných súborov s rozsahmi \(n_1\) a \(n_2\), ktorých výberové priemery sú \(\bar{x}_1\), \(\bar{x}_2\) a výberové rozptyly sú \(s^2_1\) a \(s^2_2\).
Nulová hypotéza bude mať tvar \(H_0: \mu_1=\mu_2\).
Ak nie je splnený predpoklad \(\sigma_1=\sigma_2\), použijeme tzv. Welchov test a testovaciu charakteristiku \[t=\dfrac{\bar{x}_1-\bar{x}_2}{\sqrt{ \dfrac{s_1^2}{n_1} +\dfrac{s_2^2}{n_2} }},\] ktorá má pri platnosti nulovej hypotézy \(t\)-rozdelenie pravdepodobnosti s \(\gamma\) stupňami voľnosti, pričom pre počet stupňov voľnosti platí vzťah \[ \gamma =\dfrac{ \bigg ( \dfrac{s_1^2}{n_1} +\dfrac{s_2^2}{n_2} \bigg ) ^2 } { \dfrac{ \bigg ( \dfrac{ s_1^2 }{n_1}\bigg ) ^2 }{n_1-1} +\dfrac{ \bigg ( \dfrac{s_2^2}{n_2} \bigg ) ^2 } {n_2-1} } .\]Poznámka: Počet stupňov voľnosti získame zaokrúhlením uvedeného výrazu.Kritická oblasť \(K_{\alpha}\) je:- \(\left(t_{1-\alpha,\,\gamma}\, ;\infty\right ) \) pre \(H_1: \mu_1\gt\mu_2\)
- \((-\infty\ ; - t_{1-\alpha,\,\gamma} ) \) pre \(H_1: \mu_1\lt\mu_2\)
-
\((-\infty\ ; - t_{1-\alpha/2,\,\gamma} ) \cup (t_{1-\alpha/2,\,\gamma} \ ; \infty) \) pre \(H_1: \mu_1\not= \mu_2\),
kde \(t_{\beta,\,\gamma}\) je \(\beta\)-kvantil Studentovho \(t\)-rozdelenia pravdepodobnosti s \(\gamma\) stupňami voľnosti.
Príklad:
Vážením sme získali údaje o hmotnosti automaticky balených výrobkov. Výsledky v gramoch pred nastavením baliaceho automatu sú: 243,2; 244,8; 253,1; 247,5; 251,0; 251,7; 254,0; 252,5; 252,8; 250,1; 247,3; 250,9; 253,2; 252,7. Výsledky v gramoch po nastavení baliaceho automatu sú: 250,4; 250,2; 251,1; 249,3; 249,9; 250,2; 251,1. Na hladine významnosti \(\alpha =0{,}05\) zistite či sa stredná hodnota hmotnosti nastavením automatu nezmenila. Predpokladáme normálne rozdelenie oboch základných súborov, z ktorých boli realizované náhodné výbery.
-
Párový \(t\)-test zhody dvoch stredných hodnôt \(\mu_1\) a \(\mu_2\)
Predpokladáme, že náhodná premenná \(X_1\) jedného základného súboru má normálne rozdelenie pravdepodobnosti s parametrami \(\mu_1\) a \(\sigma_1\), t. j. \(X_1\sim norm(\mu_1,\,\sigma_1)\) a náhodná premenná \(X_2\) druhého základného súboru má normálne rozdelenie pravdepodobnosti s parametrami \(\mu_2\) a \(\sigma_2\), t. j. \(X_2\sim norm(\mu_2,\,\sigma_2)\), pričom hodnoty smerodajných odchýlok \(\sigma_1\) a \(\sigma_2\) nepoznáme, ale predpokladáme \(\sigma_1=\sigma_2=\sigma\).
Ďalej predpokladáme, že máme dva spárované závislé výbery \(x_{1,\,1},\,x_{1,\,2},\,\dots ,\,x_{1,\,n}\) a \(x_{2,\,1},\,x_{2,\,2},\,\dots ,\,x_{2,\,n}\) rovnakého rozsahu \(n\). To je situácia, ktorá nastane napr. vtedy, ak meriame objekt dvakrát (pred pokusom a po ňom) a chceme zistiť či mal pokus nejaký vplyv na meraný objekt.
Z predpokladu normality dvojrozmerného rozdelenia vyplýva, že rozdiel náhodných veličín \(X_1\), \(X_2\), teda náhodná veličina \(D=X_1-X_2\) má normálne rozdelenie so strednou hodnotou \(\mu_d=\mu_1-\mu_2\).
Postupujeme tak, že najprv vypočítame rozdiely \[d_i=x_{1,\,i}-x_{2,\,i}\] medzi párovými hodnotami, pre \(i=1,\,2,\,\dots,\,n\). Na vopred zvolenej hladine významnosti \(\alpha\) môžeme namiesto hypotézy \(H_0: \mu_1=\mu_2\) ekvivalentne testovať nulovú hypotézu \(H_0: \mu_d=0\) a pre túto použiť jednovýberový \(t\)-test strednej hodnoty (viď cieľ 2).
Alternatívne hypotézy sú potom \(H_1: \mu_d\gt0\), \(H_1: \mu_d\lt0\) a \(H_1: \mu_d\not=0\).Poznámka:
Aj keď bol párový \(t\)-test odvodený pre závislé výbery, nie je hrubou chybou jeho použitie aj pre nezávislé výbery s rovnakými rozsahmi, teda v situácii, keď by sa mal použiť dvojvýberový \(t\)-test. Ako sa uvádza v literatúre, dôjde len k menej efektívnemu spracovaniu informácie obsiahnutej vo výberových dátach.Príklad:
V nasledujúcej tabuľke sú počty získaných bodov desiatich študentov z praktickej a teoretickej časti skúšky: \[ \begin{array}{|c|c|c|c|c|c|c|c|c|c|c|} \hline \mathrm{Praktická\,časť}\a 28 \a 35 \a 32\a 15 \a 35\a 24 \a 29\a 19\a 21\a 12 \\ \hline \mathrm{Teoretická\,časť}\a 25 \a 35 \a 30 \a 11 \a 32 \a 28 \a 28\a 25\a 22 \a 11 \\ \hline \end{array} \] Na porovnanie týchto výsledkov aplikujte vhodný test. Použite hladinu významnosti \(\alpha =0{,}05\). Predpokladáme normalitu rozdelenia výberových súborov.
Zdroje
- Ostertagová, E.: Aplikovaná štatistika. Equilibria, Košice, 2013, 218 s., ISBN 978-80-8143-067-1.
- Ostertagová, E.: Pravdepodobnosť a matematická štatistika v príkladoch. Elfa, Košice, 2005, 123 s., ISBN 80-8086-005-X.
Doplňujúce úlohy
Úloha:
Priemerná výška desaťročných chlapcov je 135,3 cm. U 14 chlapcov, ktorí navštevujú športovú školu, boli namerané tieto hodnoty výšky v cm: 136, 130, 151, 127, 133, 136, 139, 139, 141, 147, 139, 142, 140, 138. Na hladine významnosti \(\alpha =0{,}05\) overte hypotézu, že výška chlapcov športovej školy sa štatisticky významne odlišuje od výšky 135,3 cm za predpokladu, že rozptyl výšky desaťročných chlapcov je \(\sigma^2=38{,}26\) [\(\mathrm{cm^2}\)]. Predpokladáme normálne rozdelenie základného súboru, z ktorého bol realizovaný náhodný výber.
Priemerná výška desaťročných chlapcov je 135,3 cm. U 14 chlapcov, ktorí navštevujú športovú školu, boli namerané tieto hodnoty výšky v cm: 136, 130, 151, 127, 133, 136, 139, 139, 141, 147, 139, 142, 140, 138. Na hladine významnosti \(\alpha =0{,}05\) overte hypotézu, že výška chlapcov športovej školy sa štatisticky významne odlišuje od výšky 135,3 cm za predpokladu, že rozptyl výšky desaťročných chlapcov je \(\sigma^2=38{,}26\) [\(\mathrm{cm^2}\)]. Predpokladáme normálne rozdelenie základného súboru, z ktorého bol realizovaný náhodný výber.
Úloha:
Systematická chyba meracieho prístroja sa eliminuje jeho nastavením a meraním etalónu, ktorého správnou nameranou hodnotou je \(\mu_0=10\). Nezávislými meraniami za rovnakých podmienok boli získané tieto hodnoty: 10,24; 10,12; 9,91; 10,19; 9,78; 10,14; 9,86; 10,17; 10,05. Predpokladáme normálne rozdelenie základného súboru, z ktorého bol realizovaný náhodný výber. Je možné na hladine významnosti \(\alpha =0{,}05\) vysvetliť odchýlky od hodnoty 10 náhodnými vplyvmi?
Systematická chyba meracieho prístroja sa eliminuje jeho nastavením a meraním etalónu, ktorého správnou nameranou hodnotou je \(\mu_0=10\). Nezávislými meraniami za rovnakých podmienok boli získané tieto hodnoty: 10,24; 10,12; 9,91; 10,19; 9,78; 10,14; 9,86; 10,17; 10,05. Predpokladáme normálne rozdelenie základného súboru, z ktorého bol realizovaný náhodný výber. Je možné na hladine významnosti \(\alpha =0{,}05\) vysvetliť odchýlky od hodnoty 10 náhodnými vplyvmi?
Úloha:
Podľa informácií výrobcu je variabilita životnosti ním vyrábaných obrazoviek vyjadrená smerodajnou odchýlkou 45 hodín. O životnosti náhodne vybraných 50 obrazoviek vyrobených u tohto výrobcu sú údaje v tabuľke:
Predpokladáme normálne rozdelenie základného súboru, z ktorého bol realizovaný náhodný výber. Testom na hladine významnosti
\(\alpha =0{,}02\) overte či sa dá prijať predpoklad, že je variabilita životnosti obrazoviek taká, ako tvrdí výrobca alebo
taká nie je.
Podľa informácií výrobcu je variabilita životnosti ním vyrábaných obrazoviek vyjadrená smerodajnou odchýlkou 45 hodín. O životnosti náhodne vybraných 50 obrazoviek vyrobených u tohto výrobcu sú údaje v tabuľke:
\(I_i\) | \(n_i\) |
---|---|
1860 - 1900 | 1 |
1900 - 1940 | 4 |
1940 - 1980 | 12 |
1980 - 2020 | 14 |
2020 - 2060 | 15 |
2060 - 2100 | 3 |
2100 - 2140 | 1 |
Úloha:
Zisťovalo sa či špeciálny prípravok pridaný do ocele zvyšuje jej pevnosť. Výsledky merania pri vzorkách, kde bol použitý prípravok: 6,2; 5,7; 5,6; 6,0; 6,3; 5,8; 5,7; 6,0; 6,0; 5,8. Výsledky merania pri vzorkách, kde nebol použitý prípravok: 5,6; 5,9; 5,8; 5,9; 5,7; 5,7; 6,0; 5,5; 5,7; 5,5. Na hladine významnosti \(\alpha =0{,}05\) rozhodnite či sa disperzie oboch vzoriek významne líšia. Predpokladáme normálne rozdelenie oboch základných súborov, z ktorých boli realizované náhodné výbery.
Zisťovalo sa či špeciálny prípravok pridaný do ocele zvyšuje jej pevnosť. Výsledky merania pri vzorkách, kde bol použitý prípravok: 6,2; 5,7; 5,6; 6,0; 6,3; 5,8; 5,7; 6,0; 6,0; 5,8. Výsledky merania pri vzorkách, kde nebol použitý prípravok: 5,6; 5,9; 5,8; 5,9; 5,7; 5,7; 6,0; 5,5; 5,7; 5,5. Na hladine významnosti \(\alpha =0{,}05\) rozhodnite či sa disperzie oboch vzoriek významne líšia. Predpokladáme normálne rozdelenie oboch základných súborov, z ktorých boli realizované náhodné výbery.
Úloha:
Odberateľ dostáva žiarivky od dvoch dodávateľov A a B. Pri hodnotení kvality žiariviek sa sleduje tiež počet zapojení, ktoré žiarivky vydržia bez poškodenia. Skúšky výrobkov viedli k týmto výsledkom:
Dodávateľ A: 2139, 2041, 1968, 1903, 1952, 1980, 2089, 1915, 2389, 2163, 2072, 1712, 2018, 1792, 1849.
Dodávateľ B: 1947, 1602, 1906, 2031, 2072, 1812, 1942, 2074, 2132.
Na hladine významnosti \(\alpha =0{,}05\) overte hypotézu, že kvalita oboch dodávok je rovnaká. Predpokladáme normálne rozdelenie oboch základných súborov, z ktorých boli realizované náhodné výbery.
Odberateľ dostáva žiarivky od dvoch dodávateľov A a B. Pri hodnotení kvality žiariviek sa sleduje tiež počet zapojení, ktoré žiarivky vydržia bez poškodenia. Skúšky výrobkov viedli k týmto výsledkom:
Dodávateľ A: 2139, 2041, 1968, 1903, 1952, 1980, 2089, 1915, 2389, 2163, 2072, 1712, 2018, 1792, 1849.
Dodávateľ B: 1947, 1602, 1906, 2031, 2072, 1812, 1942, 2074, 2132.
Na hladine významnosti \(\alpha =0{,}05\) overte hypotézu, že kvalita oboch dodávok je rovnaká. Predpokladáme normálne rozdelenie oboch základných súborov, z ktorých boli realizované náhodné výbery.
Úloha:
Pri antropologických meraniach obyvateľov Egypta bola okrem iného sledovaná šírka nosa v centimetroch u skupiny mužov vo veku 21 − 50 rokov zo severnej časti krajiny a u skupiny rovnako starých mužov z južnej časti. Výskum viedol k týmto výsledkom:
Sever: 3,6; 4,1; 3,3; 3,4; 3,7; 3,1; 4,0; 4,0; 3,6; 3,0; 3,3; 3,7; 4,3; 3,3; 3,4; 3,4; 3,3; 3,6; 4,0; 3,4; 3,7.
Juh: 4,1; 3,9; 4,0; 3,8; 4,1; 4,2; 3,8; 3,9; 3,8; 3,8; 4,0; 3,7; 3,9; 4,4; 3,7; 3,8; 3,9; 3,9; 4,0; 4,1; 3,8; 4,0; 4,3.
Posúďte významnosť rozdielov vo výsledkoch meraní na hladine významnosti \(\alpha =0{,}05\). Predpokladáme normálne rozdelenie oboch základných súborov, z ktorých boli realizované náhodné výbery.
Pri antropologických meraniach obyvateľov Egypta bola okrem iného sledovaná šírka nosa v centimetroch u skupiny mužov vo veku 21 − 50 rokov zo severnej časti krajiny a u skupiny rovnako starých mužov z južnej časti. Výskum viedol k týmto výsledkom:
Sever: 3,6; 4,1; 3,3; 3,4; 3,7; 3,1; 4,0; 4,0; 3,6; 3,0; 3,3; 3,7; 4,3; 3,3; 3,4; 3,4; 3,3; 3,6; 4,0; 3,4; 3,7.
Juh: 4,1; 3,9; 4,0; 3,8; 4,1; 4,2; 3,8; 3,9; 3,8; 3,8; 4,0; 3,7; 3,9; 4,4; 3,7; 3,8; 3,9; 3,9; 4,0; 4,1; 3,8; 4,0; 4,3.
Posúďte významnosť rozdielov vo výsledkoch meraní na hladine významnosti \(\alpha =0{,}05\). Predpokladáme normálne rozdelenie oboch základných súborov, z ktorých boli realizované náhodné výbery.
Úloha:
Stanovenie thiocyanového iónu bolo paralelne realizované metódami A a B na 12 vzorkách s týmito výsledkami:
Metóda A: 0,38; 0,56; 0,45; 0,49; 0,38; 0,41; 0,60; 0,36; 0,26; 0,41; 0,43; 0,40.
Metóda B: 0,39; 0,58; 0,44; 0,52; 0,41; 0,45; 0,59; 0,37; 0,28; 0,42; 0,42; 0,38.
Porovnajte obe metodiky otestovaním výsledkov. Zvoľte hladinu významnosti \(\alpha =0{,}05\). Predpokladáme normálne rozdelenie oboch základných súborov, z ktorých boli realizované náhodné výbery.
Stanovenie thiocyanového iónu bolo paralelne realizované metódami A a B na 12 vzorkách s týmito výsledkami:
Metóda A: 0,38; 0,56; 0,45; 0,49; 0,38; 0,41; 0,60; 0,36; 0,26; 0,41; 0,43; 0,40.
Metóda B: 0,39; 0,58; 0,44; 0,52; 0,41; 0,45; 0,59; 0,37; 0,28; 0,42; 0,42; 0,38.
Porovnajte obe metodiky otestovaním výsledkov. Zvoľte hladinu významnosti \(\alpha =0{,}05\). Predpokladáme normálne rozdelenie oboch základných súborov, z ktorých boli realizované náhodné výbery.
Doplňujúce zdroje
- Bakytová, H., Ugron, M.: Príklady zo štatistických metód. Alfa, Bratislava, 1972, 289 s.
- Buša, J., Pirč, V., Schrötter, Š.: Numerické metódy, pravdepodobnosť a matematická štatistika. Elfa, Košice, 2006, 166 s., ISBN 80-8073-632-4.
- Daňo, I., Ostertagová, E.: Numerické metódy, pravdepodobnosť a matematická štatistika. Teória, riešené príklady a praktické aplikácie s MATLABom. Equilibria, Košice, 2011, 198 s., ISBN 978-80-89284-74-0.
- Gavalec, M., Kováčová, N., Ostertagová, E., Skřivánek, J: Pravdepodobnosť a matematická štatistika v počítačovom prostredí MATLABu. Elfa, Košice, 2002, 150 s., ISBN 80-89066-05-4.
- Markechová, D., Tirpáková, A., Stehlíková, B.: Základy štatistiky pre pedagógov, UKF v Nitre, 2011,205 s., ISBN 978-80-8094.
- Otipka, P., Šmajstrla, V.: Pravděpodobnost a statistika. TU, Ostrava, 2012, 269 s., ISBN 80-248-1194-4.
V praxi by sa mal vždy testovať aj predpoklad o normalite výberových súborov.