Este o discrepanță între media eșantionului și populația generală care nu depășește ±6 (delta).

Bazat teoremele lui Cebyshev P.L. valoarea medie a erorii cu selecție repetată aleatorie, se calculează folosind formula (pentru caracteristica cantitativă medie):

unde numărătorul este varianța atributului x în populația eșantionului;
n este dimensiunea populației eșantionului.

Pentru o caracteristică alternativă, formula pentru eroarea medie de eșantionare pentru proporție prin teorema lui J. Bernoulli calculat prin formula:

unde p(1-p) este dispersia ponderii caracteristicii în populația generală;
n - dimensiunea eșantionului.

Datorită faptului că varianța unei caracteristici în populația generală nu este cunoscută cu precizie, în practică se utilizează valoarea varianței, care se calculează pentru populația eșantion pe baza legea numerelor mari. Conform acestei legi, o populație eșantion cu o dimensiune mare a eșantionului reproduce destul de exact caracteristicile populației generale.

Prin urmare, formulele de calcul eroare medie pentru reeșantionarea aleatorie va arata asa:

1. Pentru o caracteristică cantitativă medie:

unde S^2 este varianța atributului x în populația eșantion;
n - dimensiunea eșantionului.

unde w (1 - w) este dispersia proporției caracteristicii studiate în populația eșantion.

În teoria probabilității s-a arătat că se exprimă prin eșantion după formula:

În cazuri mostra mica, când volumul său este mai mic de 30, este necesar să se țină cont de coeficientul n/(n-1). Apoi eroarea medie a unui eșantion mic este calculată folosind formula:

Deoarece în procesul de eșantionare nerepetitivă numărul de unități din populația generală este redus, atunci în formulele de mai sus pentru calcularea erorilor medii de eșantionare, expresia radicală trebuie înmulțită cu 1- (n/N).

Formulele de calcul pentru acest tip de eșantionare vor arăta astfel:

1. Pentru o caracteristică cantitativă medie:

unde N este volumul populației generale; n - dimensiunea eșantionului.

2. Pentru o cotă (atribut alternativ):

unde 1- (n/N) este proporția unităților din populația generală care nu au fost incluse în eșantion.

Deoarece n este întotdeauna mai mic decât N, factorul suplimentar 1 - (n/N) va fi întotdeauna mai mic decât unu. Aceasta înseamnă că eroarea medie cu selecția repetată va fi întotdeauna mai mică decât cu selecția repetată. Atunci când proporția unităților din populația generală care nu au fost incluse în eșantion este semnificativă, atunci valoarea 1 - (n/N) este apropiată de unu și atunci eroarea medie se calculează folosind formula generală.

Eroarea medie depinde de următorii factori:

1. La implementarea principiului selecției aleatorii, eroarea medie de eșantionare este determinată, în primul rând, de dimensiunea eșantionului: cu cât numărul este mai mare, cu atât valorile sunt mai mici eroare medie de eșantionare. Populația generală este caracterizată mai precis atunci când mai multe unități din această populație sunt acoperite de observarea prin eșantion

2. Eroarea medie depinde și de gradul de variație a caracteristicii. Gradul de variație se caracterizează prin. Cu cât variația unei caracteristici (dispersie) este mai mică, cu atât eroarea medie de eșantionare este mai mică. Cu varianță zero (atributul nu variază), eroarea medie de eșantionare este zero, astfel, orice unitate din populație va caracteriza întreaga populație prin acest atribut.

După cum se știe, în statistică există două moduri de observare a fenomenelor de masă în funcție de gradul de acoperire complet al obiectului: continuă și necontinuă. Un tip de observație necontinuă este observația selectivă.

Sub observatie selectiva se referă la observarea necontinuă, în care unități alese aleatoriu ale populației studiate sunt supuse examinării statistice (observării).

Observarea eșantionului își pune sarcina de a caracteriza întreaga populație de unități pentru partea cercetată, sub rezerva respectării tuturor regulilor și principiilor observației statistice și a muncii organizate științific de selecție a unităților.

Setul de unități selectate pentru sondaj în statistici este de obicei numit populația eșantionului , iar setul de unități din care se face selecția este numit populatie generala . Principalele caracteristici ale populației generale și eșantionului sunt prezentate în Tabelul 1.

Tabelul 1 - Principalele caracteristici ale populației generale și eșantionului
IndexDenumirea sau formula
Populația Eșantion de populație
Număr de unități N n
Numărul de unități care posedă orice caracteristică M m
Proporția unităților care posedă această trăsătură p = M/N ω = m/n
Proporția unităților care nu au această caracteristică q = 1 - p 1 - ω
Valoarea medie semn
Dispersia semn
Varianta unei caracteristici alternative (dispersia unei cote) pq ω (1 - ω)

La efectuarea observațiilor prin eșantionare apar erori sistematice și aleatorii. Erorile sistematice apar din cauza încălcării regulilor de selectare a unităților din eșantion. Schimbând regulile de selecție, puteți scăpa de astfel de erori.

Erorile aleatorii apar din cauza naturii incomplete a anchetei. Altfel se numesc erori de reprezentativitate (reprezentativitate). Erorile aleatoare sunt împărțite în erori medii și maxime de eșantionare, care sunt determinate atât la calcularea caracteristicii, cât și la calcularea cotei.

Erorile medii și maxime sunt legate de următoarea relație :Δ = tμ, unde Δ este eroarea maximă de eșantionare, μ este eroarea medie de eșantionare, t este coeficientul de încredere, determinat în funcție de nivelul de probabilitate. Tabelul 2 prezintă câteva valori t luate din teoria probabilității.

Eroarea medie de eșantionare se calculează diferențial în funcție de metoda de selecție și procedura de eșantionare. Formulele de bază pentru calcularea erorilor de eșantionare sunt prezentate în Tabelul 3.

Tabelul 3 - Formule de bază pentru calcularea erorilor de eșantionare în timpul eșantionării repetate și nerepetitive
IndexDenumirea și formula
Populația Eșantion de populație
Eroarea medie a unei trăsături cu selecție repetată aleatorie
Eroare de proporție medie cu reeșantionare aleatorie
Eroarea marginală a unei trăsături sub selecție repetată aleatorie
Eroarea marginală a proporției sub reeșantionare aleatorie
Eroarea medie a unei trăsături în timpul selecției aleatoare nerepetitive
Eroare medie de fracție pentru eșantionarea aleatorie nerepetitivă
Eroarea maximă a unei trăsături în selecția aleatorie nerepetitivă
Eroarea marginală a fracției în cazul selecției aleatorii nerepetitive

Calculul erorilor medii și maxime de eșantionare ne permite să determinăm posibilele limite în care se vor afla caracteristicile populației generale .

De exemplu, pentru o medie eșantion, astfel de limite sunt stabilite pe baza următoarelor relații:

Limitele ponderii caracteristicii în populația generală a râului.

Exemple de rezolvare a problemelor pe tema „Observare eșantion în statistică”

Problema 1 . Există informații despre producția de produse (lucrări, servicii) obținute pe baza observării eșantionului de 10% a întreprinderilor din regiune:

Determinați: 1) pentru întreprinderile incluse în eșantion: a) mărimea medie a produselor produse pe întreprindere; b) dispersia volumului producţiei; c) ponderea întreprinderilor cu un volum de producție de peste 400 de mii de ruble; 2) în ansamblul regiunii, cu o probabilitate de 0,954, limitele în care se poate aştepta: a) volumul mediu de producţie pe întreprindere; b) ponderea întreprinderilor cu un volum de producție de peste 400 de mii de ruble; 3) volumul total de producție din regiune.

Soluţie

Pentru a rezolva problema, să extindem tabelul propus.

1) Pentru întreprinderile incluse în eșantion, mărimea medie a producției pe întreprindere

110800/400 = 277 mii de ruble.

Calculăm varianța volumului producției într-un mod simplificat: σ 2 = 35640000/400 – 277 2 = 89100 – 76229 = 12371.

Numărul de întreprinderi al căror volum de producție depășește 400 de mii de ruble. este egal cu 36+12 = 48, iar cota lor este ω = 48:400 = 0,12 = 12%.

2) Din teoria probabilității se știe că cu probabilitatea P = 0,954, coeficientul de încredere este t = 2. Eroare marginală de eșantionare

2√12371:400 = 11,12 mii de ruble.

Să stabilim limitele mediei generale: 277-11,12 ≤Хср≤ 277+11,12; 265,88 ≤Хср≤ 288,12

Eroarea marginală de eșantionare a ponderii întreprinderilor

2√0,12*0,88/400 = 0,03

Să determinăm limitele cotei generale: 0,12-0,03≤ p ≤0,12+0,03; 0,09≤ р ≤0,15

3) Întrucât grupul de întreprinderi luat în considerare reprezintă 10% din numărul total de întreprinderi din regiune, atunci în total există 4.000 de întreprinderi în regiune. Apoi, volumul total de producție din regiune se află în intervalul 265,88×4000≤Q≤288,12×4000; 1063520 ≤ Q ≤ 1152480

Problema 2 . Conform rezultatelor unui audit de control de către serviciile fiscale a 400 de structuri de afaceri, 140 dintre acestea nu au indicat în totalitate veniturile supuse impozitării în declarațiile lor fiscale. Determinați în populația generală (pe întreg districtul) ponderea structurilor de afaceri care și-au ascuns o parte din venituri din impozite cu o probabilitate de 0,954.

Soluţie

Conform condițiilor problemei, numărul de unități din populația eșantionului este n = 400, numărul de unități care posedă caracteristica luată în considerare este m = 140, probabilitatea P = 0,954.

Din teoria probabilității se știe că cu probabilitatea P = 0,954, coeficientul de încredere este t = 2.

Ponderea unităților care posedă caracteristica specificată este determinată de formula: p=w+∆p, unde w = m/n=140/400=0,35=35%,
iar eroarea maximă a semnului ∆p se obține din formula: ∆p= t √w(1-w)/n = 2√0,35×0,65/400 ≈ 0,5 = 5%

Atunci p = 35±5%.

Răspuns : Ponderea structurilor de afaceri care și-au ascuns o parte din veniturile din impozite cu o probabilitate de 0,954 este de 35±5%.

Având în vedere că pe baza unui sondaj prin sondaj este imposibil să se estimeze cu exactitate parametrul studiat (de exemplu, valoarea medie) al populației generale, este necesar să se găsească limitele în care se află. Într-o anumită probă, diferența poate fi mai mare decât, mai mică sau egală cu . Fiecare abatere de la are o anumită probabilitate. Într-un sondaj prin sondaj, valoarea reală în populație este necunoscută. Cunoscând eroarea medie de eșantionare, cu o anumită probabilitate se poate estima abaterea mediei eșantionului de la cea generală și se stabilesc limitele în care se află parametrul studiat (în acest caz valoarea medie) în populația generală. Se numește abaterea caracteristicii eșantionului de la cea generală eroare marginală de eșantionare. Se determină ca o fracțiune din eroarea medie cu o probabilitate dată, adică

= t,(1.38)

Unde tfactor de încredere, în funcție de probabilitatea cu care se determină eroarea maximă de eșantionare.

Probabilitatea de apariție a unei anumite erori de eșantionare se găsește folosind teoremele teoriei probabilităților. Conform teoremei lui P. L. Cebyshev, cu o dimensiune a eșantionului suficient de mare și o varianță limitată a populației, probabilitatea ca diferența dintre media eșantionului și media populației să fie arbitrar mică este aproape de unu:

la .

A. M. Lyapunov a dovedit că Indiferent de natura distribuției populației, pe măsură ce dimensiunea eșantionului crește, distribuția de probabilitate a apariției uneia sau alteia valori a mediei eșantionului se apropie de distribuția normală.. Aceasta este așa-numita teoremă limită centrală. În consecință, probabilitatea de abatere a mediei eșantionului de la media generală, i.e. probabilitatea de apariție a unei erori limitative date respectă, de asemenea, legea specificată și poate fi găsită în funcție de t folosind integrala de probabilitate Laplace:

,

unde este abaterea normalizată a mediei eșantionului de la media generală.

Valorile integralei Laplace pentru diferite t calculate și disponibile în tabele speciale, a căror combinație este utilizată pe scară largă în statistici:

Probabilitate

După setarea unui anumit nivel de probabilitate, alegeți valoarea abaterii normalizate tși determinați eroarea maximă de eșantionare folosind formula (1.38)

În acest caz, = 0,95 este cel mai des folosit și t= 1,96, adică Ei cred că, cu o probabilitate de 95%, eroarea marginală de eșantionare este de două ori mai mare decât media. Prin urmare, în statistică valoarea t numit uneori factorul erorii maxime raportat la medie.

Principalul avantaj al observării eșantionului, printre altele, este capacitatea de a calcula eroarea de eșantionare aleatorie.

Erorile de eșantionare pot fi sistematice sau aleatorii.

Sistematic- în cazul în care principiul de bază al prelevării - aleatorietatea - este încălcat. Aleatoriu- apar de obicei din cauza faptului că structura populației eșantionului diferă întotdeauna de structura populației generale, oricât de corect este făcută selecția, adică în ciuda principiului selecției aleatorii a unităților de populație, există încă discrepanțe între caracteristicile eşantionului şi populaţia generală. Studiul și măsurarea erorilor aleatorii de reprezentativitate este sarcina principală a metodei de eșantionare.

De obicei, eroarea mediei și eroarea proporției sunt cel mai adesea calculate. Pentru calcule se folosesc următoarele convenții:

Media calculată în cadrul populației;

Media calculată în cadrul populației eșantionului;

R- ponderea acestui grup în populaţia generală;

w- ponderea acestui grup în populația eșantion.

Folosind convenții, erorile de eșantionare pentru medie și pentru proporție pot fi scrise după cum urmează:

Media eșantionului și proporția eșantionului sunt variabile aleatoare care pot lua orice valoare în funcție de unitățile populației incluse în eșantion. Prin urmare, erorile de eșantionare sunt, de asemenea, variabile aleatoare și pot lua valori diferite. Prin urmare, se determină media erorilor posibile μ .

Spre deosebire de eroarea sistematică, eroarea aleatorie poate fi determinată în prealabil, înainte de eșantionare, conform teoremelor limită considerate în statistica matematică.

Eroarea medie este determinată cu o probabilitate de 0,683. În cazul unei probabilități diferite, se vorbește despre o eroare marginală.

Eroarea medie de eșantionare pentru medie și pentru proporție este definită după cum urmează:


În aceste formule, varianța unei caracteristici este o caracteristică a populației generale, care este necunoscută în timpul observării eșantionului. În practică, ele sunt înlocuite cu caracteristici similare ale populației eșantionului pe baza legii numerelor mari, conform căreia populația eșantionului reproduce cu acuratețe caracteristicile populației generale în cantități mari.

Formule pentru determinarea erorii medii pentru diferite metode de selecție:

Metoda de selecție Repetat Repetabil
eroare de medie eroare de distribuire eroare de medie eroare de distribuire
În mod corespunzător aleatoriu și mecanic
Tipic
Serial

μ - eroare medie;

∆ - eroare maximă;

P - marime de mostra;

N- dimensiunea populației;

Varianta totala;

w- ponderea acestei categorii în dimensiunea totală a eșantionului:

Media variațiilor în cadrul grupului;

Δ 2 - dispersie intergrup;

r- numărul de serii din eșantion;

R- numărul total de episoade.


Eroare marginală pentru toate metodele de eșantionare este legată de eroarea medie de eșantionare, după cum urmează:

Unde t- coeficient de încredere, raportat funcţional cu probabilitatea cu care se asigură valoarea maximă a erorii. În funcție de probabilitate, coeficientul de încredere t ia următoarele valori:

t P
0,683
1,5 0,866
2,0 0,954
2,5 0,988
3,0 0,997
4,0 0,9999

De exemplu, probabilitatea de eroare este 0,683. Aceasta înseamnă că media generală diferă de media eșantionului în valoare absolută cu cel mult μ cu o probabilitate de 0,683, atunci dacă este media eșantionului, este media generală, atunci Cu probabilitate 0,683.

Dacă dorim să asigurăm o probabilitate mai mare de concluzii, creștem astfel marjele de eroare aleatorie.

Astfel, mărimea erorii maxime depinde de următoarele mărimi:

Fluctuații ale unei caracteristici (relație directă), care se caracterizează prin cantitatea de dispersie;

Dimensiunea eșantionului (feedback);

Probabilitatea de încredere (conexiune directă);

Metoda de selecție.

Un exemplu de calcul al erorii mediei și al erorii proporției.

Pentru a determina numărul mediu de copii dintr-o familie, 100 de familii au fost selectate din 1000 de familii folosind o metodă de eșantionare aleatorie nerepetitivă.Rezultatele sunt prezentate în tabel:

Defini:.

- cu o probabilitate de 0,997, eroarea maximă de eșantionare și limitele în care se află numărul mediu de copii dintr-o familie;

- cu o probabilitate de 0,954, limitele în care se află proporția familiilor cu doi copii.

1. Să determinăm eroarea maximă a mediei cu o probabilitate de 0,977. Pentru a simplifica calculele, folosim metoda momentelor:

p = 0,997 t= 3

eroare medie a mediei, 0,116 - eroare marginală

2,12 – 0,116 ≤ ≤ 2,12+ 0,116

2,004 ≤ ≤ 2,236

Prin urmare, cu o probabilitate de 0,997, numărul mediu de copii dintr-o familie din populația generală, adică din 1000 de familii, este în intervalul 2,004 - 2,236.

Erori sistematice și aleatorii

Unitatea modulară 2 Erori de eșantionare

Deoarece un eșantion acoperă de obicei o parte foarte mică a populației, ar trebui să se presupune că vor exista diferențe între estimare și caracteristicile populației pe care estimarea le reflectă. Aceste diferențe se numesc erori de cartografiere sau erori de reprezentativitate. Erorile de reprezentativitate sunt împărțite în două tipuri: sistematice și aleatorii.

Erori sistematice- aceasta este o supraestimare sau subestimare constantă a valorii de evaluare în comparație cu caracteristicile populației generale. Motivul apariției erorii sistematice este nerespectarea principiului probabilității egale ca fiecare unitate a populației generale să fie inclusă în eșantion, adică eșantionul este format predominant din „cel mai rău” (sau „cel mai bun”). reprezentanţi ai populaţiei generale. Respectarea principiului egalității de șanse pentru fiecare unitate care urmează să fie inclusă în eșantion ne permite să eliminăm complet acest tip de eroare.

Erori aleatorii - Acestea sunt diferențe care variază de la eșantion la eșantion ca semn și amploare între estimare și caracteristica evaluată a populației. Motivul apariției erorilor aleatorii este jocul de întâmplare atunci când se formează un eșantion care constituie doar o parte a populației generale. Acest tip de eroare este inerent organic în metoda de eșantionare. Este imposibil să le excludem complet; sarcina este de a prezice amploarea lor posibilă și de a le reduce la minimum. Ordinea acțiunilor legate de aceasta rezultă din luarea în considerare a trei tipuri de erori aleatorii: specifice, medii și extreme.

2.2.1 Specific eroarea este eroarea unei probe prelevate. Dacă media pentru acest eșantion () este o estimare pentru media generală (0) și, presupunând că această medie generală ne este cunoscută, atunci diferența = -0 și va fi eroarea specifică a acestui eșantion. Dacă repetăm ​​eșantionul din această populație generală de multe ori, atunci de fiecare dată obținem o nouă valoare pentru o anumită eroare: ... și așa mai departe. În ceea ce privește aceste erori specifice, putem spune următoarele: unele dintre ele vor coincide între ele ca mărime și semn, adică există o distribuție a erorilor, unele dintre ele vor fi egale cu 0, există o coincidență a estimării. și parametrul populației generale;

2.2.2 Eroare medie este pătratul mediu al tuturor erorilor specifice de estimare posibile din întâmplare: , unde este mărimea erorilor specifice în schimbare; frecvența (probabilitatea) de apariție a unei anumite erori. Eroarea medie de eșantionare arată cât de multă eroare, în medie, poate fi făcută dacă se face o judecată cu privire la un parametru al populației pe baza estimării. Formula de mai sus relevă conținutul erorii medii, dar nu poate fi folosită pentru calcule practice, fie și doar pentru că presupune cunoașterea parametrului populației, ceea ce în sine elimină necesitatea eșantionării.



Calculele practice ale erorii medii de estimare se bazează pe premisa că aceasta (eroarea medie) este în esență abaterea standard a tuturor valorilor de estimare posibile. Această premisă ne permite să obținem algoritmi pentru calcularea erorii medii pe baza datelor dintr-un singur eșantion. În special, eroarea medie a mediei eșantionului poate fi stabilită pe baza următorului raționament. Există un eșantion (,…) format din unități. Pentru eșantion, media eșantionului este definită ca o estimare a mediei generale. Fiecare valoare (,...) sub semnul sumei trebuie considerată ca o variabilă aleatoare independentă, deoarece cu repetarea infinită a eșantionului primul, al doilea etc. unitățile pot prelua oricare dintre valorile prezente în populație. Prin urmare, deoarece, după cum se știe, varianța sumei variabilelor aleatoare independente este egală cu suma varianțelor, atunci . Rezultă că eroarea medie pentru media eșantionului va fi egală și este invers legată de mărimea eșantionului (prin rădăcina pătrată a acestuia) și direct proporțional cu abaterea standard a caracteristicii în populația generală. Acest lucru este logic, deoarece media eșantionului este o estimare consistentă pentru media generală și, pe măsură ce dimensiunea eșantionului crește, valoarea acestuia se apropie de parametrul estimat al populației generale. Dependența directă a erorii medii de variabilitatea unei caracteristici se datorează faptului că, cu cât variabilitatea caracteristicii este mai mare în populația generală, cu atât este mai dificilă construirea unui model adecvat al populației generale pe baza eșantionului. În practică, abaterea standard a unei caracteristici din populație este înlocuită cu estimarea acesteia în eșantion, iar apoi formula de calcul a erorii medii a mediei eșantionului ia forma: ținând cont de părtinirea varianței eșantionului, eșantionul abaterea standard se calculează folosind formula =. Deoarece simbolul n indică dimensiunea eșantionului. , atunci numitorul la calcularea abaterii standard nu ar trebui să folosească dimensiunea eșantionului (n), ci așa-numitul număr de grade de libertate (n-1). Numărul de grade de libertate este înțeles ca numărul de unități dintr-un agregat care poate varia (schimba) în mod liber dacă se determină din agregat vreo caracteristică. În cazul nostru, deoarece se determină media eșantionului, unitățile pot varia liber.

Tabelul 2.2 oferă formule pentru calcularea erorilor medii ale diferitelor estimări ale eșantionului. După cum se poate observa din acest tabel, eroarea medie pentru toate estimările este invers legată de dimensiunea eșantionului și este direct legată de variabilitate. Acest lucru se poate spune și în ceea ce privește eroarea medie a fracției de probă (frecvență). Sub rădăcină se află varianța caracteristicii alternative, stabilită din eșantion ()

Formulele prezentate în tabelul 2.2 se referă la așa-numita selecție aleatorie, repetată, a unităților din eșantion. Cu alte metode de selecție, care vor fi discutate mai jos, formulele vor fi ușor modificate.

Tabelul 2.2

Formule pentru calcularea erorilor medii ale estimărilor eșantionului

2.2.3 Eroare marginală de eșantionare Cunoașterea estimării și a erorii sale medii este în unele cazuri complet insuficientă. De exemplu, atunci când se utilizează hormoni în hrana animalelor, cunoașterea doar a dimensiunii medii a reziduurilor lor nocive necompuse și a erorii medii înseamnă expunerea consumatorilor de produs la un pericol grav. Acest lucru sugerează cu tărie necesitatea de a determina valoarea maximă ( eroare maximă). Când se utilizează metoda de eșantionare, eroarea maximă este stabilită nu sub forma unei anumite valori, ci sub forma unor limite egale.

(intervale) în oricare direcție de la valoarea de evaluare.

Determinarea limitelor erorii maxime se bazează pe caracteristicile distribuției erorilor specifice. Pentru așa-numitele eșantioane mari, al căror număr este mai mare de 30 de unități (), erorile specifice sunt distribuite în conformitate cu legea distribuției normale; cu eșantioane mici () erorile specifice sunt distribuite în conformitate cu legea distribuției Gosset

(Student). În raport cu erorile specifice în media eșantionului, funcția de distribuție normală are forma: , unde este densitatea de probabilitate a apariției anumitor valori, cu condiția ca , unde este media eșantionului; - medie generală, - eroare medie pentru media eșantionului. Deoarece eroarea medie () este o valoare constantă, erorile specifice sunt distribuite în conformitate cu legea normală, exprimată în cote de eroare medie, sau așa-numitele abateri normalizate.

Luând integrala funcției de distribuție normală, putem stabili probabilitatea ca eroarea să fie conținută într-un anumit interval de modificare t și probabilitatea ca eroarea să depășească acest interval (evenimentul opus). De exemplu, probabilitatea ca eroarea să nu depășească jumătate din eroarea medie (în oricare direcție față de media generală) este 0,3829, ca eroarea să fie conținută într-o eroare medie - 0,6827, 2 erori medii -0,9545 și așa mai departe.

Relația dintre nivelul de probabilitate și intervalul de modificare t (și, în ultimă instanță, intervalul de modificare a erorii) ne permite să abordăm determinarea intervalului (sau limitelor) erorii maxime, legând valoarea acesteia de probabilitatea de apariția.Probabilitatea de apariție este probabilitatea ca eroarea să fie într-un anumit interval. Probabilitatea de apariție va fi „încrederea” dacă evenimentul opus (eroarea va fi în afara intervalului) are o astfel de probabilitate de apariție care poate fi neglijată. Prin urmare, nivelul de încredere al probabilității este stabilit, de regulă, la cel puțin 0,90 (probabilitatea evenimentului opus este de 0,10). Cu cât apariția erorilor în afara intervalului stabilit are consecințe mai negative, cu atât ar trebui să fie mai mare nivelul de încredere al probabilității (0,95; 0,99; 0,999 și așa mai departe).

După ce ați ales nivelul de încredere al probabilității din tabelul integralei de probabilitate a distribuției normale, ar trebui să găsiți valoarea corespunzătoare a lui t și apoi folosind expresia = determinați intervalul erorii maxime. Semnificația valorii obținute este următoarea: cu nivelul de încredere acceptat al probabilității, eroarea maximă a mediei eșantionului nu va depăși valoarea .

Pentru a stabili limitele erorii maxime pe baza unor eșantioane mari pentru alte estimări (varianță, abatere standard, proporție și așa mai departe), se utilizează abordarea discutată mai sus, ținând cont de faptul că se folosește un alt algoritm pentru determinarea mediei eroare pentru fiecare estimare.

În ceea ce privește eșantioanele mici (), după cum sa menționat deja, distribuția erorilor de estimare în acest caz corespunde distribuției t - Student. Particularitatea acestei distribuții este că, ca parametru în ea, alături de eroare, există dimensiunea eșantionului, sau mai degrabă nu dimensiunea eșantionului, ci numărul de grade de libertate.Pe măsură ce dimensiunea eșantionului crește, distribuția t-Student se apropie de normal, iar la aceste distribuții practic coincid. Comparând valorile valorii t-Student și ale distribuției t-normale la același nivel de încredere, putem spune că valoarea t-Student este întotdeauna mai mare decât distribuția t-normală, iar diferențele cresc odată cu scăderea dimensiunea eșantionului și cu o creștere a nivelului de încredere al probabilității. În consecință, atunci când se utilizează eșantioane mici, în comparație cu eșantioanele mari, există limite mai largi ale erorii maxime, iar aceste limite se extind cu o scădere a dimensiunii eșantionului și o creștere a nivelului de încredere al probabilității.


Închide