Scopul principal al regresiei multiple este de a construi un model cu un număr mare de factori și, în același timp, de a determina influența fiecăruia dintre factori separat asupra rezultatului, precum și de a determina efectul cumulativ al factorilor asupra indicatorului modelat.

Specificarea unui model de regresie multiplă include selecția unui factor și alegerea tipului de funcție matematică (selectarea tipului de ecuație de regresie). Factorii incluși în regresia multiplă ar trebui să fie măsurabili cantitativ și să nu fie intercorelați, și cu atât mai mult să fie într-o relație funcțională exactă (adică, ar trebui să se influențeze reciproc într-o măsură mai mică și într-o măsură mai mare asupra atributului rezultat) .

Factorii incluși în regresia multiplă ar trebui să explice variația variabilei independente. De exemplu, dacă un model este construit cu un set de - factori, atunci pentru acesta se găsește valoarea indicatorului de determinare, care fixează ponderea variației explicate a atributului efectiv datorată - factorilor.

Influența altor factori necontabilizați în model este estimată ca varianță reziduală corespunzătoare.

Când un factor suplimentar este inclus în model, valoarea indicelui de determinare ar trebui să crească, iar valoarea varianței reziduale ar trebui să scadă. Dacă acest lucru nu se întâmplă, atunci factorul suplimentar nu îmbunătățește modelul și este practic redundant, iar introducerea unui astfel de factor poate duce la nesemnificația statistică a parametrilor de regresie conform testului t al lui Student.

Selectarea factorilor pentru regresia multiplă se realizează în două etape:

1. Factorii sunt selectați în funcție de esența problemei.

2. Pe baza matricei indicatorilor de corelare se determină statistici pentru parametrii de regresie.

Coeficienții de corelație între variabilele explicative, care sunt numiți și coeficienți de intercorelație, vă permit să excludeți factorii duplicați din model.

Două variabile și se spune că sunt explicit coliniare dacă coeficientul de corelație este .

Dacă variabilele sunt clar coliniare, atunci ele sunt într-o relație liniară puternică.



În prezența unor variabile clar coliniare, se preferă nu factorul care este mai strâns legat de rezultat, ci factorul care, în același timp, are cea mai puțin strânsă relație cu alți factori.

În funcție de mărimea coeficienților de corelație de pereche, se constată doar colegiiaritatea explicită a factorilor.

Atunci când se utilizează regresia multiplă, poate apărea multicolenialitatea faptelor, de ex. mai mult de doi factori sunt legați liniar. În astfel de cazuri, MCO devine mai puțin fiabilă atunci când se evaluează factorii individuali, rezultând dificultăți în interpretarea parametrilor regresiei multiple ca caracteristici ale acțiunii unui factor în forma sa pură. Parametrii de regresie liniară își pierd semnificația economică, estimările parametrilor sunt nesigure, apar erori standard mari, care, în acest caz, se pot schimba odată cu modificarea volumului de observații, adică. modelul devine impropriu pentru analiza şi prognoza situaţiei economice. Următoarele metode sunt utilizate pentru a evalua multicolenialitatea unui factor:

1. Determinarea matricei de coeficienți de corelație perechi între factori, de exemplu, dacă este dat un model de regresie multiplă liniară, atunci determinantul matricei de coeficienți perechi va lua forma:

Dacă valoarea acestui determinant este 1

,

atunci factorii sunt necoliniari între ei.

Dacă există o relație liniară completă între factori, atunci toți coeficienții de corelație de pereche sunt egali cu 1, rezultând în

.

2. Metoda de testare a ipotezei independenţei variabilelor. În acest caz, la ipoteza nulă, se demonstrează că valoarea are o distribuţie aproximativă cu numărul de grade de libertate .

Dacă , atunci ipoteza nulă este respinsă.

Prin determinarea și compararea coeficienților de determinare multiplă a unui factor, utilizând succesiv fiecare dintre factori ca variabilă dependentă, este posibil să se determine factorii responsabili de multicolenialitate, i.e. factorul cu cea mai mare valoare de .

Există următoarele moduri de a depăși o corelație puternică încrucișată:

1) excluderea din model a uneia sau mai multor date;

2) transformarea factorilor pentru reducerea corelației;

3) combinație a ecuației de regresie, care va reflecta nu numai factorii, ci și interacțiunea acestora;

4) tranziția ecuației formei reduse etc.

La construirea unei ecuații de regresie multiplă, una dintre cele mai importante etape este selecția factorilor incluși în model. Diverse abordări ale selecției factorilor pe baza indicatorilor de corelare cu diverse metode, dintre care cele mai aplicabile sunt:

1) Metoda de excludere - datele sunt filtrate;

2) Metoda includerii - se introduce un factor suplimentar;

3) Analiza de regresie în trepte - eliminați factorul introdus anterior.

La selectarea factorilor se folosește următoarea regulă: numărul de factori incluși este de obicei de 6-7 ori mai mic decât volumul populației pe care este construit modelul.

Parametrul nu este supus interpretării economice. În modelul de putere, ecuația neliniară a regresiei multiple, coeficienții , ,…, sunt coeficienți de elasticitate care arată cât de mult se va schimba, în medie, rezultatul când factorul corespunzător se modifică cu 1%, influența altor factori rămânând neschimbată. .

În funcție de numărul de factori incluși în ecuația de regresie, se obișnuiește să se facă distincția între regresia simplă (pereche) și regresia multiplă. .

Regresia perechilor- regresie între două variabile yȘi X, adică vezi modelul

Unde y- variabila dependenta (semnul rezultat);

X- variabilă independentă, explicativă (factor-semn).

Specificarea modelului - formularea tipului de model, bazată pe teoria relevantă a relației dintre variabile. Orice studiu econometric începe cu specificarea unui model.

Cu alte cuvinte, studiul începe cu o teorie care stabilește o legătură între fenomene.

În primul rând, din cercul factorilor care influențează caracteristica eficientă, este necesar să se evidențieze factorii care influențează cel mai semnificativ.

Regresia în perechi este suficientă dacă există un factor dominant care este utilizat ca variabilă explicativă.

În ecuația de regresie, relația esențială de corelație a caracteristicilor este reprezentată ca o relație funcțională exprimată prin funcția matematică corespunzătoare

unde yj este valoarea reală a caracteristicii efective;

y xj --valoarea teoretică a caracteristicii efective.

O variabilă aleatoare care caracterizează abaterile valorii reale a atributului rezultat față de cea teoretică.

Valoare aleatoare e numită și perturbare. Include influența factorilor care nu sunt luați în considerare în model, erori aleatorii și caracteristici de măsurare.

Cantitatea de erori aleatoare depinde de specificația corect aleasă a modelului: cu atât sunt mai mici, cu atât valorile teoretice ale caracteristicii rezultate se potrivesc cu datele reale. la.

Erorile de specificare includ alegerea greșită a uneia sau altei funcții matematice și subestimarea oricărui factor semnificativ în ecuația de regresie, adică utilizarea regresiei perechi în loc de multiplu.

Alături de erorile de specificație, există și o eroare de eșantionare - cercetătorul se ocupă cel mai adesea de datele eșantionului atunci când stabilește o relație regulată între caracteristici. Erorile de măsurare practic anulează toate eforturile de a cuantifica relația dintre caracteristici.

Accentul cercetării econometrice este pe erorile de specificare a modelului. În regresia perechilor, alegerea tipului de funcție matematică poate fi efectuată în trei moduri: grafic; analitic(pe baza teoriei relaţiei studiate) şi experimental.

Grafic metoda se bazează pe câmpul de corelare. Analitic metoda se bazează pe studiul naturii materiale a legăturii trăsăturilor studiate. Experimental metoda se realizează prin compararea valorii varianţei reziduale D ost calculat pentru diferite modele. Dacă valorile reale ale atributului rezultat coincid cu cele teoretice, atunci D ocm =0. Dacă există abateri ale datelor reale de la cele teoretice, atunci

Cu cât varianța reziduală este mai mică, cu atât ecuația de regresie se potrivește mai bine cu datele originale.

Dacă variația reziduală se dovedește a fi aproximativ aceeași pentru mai multe funcții, atunci în practică sunt preferate tipuri mai simple de funcții, deoarece sunt mai susceptibile de interpretare și necesită mai puțină observație. Numărul de observații ar trebui să fie de 6-7 ori mai mare decât numărul de parametri calculați pentru variabila x.

Subiectul și metoda econometriei.

Econometria este o știință care oferă o expresie cantitativă a interacțiunilor fenomenelor și proceselor economice.

Econometria este orice aplicare a matematicii sau a metodelor statistice pentru studiul fenomenelor economice.

Econometria este știința modelării fenomenelor economice, care face posibilă explicarea și prezicerea dezvoltării acestora, identificarea și măsurarea factorilor determinanți.

A apărut ca rezultat al fuziunii statisticii, teoriei economice și metodelor matematice.

Subiectul econometriei îl reprezintă fenomenele economice.

Sarcinile econometriei:

1. Construirea de modele econometrice convenabile pentru analiză (specificare)

2. Estimarea parametrilor care fac ca modelul selectat să fie adecvat datelor reale (parametrizare)

3. Verificarea calității parametrilor găsiți și a modelului în sine în ansamblu (verificare)

4. Utilizarea modelelor construite pentru explicarea indicatorilor econometrici studiați, prognozarea acestora (prognoza și interpretarea)

Instrumente metodologice:

1.metode de analiză de regresie matematică și statistică

2. analiza seriilor temporale

3. rezolvarea sistemelor de ecuaţii simultane

4. testarea ipotezelor statistice

5. Metode de rezolvare a problemelor de specificare şi identificare a modelelor

6. metode statistice multivariate

Specificația modelului de regresie pereche

Regresia perechilor este o ecuație care descrie corelația dintre o pereche de variabile: variabila dependentă y (rezultat) și variabila independentă x (factor). y=f(x)

Funcția poate fi liniară sau neliniară.

Orice studiu econometric începe cu specificarea modelului, adică. formularea tipului de model, pe baza teoriei relevante și a relației dintre variabile.

În fiecare caz individual, valoarea lui y se obține din 2 termeni: , unde

Yj este valoarea reală a rezultatului, este valoarea teoretică a rezultatului găsită din funcția corespunzătoare a lui y și x, Ej este o variabilă aleatoare caracterizată prin abaterea valorilor reale și calculate ale rezultatului y.

Prezența unei variabile aleatoare în model este asociată cu: specificarea modelului, natura selectivă a datelor inițiale și caracteristicile măsurării variabilelor.

3. Regresie liniară și corelație.

Regresia liniară este o ecuație care descrie corelația dintre o pereche de variabile: variabila dependentă „y” (rezultat) și variabila independentă „x” (factor). y=f(x) Funcția poate fi liniară sau neliniară. Orice studiu econometric începe cu specificarea modelului, adică. tipul de model se formează pe baza teoriei corespunzătoare și a relației dintre variabile. În fiecare caz individual, valoarea lui „y” se obține din 2 termeni yj \u003d yxj (cu o pălărie) + Ej, unde yj este valoarea reală a rezultatului; yxj (cu o pălărie) este valoarea teoretică a rezultat; Ej este o valoare aleatorie. Prezența unei variabile aleatoare în model este asociată cu: 1. Specificarea modelului 2. Caracterul selectiv al datelor inițiale 3. Caracteristicile măsurării variabilelor Regresia în perechi care descrie o relație liniară poate fi reprezentată după cum urmează. forma: Yi=α+βxi+E , i= 1,2,3…N, unde yi este a i-a valoare a variabilei dependente; α și β sunt parametrii generali ai regresiei liniare pereche; N este volumul setului de gene. Regresia practică este construită pe baza datelor eșantionului și este scrisă ca: yi= a+bxi+Ei, i=1,2…n (n-Volum; a și b sunt parametrii eșantionului ai regresiei genelor pereche a probei). Estimarea parametrilor a și b este posibilă folosind metoda celor mai mici pătrate (LSM) Cu ajutorul căreia se construiește un sistem de ecuații liniare pentru a găsi a și b.



B - keff. regresie, arată modificarea medie a rezultatului cu o modificare a factorului cu 1 unitate. semnul coeficientului. b arată direcția conexiunii, dacă b>0, atunci conexiunea este directă, dacă b<0 , то обратная

A este un membru liber al regresiei, aceasta este valoarea tăieturii la x = 0. Acest parametru nu are conținut economic, este posibil să se caracterizeze doar semnul din fața parametrului, dacă a>0, atunci modificarea relativă a rezultatului este mai lentă decât modificarea factorului, dacă a<0 , то происходит опережение в изменении рез-та над изменением фактора. Уравнение регрессии всегда дополняется показателями тесноты связи в качестве, которого выступает линейный коэфф. корреляции Ϥyx.

Ϥyx= xy(medie)– x(medie)*y(medie) / Ǫx*Ǫy Ǫx= rădăcina lui ∑(x-xav)^2/n Ǫy= rădăcina lui ∑(y-av)^2/n



Coeficient liniar. corelația este în -1<=Ϥxy>=1, pentru b>0 0<=Ϥxy>=1; la b<0 -1<=Ϥxy>=0 Pentru a evalua calitatea unei funcții liniare, se calculează coeficientul. determinări (D) . D= Ϥ 2 xy. După ce se găsește ecuația de regresie liniară, se evaluează semnificația ecuației în ansamblu și în parametrii individuali. Pentru a evalua ur-ya și regresia, trebuie să utilizați testul T al lui Fisher: F \u003d (r 2 / 1- r 2) * (n-2). Valoarea calculată este comparată cu valoarea tabelului la nivelul de semnificație α= 0,05. Dacă Fcalc> Ftabl, atunci ecuația de regresie este recunoscută ca fiind semnificativă. De asemenea, în regresia liniară, se evaluează nu numai semnificația modelului în ansamblu, ci și parametrii individuali ai acestuia. În acest scop, se determină eroarea standard a parametrilor ma și mb

Mb= (∑(y-y cu o pălărie)^2/n-2) / ∑(x-xav)^2

Ma = rădăcina lui S^2*∑X^2/N∑(X-XCP)^2 ; t = a/ ma corelația este verificată pe baza mărimii erorii sale: mr=rădăcina lui 1-r^2/n-2 Valoarea reală a testului t al lui Student: tr=Ϥ/ rădăcina lui 1-Ϥ 2 * rădăcina lui n-2 Model parametrii vor fi semnificativi dacă tcalc >ttable, iar în caz contrar nu este permis să se studieze.

Curs 4. Regresia neliniară

Probleme luate în considerare

1. Specificația modelului

2. Clasificarea funcţiilor neliniare

3. Tipuri separate de regresii neliniare:

3.1. parabolă;

3.2. hiperbola echilaterală;

3.3. functie de putere.

4. Coeficienții de elasticitate în regresiile neliniare.

5. Corelație pentru regresia neliniară.

Specificația modelului

Econometria ca sistem de metode specifice a început să se dezvolte odată cu realizarea sarcinii sale principale - de a reflecta relațiile variabilelor economice. Multe procese economice sunt cel mai bine descrise prin relații neliniare, cum ar fi funcțiile cererii și funcțiile de producție. În acest scop, variabilele au început să fie incluse în ecuația de regresie nu numai în primul, ci și în al doilea grad - pentru a reflecta proprietățile optimității variabilelor economice, adică prezența valorilor la care se realizează impactul minim sau maxim asupra variabilei dependente. Acesta este, de exemplu, efectul aplicării de îngrășăminte asupra randamentelor culturilor (până la un anumit nivel, saturația solului cu îngrășăminte contribuie la creșterea randamentelor, iar când se atinge nivelul optim de saturație, creșterea sa în continuare poate duce la o scădere a randamentelor). Același lucru se poate spune și despre efectele multor variabile socioeconomice, precum efectul veniturilor asupra consumului anumitor alimente. În condițiile unui eșantion de date specific, neliniaritatea influenței variabilelor poate să nu fie confirmată dacă aceste date variază în limite înguste, adică sunt omogene.

Presupunând că erorile de măsurare ale variabilelor sunt menținute la minimum, se concentrează cercetările econometrice erori de specificație model, adică erori cauzate de o formă incorectă a ecuației de regresie.

În regresia perechilor, alegerea tipului de funcție matematică care modelează relația dintre variabile poate fi efectuată prin trei metode:

1) grafic;

2) analitic, adică bazat pe teoria relaţiei studiate;

3) experimental.

Când studiem relația dintre două caracteristici, cea mai evidentă este metoda grafică de selectare a unei ecuații. Se bazează pe construcția câmpului de corelație. Principalele tipuri de curbe utilizate în evaluarea cantitativă a relațiilor sunt prezentate pe diapozitiv (Fig. 4.1).

Clasa de funcții matematice pentru descrierea relației dintre două variabile este destul de largă. Pe lângă cele indicate, se folosesc și alte tipuri de curbe.

De interes considerabil este metoda analitica selectarea tipului de ecuație de regresie. Se bazează pe studiul naturii materiale a relației dintre variabilele studiate. Să studiem, de exemplu, nevoia de energie electrică a unei întreprinderi la in functie de volumul produselor X. Tot consumul de energie electrică poate fi împărțit în două părți:

1) nu are legătură cu producția de produse (a);

2) direct legat de volumul de ieșire, crescând proporțional cu o creștere a producției (v * x) - slide.

Apoi, dependența consumului de energie electrică de volumul producției poate fi exprimată printr-o ecuație de regresie de forma

y \u003d a + in. 4.1.

Dacă împărțim apoi ambele părți ale ecuației la valoarea volumului de ieșire (x), atunci obținem expresia dependenței consumului specific de energie pe unitatea de ieșire z = y / x de volumul de ieșire (x ) sub forma unei ecuații de hiperbolă echilaterală

z = în + a/x. 4.2.

În mod similar, costurile curente de producție ale unei întreprinderi pot fi împărțite în fixe condiționat și variabile condiționat, iar apoi dependența costului unitar de producție de volumele de producție este, de asemenea, caracterizată printr-o hiperbolă echilaterală.

Selectarea tipului de ecuație de regresie metoda experimentala efectuată de obicei la procesarea informațiilor pe un computer prin compararea varianței reziduale calculate cu diferite modele. Cu cât valoarea varianței reziduale este mai mică, cu atât se observă mai puțină influență a altor factori neluați în considerare în ecuația de regresie, cu atât ecuația de regresie se potrivește mai bine cu datele originale.

Regresia perechilor poate da un rezultat bun în modelare dacă influența altor factori care afectează obiectul de studiu poate fi neglijată. Dacă această influență nu poate fi neglijată, atunci în acest caz ar trebui să se încerce să dezvăluie influența altor factori prin introducerea lor în model, de exemplu. construiți o ecuație de regresie multiplă

unde - variabilă dependentă (semnul rezultat), - variabile independente sau explicative (semne-factori).

Regresia multiplă este utilizată pe scară largă în rezolvarea problemelor legate de cerere, randamentul stocurilor, în studierea funcției costurilor de producție, în calculele macroeconomice și în alte probleme de econometrie. În prezent, regresia multiplă este una dintre cele mai comune metode în econometrie. Scopul principal al regresiei multiple este de a construi un model cu un număr mare de factori, determinând în același timp influența fiecăruia dintre ei în mod individual, precum și impactul lor cumulativ asupra indicatorului modelat.

Specificația modelului. Selectarea factorilor la construirea unei ecuații de regresie multiplă

Construcția unei ecuații de regresie multiplă începe cu o decizie asupra specificației modelului. Include două seturi de întrebări: selecția factorilor și alegerea tipului de ecuație de regresie.

Includerea unuia sau altuia de factori în ecuația de regresie multiplă este asociată în primul rând cu ideea cercetătorului despre natura relației dintre indicatorul modelat și alte fenomene economice. Factorii incluși în regresia multiplă trebuie să îndeplinească următoarele cerințe.

  • 1. Ele trebuie să fie cuantificabile. Dacă este necesar să se includă în model un factor calitativ care nu are o măsurare cantitativă, atunci trebuie să i se acorde certitudine cantitativă.
  • 2. Factorii nu ar trebui să fie intercorelați și cu atât mai mult să fie într-o relație funcțională exactă.

Includerea factorilor cu intercorelație ridicată în model poate duce la consecințe nedorite - sistemul ecuații normale se poate dovedi a fi necondiționat și poate duce la instabilitate și nefiabilitate a estimărilor coeficienților de regresie.

Dacă există o corelație mare între factori, atunci este imposibil să se determine influența izolată a acestora asupra indicatorului de performanță, iar parametrii ecuației de regresie se dovedesc a fi neinterpretabili.

Factorii incluși în regresia multiplă ar trebui să explice variația variabilei independente. Dacă un model este construit cu un set de factori, atunci pentru acesta se calculează indicatorul de determinare, care fixează ponderea variației explicate a atributului rezultat datorită factorilor luați în considerare în regresie. Influența altor factori neluați în considerare în model este estimată ca și în cazul varianței reziduale corespunzătoare.

Odată cu includerea suplimentară a unui factor în regresie, coeficientul de determinare ar trebui să crească, iar varianța reziduală ar trebui să scadă:

Dacă acest lucru nu se întâmplă și acești indicatori practic nu diferă unul de celălalt, atunci factorul inclus în analiză nu îmbunătățește modelul și este practic un factor suplimentar.

Saturarea modelului cu factori inutili nu numai că nu reduce valoarea varianței reziduale și nu crește indicele de determinare, dar duce și la nesemnificația statistică a parametrilor de regresie conform testului t Student.

Astfel, deși teoretic modelul de regresie vă permite să luați în considerare orice număr de factori, în practică acest lucru nu este necesar. Selecția factorilor se bazează pe o analiză calitativă teoretică și economică. Cu toate acestea, analiza teoretică nu permite adesea un răspuns clar la întrebarea relației cantitative dintre caracteristicile luate în considerare și oportunitatea includerii factorului în model. Prin urmare, selecția factorilor se realizează de obicei în două etape: în prima etapă, factorii sunt selectați pe baza esenței problemei; pe al doilea - pe baza matricei indicatorilor de corelare determinați statisticile pentru parametrii de regresie.

Coeficienții de intercorelație (adică, corelațiile între variabilele explicative) fac posibilă eliminarea factorilor duplicatori din model. Se presupune că două variabile sunt clar coliniare, adică. sunt într-o relație liniară între ele. Dacă factorii sunt clar coliniari, atunci se dublează unul pe altul și se recomandă excluderea unuia dintre ei din regresie. În acest caz, se preferă nu factorul care este mai strâns legat de rezultat, ci factorul care, având o legătură suficient de strânsă cu rezultatul, are cea mai mică strânsă legătură cu alți factori. Această cerință relevă specificul regresiei multiple ca metodă de studiere a impactului complex al factorilor în condițiile independenței lor unul față de celălalt.

Mărimea coeficienților de corelație de pereche relevă doar o coliniaritate clară a factorilor. Cele mai mari dificultăți în utilizarea aparatului de regresie multiplă apar în prezența multicoliniarității factorilor, atunci când mai mult de doi factori sunt interconectați printr-o relație liniară, i.e. există un efect cumulativ al factorilor unul asupra celuilalt. Prezența multicoliniarității factorilor poate însemna că unii factori vor acționa întotdeauna la unison. Ca urmare, variația datelor originale nu mai este complet independentă și este imposibil să se evalueze separat impactul fiecărui factor.

Includerea factorilor multicoliniari în model este nedorită din cauza următoarelor consecințe:

  • 1. Este dificil de interpretat parametrii regresiei multiple ca caracteristici ale acțiunii factorilor într-o formă „pură”, deoarece factorii sunt corelați; parametrii de regresie liniară își pierd sensul economic.
  • 2. Estimările parametrilor sunt nesigure, prezintă erori standard mari și se modifică odată cu o modificare a volumului de observații (nu numai în mărime, ci și în semn), ceea ce face ca modelul să nu fie adecvat pentru analiză și prognoză.

Pentru a evalua multicoliniaritatea factorilor, se poate folosi determinantul matricei coeficienților de corelație perechi între factori.

Dacă factorii nu s-au corelat între ei, atunci matricea coeficienților de corelație perechi dintre factori ar fi o matrice de identitate, deoarece toate elementele în afara diagonalei ar fi egale cu zero. Deci, pentru o ecuație care include trei variabile explicative

matricea coeficienților de corelație între factori ar avea un determinant egal cu unu:

Dacă, dimpotrivă, există o dependență liniară completă între factori și toți coeficienții de corelație sunt egali cu unu, atunci determinantul unei astfel de matrice este egal cu zero:

Cu cât determinantul matricei de corelație interfactorială este mai aproape de zero, cu atât multicoliniaritatea factorilor este mai puternică și rezultatele regresiei multiple sunt mai nesigure. În schimb, cu cât determinantul matricei de corelație interfactorială este mai aproape de unul, cu atât multicoliniaritatea factorilor este mai mică.

Există o serie de abordări pentru a depăși corelațiile puternice între factori încrucișați. Cel mai simplu mod de a elimina multicolinearitatea este eliminarea unuia sau mai multor factori din model. O altă abordare este asociată cu transformarea factorilor, ceea ce reduce corelația dintre ei.

Una dintre modalitățile de a lua în considerare corelația internă a factorilor este trecerea la ecuațiile de regresie combinate, adică. la ecuații care reflectă nu numai influența factorilor, ci și interacțiunea acestora. Deci, dacă, atunci este posibil să construim următoarea ecuație combinată:

Ecuația luată în considerare include o interacțiune de ordinul întâi (interacțiunea a doi factori). Este posibilă includerea interacțiunilor de ordin superior în model dacă semnificația lor statistică este dovedită conform criteriului Fisher, dar, de regulă, interacțiunile de ordinul trei și superior se dovedesc a fi nesemnificative statistic.

Selecția factorilor incluși în regresie este una dintre cele mai importante etape în utilizarea practică a metodelor de regresie. Abordările ale selecției factorilor pe baza indicatorilor de corelație pot fi diferite. Acestea conduc la construirea ecuației de regresie multiplă, respectiv, la diferite metode. În funcție de metoda de construire a ecuației de regresie adoptată, se modifică algoritmul de rezolvare a acesteia pe calculator.

Cele mai utilizate sunt următoarele metode pentru construirea unei ecuații de regresie multiplă:

  • 1. Metoda eliminării - eliminarea factorilor din setul său complet.
  • 2. Metoda de includere - introducerea suplimentară a factorului.
  • 3. Analiza de regresie în trepte - excluderea unui factor introdus anterior.

La selectarea factorilor se recomandă, de asemenea, să se folosească următoarea regulă: numărul de factori incluși este de obicei de 6-7 ori mai mic decât volumul populației pe care se construiește regresia. Dacă această relație este încălcată, atunci numărul de grade de libertate al dispersiei reziduale este foarte mic. Acest lucru duce la faptul că parametrii ecuației de regresie se dovedesc a fi nesemnificativi statistic, iar criteriul - este mai mic decât valoarea tabelară.


închide