Metoda celor mai mici pătrate integrale. Aproximarea datelor experimentale. Metoda celor mai mici pătrate. Câteva cazuri speciale de utilizare a LSM în practică

Aproximarea datelor experimentale este o metodă bazată pe înlocuirea datelor obținute experimental cu o funcție analitică care trece cel mai aproape sau coincide în punctele nodale cu valorile originale (date obținute în timpul unui experiment sau experiment). În prezent, există două moduri de a defini o funcție analitică:

Prin construirea unui polinom de interpolare de n grade care trece direct prin toate punctele o matrice de date dată. În acest caz, funcția de aproximare este prezentată sub forma: un polinom de interpolare în formă Lagrange sau un polinom de interpolare în formă Newton.

Construind un polinom de aproximare de n grade care trece în imediata apropiere a punctelor dintr-o matrice de date dată. Astfel, funcția de aproximare netezește toate zgomotele aleatorii (sau erorile) care pot apărea în timpul experimentului: valorile măsurate în timpul experimentului depind de factori aleatori care fluctuează în funcție de propriile legi aleatorii (erori de măsurare sau instrumente, inexactitate sau experimentale). erori). În acest caz, funcția de aproximare este determinată folosind metoda cele mai mici pătrate.

Metoda celor mai mici pătrate(în literatura de limba engleză Ordinary Least Squares, MCO) este o metodă matematică bazată pe determinarea funcției de aproximare, care este construită în cea mai apropiată proximitate de puncte dintr-o serie dată de date experimentale. Apropierea funcțiilor originale și de aproximare F(x) este determinată de o măsură numerică și anume: suma abaterilor pătrate ale datelor experimentale de la curba de aproximare F(x) ar trebui să fie cea mai mică.

Curba de aproximare construită folosind metoda celor mai mici pătrate

Se folosește metoda celor mai mici pătrate:

Să rezolve sisteme de ecuații supradeterminate când numărul de ecuații depășește numărul de necunoscute;

Pentru a găsi o soluție în cazul sistemelor de ecuații neliniare obișnuite (nu supradeterminate);

Pentru a aproxima valorile punctuale cu o funcție de aproximare.

Funcția de aproximare folosind metoda celor mai mici pătrate este determinată din condiția sumei minime a abaterilor pătrate ale funcției de aproximare calculată dintr-o serie dată de date experimentale. Acest criteriu al metodei celor mai mici pătrate se scrie ca următoarea expresie:

Valorile funcției de aproximare calculate la punctele nodale,

O serie dată de date experimentale în puncte nodale.

Criteriul pătratic are o serie de proprietăți „bune”, cum ar fi diferențiabilitatea, oferind o soluție unică la problema de aproximare cu funcții de aproximare polinomială.

În funcție de condițiile problemei, funcția de aproximare este un polinom de gradul m

Gradul funcției de aproximare nu depinde de numărul de puncte nodale, dar dimensiunea acesteia trebuie să fie întotdeauna mai mică decât dimensiunea (numărul de puncte) unui tablou de date experimentale dat.

∙ Dacă gradul funcției de aproximare este m=1, atunci aproximăm funcția tabulară cu o dreaptă (regresie liniară).

∙ Dacă gradul funcției de aproximare este m=2, atunci aproximăm funcția tabelă cu o parabolă pătratică (aproximare pătratică).

∙ Dacă gradul funcției de aproximare este m=3, atunci aproximăm funcția tabelă cu o parabolă cubică (aproximație cubică).

În cazul general, când este necesar să se construiască un polinom aproximativ de gradul m pentru dat valorile tabelului, condiția pentru suma minimă a abaterilor pătrate asupra tuturor punctelor nodale este rescrisă în următoarea formă:

- coeficienți necunoscuți ai polinomului de aproximare de gradul m;

Numărul de valori din tabel specificat.

O condiție necesară pentru existența unui minim al unei funcții este egalitatea cu zero a derivatelor sale parțiale în raport cu variabilele necunoscute. . Ca rezultat, obținem următorul sistem de ecuații:

Să transformăm rezultatul sistem liniar ecuații: deschideți parantezele și mutați termenii liberi în partea dreaptă a expresiei. Ca urmare, sistemul rezultat de expresii algebrice liniare va fi scris în următoarea formă:

Acest sistem expresiile algebrice liniare pot fi rescrise sub formă de matrice:

Ca urmare, s-a obţinut un sistem de ecuaţii liniare de dimensiunea m+1, care constă din m+1 necunoscute. Acest sistem poate fi rezolvat folosind orice metodă de rezolvare a ecuațiilor algebrice liniare (de exemplu, metoda Gauss). Ca rezultat al soluției, se vor găsi parametri necunoscuți ai funcției de aproximare care furnizează suma minimă a abaterilor pătrate ale funcției de aproximare de la datele originale, adică. cea mai bună aproximare pătratică posibilă. Trebuie amintit că, dacă chiar și o valoare a datelor sursă se modifică, toți coeficienții își vor schimba valorile, deoarece sunt complet determinați de datele sursă.

Aproximarea datelor sursă prin dependență liniară

(regresie liniară)

Ca exemplu, să luăm în considerare tehnica de determinare a funcției de aproximare, care este specificată sub forma unei dependențe liniare. În conformitate cu metoda celor mai mici pătrate, condiția pentru minimul sumei abaterilor pătrate este scrisă în următoarea formă:

Coordonatele nodurilor de tabel;

Coeficienți necunoscuți ai funcției de aproximare, care este specificat ca o dependență liniară.

O condiție necesară pentru existența unui minim al unei funcții este egalitatea la zero a derivatelor sale parțiale în raport cu variabilele necunoscute. Ca rezultat, obținem următorul sistem de ecuații:

Să transformăm sistemul liniar de ecuații rezultat.

Rezolvăm sistemul rezultat de ecuații liniare. Coeficienții funcției de aproximare în formă analitică se determină după cum urmează (metoda lui Cramer):

Acești coeficienți asigură construirea unei funcții liniare de aproximare în conformitate cu criteriul minimizării sumei pătratelor funcției de aproximare din valorile tabelare date (date experimentale).

Algoritm pentru implementarea metodei celor mai mici pătrate

1. Date inițiale:

Este specificată o serie de date experimentale cu numărul de măsurători N

Se precizează gradul polinomului de aproximare (m).

2. Algoritm de calcul:

2.1. Coeficienții sunt determinați pentru construirea unui sistem de ecuații cu dimensiuni

Coeficienții sistemului de ecuații (partea stângă a ecuației)

- indicele numărului coloanei matricei pătrate a sistemului de ecuații

Termeni liberi ai unui sistem de ecuații liniare (partea dreaptă a ecuației)

- indicele numărului de rând al matricei pătrate a sistemului de ecuații

2.2. Formarea unui sistem de ecuații liniare cu dimensiunea .

2.3. Rezolvarea unui sistem de ecuații liniare pentru a determina coeficienții necunoscuți ai unui polinom de aproximare de gradul m.

2.4 Determinarea sumei abaterilor pătrate ale polinomului de aproximare de la valorile originale la toate punctele nodale.

Valoarea găsită a sumei abaterilor pătrate este minimul posibil.

Aproximare folosind alte funcții

Trebuie remarcat faptul că atunci când se aproximează datele originale în conformitate cu metoda celor mai mici pătrate, funcția logaritmică, funcția exponențială și funcția de putere sunt uneori folosite ca funcție de aproximare.

Aproximație logaritmică

Să luăm în considerare cazul în care funcția de aproximare este dată de o funcție logaritmică de forma:

Exemplu.

Date experimentale despre valorile variabilelor XŞi la sunt date în tabel.

Ca urmare a alinierii lor, se obține funcția

Folosind metoda celor mai mici pătrate, aproximați aceste date printr-o dependență liniară y=ax+b(găsiți parametri OŞi b). Aflați care dintre cele două linii (în sensul metodei celor mai mici pătrate) aliniază mai bine datele experimentale. Faceți un desen.

Esența metodei celor mai mici pătrate (LSM).

Sarcina este de a găsi coeficienții de dependență liniară la care funcția a două variabile OŞi b ia cea mai mică valoare. Adică dat OŞi b suma abaterilor pătrate a datelor experimentale de la linia dreaptă găsită va fi cea mai mică. Acesta este punctul întreg al metodei celor mai mici pătrate.

Astfel, rezolvarea exemplului se reduce la găsirea extremului unei funcții a două variabile.

Derivarea formulelor pentru găsirea coeficienților.

Se compilează și se rezolvă un sistem de două ecuații cu două necunoscute. Găsirea derivatelor parțiale ale unei funcții în raport cu variabile OŞi b, echivalăm aceste derivate cu zero.

Rezolvăm sistemul de ecuații rezultat folosind orice metodă (de exemplu prin metoda substitutiei sau ) și obțineți formule pentru găsirea coeficienților folosind metoda celor mai mici pătrate (LSM).

Dat OŞi b funcţie ia cea mai mică valoare. Dovada acestui fapt este dată.

Aceasta este întreaga metodă a celor mai mici pătrate. Formula pentru găsirea parametrului o conține sumele , , și parametrul n- cantitatea de date experimentale. Vă recomandăm să calculați separat valorile acestor sume. Coeficient b găsit după calcul o.

Este timpul să ne amintim de exemplul original.

Soluţie.

În exemplul nostru n=5. Completam tabelul pentru comoditatea calculării sumelor care sunt incluse în formulele coeficienților necesari.

Valorile din al patrulea rând al tabelului se obțin prin înmulțirea valorilor celui de-al 2-lea rând cu valorile celui de-al 3-lea rând pentru fiecare număr i.

Valorile din al cincilea rând al tabelului se obțin prin pătrarea valorilor din al doilea rând pentru fiecare număr i.

Valorile din ultima coloană a tabelului sunt sumele valorilor de pe rânduri.

Folosim formulele metodei celor mai mici pătrate pentru a găsi coeficienții OŞi b. Înlocuim valorile corespunzătoare din ultima coloană a tabelului în ele:

Prin urmare, y = 0,165x+2,184- linia dreaptă de aproximare dorită.

Rămâne să aflăm care dintre rânduri y = 0,165x+2,184 sau aproximează mai bine datele originale, adică estimează folosind metoda celor mai mici pătrate.

Estimarea erorilor metodei celor mai mici pătrate.

Pentru a face acest lucru, trebuie să calculați suma abaterilor pătrate ale datelor originale din aceste linii Şi , o valoare mai mică corespunde unei linii care aproximează mai bine datele originale în sensul metodei celor mai mici pătrate.

De la , apoi drept y = 0,165x+2,184 aproximează mai bine datele originale.

Ilustrare grafică a metodei celor mai mici pătrate (LS).

Totul este clar vizibil pe grafice. Linia roșie este linia dreaptă găsită y = 0,165x+2,184, linia albastră este , punctele roz sunt datele originale.

De ce este nevoie de acest lucru, de ce toate aceste aproximări?

Eu personal îl folosesc pentru a rezolva probleme de netezire a datelor, probleme de interpolare și extrapolare (în exemplul original li s-ar fi putut cere să găsească valoarea unei valori observate y la x=3 sau când x=6 folosind metoda celor mai mici pătrate). Dar vom vorbi mai multe despre asta mai târziu într-o altă secțiune a site-ului.

Dovada.

Așa că atunci când este găsit OŞi b funcția ia cea mai mică valoare, este necesar ca în acest moment matricea formei pătratice a diferenţialului de ordinul doi pentru funcţie a fost pozitiv definit. Să o arătăm.

Diferenţialul de ordinul doi are forma:

Adică

Prin urmare, matricea de formă pătratică are forma

iar valorile elementelor nu depind de OŞi b.

Să arătăm că matricea este definită pozitivă. Pentru a face acest lucru, minorii unghiulari trebuie să fie pozitivi.

Minor unghiular de ordinul întâi . Inegalitatea este strictă deoarece punctele nu coincid. În cele ce urmează vom implica acest lucru.

Minor unghiular de ordinul doi

Să demonstrăm asta prin metoda inducţiei matematice.

Concluzie: valori găsite OŞi b corespund celei mai mici valori a funcției , prin urmare, sunt parametrii necesari pentru metoda celor mai mici pătrate.

După nivelare, obținem o funcție de următoarea formă: g (x) = x + 1 3 + 1 .

Putem aproxima aceste date folosind relația liniară y = a x + b calculând parametrii corespunzători. Pentru a face acest lucru, va trebui să aplicăm așa-numita metodă a celor mai mici pătrate. De asemenea, va trebui să faceți un desen pentru a verifica care linie va alinia cel mai bine datele experimentale.

Ce este exact MOL (metoda celor mai mici pătrate)

Principalul lucru pe care trebuie să-l facem este să găsim astfel de coeficienți de dependență liniară la care valoarea funcției a două variabile F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 va fi valoarea cel mai mic. Cu alte cuvinte, pentru anumite valori ale lui a și b, suma abaterilor pătrate ale datelor prezentate de la linia dreaptă rezultată va avea o valoare minimă. Acesta este sensul metodei celor mai mici pătrate. Tot ce trebuie să facem pentru a rezolva exemplul este să găsim extremul funcției a două variabile.

Cum se obțin formule pentru calcularea coeficienților

Pentru a obține formule pentru calcularea coeficienților, trebuie să creați și să rezolvați un sistem de ecuații cu două variabile. Pentru a face acest lucru, calculăm derivatele parțiale ale expresiei F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 față de a și b și le echivalăm cu 0.

δ F (a , b) δ a = 0 δ F (a , b) δ b = 0 ⇔ - 2 ∑ i = 1 n (y i - (a x i + b)) x i = 0 - 2 ∑ i = 1 n ( y i - (a x i + b)) = 0 ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + ∑ i = 1 n b = ∑ i = 1 n y i ⇔ ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + n b = ∑ i = 1 n y i

Pentru a rezolva un sistem de ecuații, puteți utiliza orice metodă, de exemplu, substituția sau metoda lui Cramer. Ca rezultat, ar trebui să avem formule care să poată fi utilizate pentru a calcula coeficienți folosind metoda celor mai mici pătrate.

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n

Am calculat valorile variabilelor la care funcția
F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2 va lua valoarea minimă. În al treilea paragraf vom demonstra de ce este exact așa.

Aceasta este aplicarea metodei celor mai mici pătrate în practică. Formula sa, care este folosită pentru a găsi parametrul a, include ∑ i = 1 n x i, ∑ i = 1 n y i, ∑ i = 1 n x i y i, ∑ i = 1 n x i 2, precum și parametrul
n – denotă cantitatea de date experimentale. Vă sfătuim să calculați fiecare sumă separat. Valoarea coeficientului b se calculează imediat după a.

Să revenim la exemplul inițial.

Exemplul 1

Aici avem n egal cu cinci. Pentru a face mai convenabil calcularea sumelor necesare incluse în formulele coeficientului, să completăm tabelul.

i = 1 i=2 i=3 i=4 i=5 ∑ i = 1 5
x i 0 1 2 4 5 12
y eu 2 , 1 2 , 4 2 , 6 2 , 8 3 12 , 9
x i y i 0 2 , 4 5 , 2 11 , 2 15 33 , 8
x i 2 0 1 4 16 25 46

Soluţie

Al patrulea rând include datele obținute prin înmulțirea valorilor din al doilea rând cu valorile celui de-al treilea pentru fiecare individ i. A cincea linie conține datele din a doua, la pătrat. Ultima coloană arată sumele valorilor rândurilor individuale.

Să folosim metoda celor mai mici pătrate pentru a calcula coeficienții a și b de care avem nevoie. Pentru a face acest lucru, înlocuiți valorile necesare din ultima coloană și calculați sumele:

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n ⇒ a = 8 5 - 12 12, 9 5 46 - 12 2 b = 12, 9 - a 12 5 ⇒ a ≈ 0, 165 b ≈ 2, 184

Se pare că linia dreaptă de aproximare necesară va arăta ca y = 0, 165 x + 2, 184. Acum trebuie să determinăm care linie va aproxima mai bine datele - g (x) = x + 1 3 + 1 sau 0, 165 x + 2, 184. Să estimăm folosind metoda celor mai mici pătrate.

Pentru a calcula eroarea, trebuie să găsim suma abaterilor pătrate ale datelor din liniile drepte σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 și σ 2 = ∑ i = 1 n (y i - g (x i)) 2, valoarea minimă va corespunde unei linii mai potrivite.

σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 = = ∑ i = 1 5 (y i - (0, 165 x i + 2, 184)) 2 ≈ 0, 019 σ 2 = ∑ i = 1 n (y i - g (x i)) 2 = = ∑ i = 1 5 (y i - (x i + 1 3 + 1)) 2 ≈ 0,096

Răspuns: deoarece σ 1< σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
y = 0,165 x + 2,184.

Metoda celor mai mici pătrate este prezentată clar în ilustrația grafică. Linia roșie marchează linia dreaptă g (x) = x + 1 3 + 1, linia albastră marchează y = 0, 165 x + 2, 184. Datele originale sunt indicate prin puncte roz.

Să explicăm de ce sunt necesare exact aproximări de acest tip.

Ele pot fi utilizate în sarcini care necesită netezirea datelor, precum și în acelea în care datele trebuie interpolate sau extrapolate. De exemplu, în problema discutată mai sus, s-ar putea găsi valoarea mărimii observate y la x = 3 sau la x = 6. Am dedicat un articol separat unor astfel de exemple.

Dovada metodei OLS

Pentru ca funcția să ia o valoare minimă atunci când se calculează a și b, este necesar ca la un punct dat matricea formei pătratice a diferențială a funcției de forma F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 este definit pozitiv. Să vă arătăm cum ar trebui să arate.

Exemplul 2

Avem o diferență de ordinul doi de următoarea formă:

d 2 F (a ; b) = δ 2 F (a ; b) δ a 2 d 2 a + 2 δ 2 F (a ; b) δ a δ b d a d b + δ 2 F (a ; b) δ b 2 d 2 b

Soluţie

δ 2 F (a ; b) δ a 2 = δ δ F (a ; b) δ a δ a = = δ - 2 ∑ i = 1 n (y i - (a x i + b)) x i δ a = 2 ∑ i = 1 n (x i) 2 δ 2 F (a; b) δ a δ b = δ δ F (a; b) δ a δ b = = δ - 2 ∑ i = 1 n (y i - (a x i + b) ) x i δ b = 2 ∑ i = 1 n x i δ 2 F (a ; b) δ b 2 = δ δ F (a ; b) δ b δ b = δ - 2 ∑ i = 1 n (y i - (a x i + b)) δ b = 2 ∑ i = 1 n (1) = 2 n

Cu alte cuvinte, o putem scrie astfel: d 2 F (a ; b) = 2 ∑ i = 1 n (x i) 2 d 2 a + 2 2 ∑ x i i = 1 n d a d b + (2 n) d 2 b.

Am obținut o matrice de forma pătratică M = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n .

În acest caz, valorile elementelor individuale nu se vor schimba în funcție de a și b. Este această matrice pozitivă definită? Pentru a răspunde la această întrebare, să verificăm dacă minorii ei unghiulari sunt pozitivi.

Se calculează minorul unghiular de ordinul întâi: 2 ∑ i = 1 n (x i) 2 > 0 . Deoarece punctele x i nu coincid, inegalitatea este strictă. Vom ține cont de acest lucru în calculele ulterioare.

Calculăm minorul unghiular de ordinul doi:

d e t (M) = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n = 4 n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2

După aceasta, procedăm la demonstrarea inegalității n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 folosind inducția matematică.

  1. Să verificăm dacă această inegalitate este valabilă pentru un n arbitrar. Să luăm 2 și să calculăm:

2 ∑ i = 1 2 (x i) 2 - ∑ i = 1 2 x i 2 = 2 x 1 2 + x 2 2 - x 1 + x 2 2 = = x 1 2 - 2 x 1 x 2 + x 2 2 = x 1 + x 2 2 > 0

Am obținut o egalitate corectă (dacă valorile x 1 și x 2 nu coincid).

  1. Să presupunem că această inegalitate va fi adevărată pentru n, i.e. n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 – adevărat.
  2. Acum vom demonstra validitatea pentru n + 1, i.e. că (n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 > 0, dacă n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 .

Noi calculăm:

(n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 = = (n + 1) ∑ i = 1 n (x i) 2 + x n + 1 2 - ∑ i = 1 n x i + x n + 1 2 = = n ∑ i = 1 n (x i) 2 + n x n + 1 2 + ∑ i = 1 n (x i) 2 + x n + 1 2 - - ∑ i = 1 n x i 2 + 2 x n + 1 ∑ i = 1 n x i + x n + 1 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + n x n + 1 2 - x n + 1 ∑ i = 1 n x i + ∑ i = 1 n (x i) 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + x n + 1 2 - 2 x n + 1 x 1 + x 1 2 + + x n + 1 2 - 2 x n + 1 x 2 + x 2 2 + . . . + x n + 1 2 - 2 x n + 1 x 1 + x n 2 = = n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + + (x n + 1 - x 1) 2 + (x n + 1) - x 2) 2 + . . . + (x n - 1 - x n) 2 > 0

Expresia cuprinsă între acolade va fi mai mare decât 0 (pe baza a ceea ce am presupus la pasul 2), iar termenii rămași vor fi mai mari decât 0, deoarece toți sunt pătrate de numere. Am dovedit inegalitatea.

Răspuns: a și b găsite vor corespunde celei mai mici valori a funcției F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2, ceea ce înseamnă că sunt parametrii necesari ai metodei celor mai mici pătrate (LSM).

Dacă observați o eroare în text, vă rugăm să o evidențiați și să apăsați Ctrl+Enter

  • Lecție introductivă gratuit;
  • Un număr mare de profesori cu experiență (nativi și vorbitori de limbă rusă);
  • Cursurile NU sunt pentru o anumită perioadă (lună, șase luni, an), ci pentru un anumit număr de lecții (5, 10, 20, 50);
  • Peste 10.000 de clienți mulțumiți.
  • Costul unei lecții cu un profesor vorbitor de limbă rusă este de la 600 de ruble, cu un vorbitor nativ - de la 1500 de ruble

Esența metodei celor mai mici pătrate este în găsirea parametrilor unui model de tendință care descrie cel mai bine tendința de dezvoltare a oricărui fenomen aleator în timp sau spațiu (o tendință este o linie care caracterizează tendința acestei dezvoltări). Sarcina metodei celor mai mici pătrate (LSM) se rezumă nu doar la găsirea unui model de tendință, ci la găsirea celui mai bun sau optim model. Acest model va fi optim dacă suma abaterilor pătrate dintre valorile reale observate și valorile de tendință calculate corespunzătoare este minimă (cea mai mică):

unde este abaterea pătrată dintre valoarea reală observată

și valoarea de tendință calculată corespunzătoare,

Valoarea reală (observată) a fenomenului studiat,

Valoarea calculată a modelului de tendință,

Numărul de observații ale fenomenului studiat.

MNC este folosit destul de rar pe cont propriu. De regulă, cel mai adesea este folosit doar ca tehnică tehnică necesară în studiile de corelare. Trebuie amintit că baza informațională a OLS poate fi doar o serie statistică de încredere, iar numărul de observații nu trebuie să fie mai mic de 4, altfel procedurile de netezire ale OLS își pot pierde bunul simț.

Setul de instrumente MNC se rezumă la următoarele proceduri:

Prima procedură. Se dovedește dacă există vreo tendință de a schimba atributul rezultat atunci când factorul-argument selectat se schimbă sau, cu alte cuvinte, există o legătură între „ la " Și " X ».

A doua procedură. Se stabilește care linie (traiectorie) poate descrie sau caracteriza cel mai bine această tendință.

A treia procedură.

Exemplu. Să presupunem că avem informații despre randamentul mediu de floarea-soarelui pentru ferma studiată (Tabelul 9.1).

Tabelul 9.1

Numărul de observație

Productivitate, c/ha

Întrucât nivelul tehnologiei în producția de floarea soarelui în țara noastră a rămas practic neschimbat în ultimii 10 ani, înseamnă că, aparent, fluctuațiile randamentului în perioada analizată au fost foarte dependente de fluctuațiile condițiilor meteo și climatice. Este asta cu adevărat adevărat?

Prima procedură OLS. Este testată ipoteza privind existența unei tendințe de modificare a randamentului de floarea-soarelui în funcție de modificările condițiilor meteo și climatice pe parcursul celor 10 ani analizați.

În acest exemplu, pentru " y " este recomandabil să se ia randamentul de floarea soarelui, iar pentru " x » – numărul anului observat în perioada analizată. Testarea ipotezei despre existența oricărei relații între " x " Și " y „se poate face în două moduri: manual și folosind programe de calculator. Desigur, odată cu disponibilitatea tehnologiei informatice, această problemă poate fi rezolvată de la sine. Dar pentru a înțelege mai bine instrumentele MNC, este indicat să testați ipoteza despre existența unei relații între „ x " Și " y » manual, când sunt la îndemână doar un pix și un calculator obișnuit. În astfel de cazuri, ipoteza despre existența unei tendințe este cel mai bine verificată vizual prin locația imaginii grafice a seriei de dinamică analizată - câmpul de corelație:

Câmpul de corelație din exemplul nostru este situat în jurul unei linii care crește încet. Acest lucru în sine indică existența unei anumite tendințe de modificare a recoltelor de floarea soarelui. Este imposibil să vorbim despre prezența oricărei tendințe doar atunci când câmpul de corelare arată ca un cerc, un cerc, un nor strict vertical sau strict orizontal sau este format din puncte împrăștiate haotic. În toate celelalte cazuri, ipoteza despre existența unei relații între „ x " Și " y ", și continuă cercetările.

A doua procedură OLS. Se stabilește care linie (traiectorie) poate descrie sau caracteriza cel mai bine tendința de modificări ale producției de floarea soarelui în perioada analizată.

Dacă aveți tehnologie informatică, selectarea tendinței optime are loc automat. În procesarea „manuală”, selectarea funcției optime se realizează, de regulă, vizual - prin locația câmpului de corelare. Adică, pe baza tipului de grafic, este selectată ecuația dreptei care se potrivește cel mai bine tendinței empirice (traiectoria reală).

După cum se știe, în natură există o mare varietate de dependențe funcționale, deci este extrem de dificil să analizezi vizual chiar și o mică parte din ele. Din fericire, în practica economică reală, majoritatea relațiilor pot fi descrise destul de precis fie printr-o parabolă, fie printr-o hiperbolă, fie printr-o linie dreaptă. În acest sens, cu opțiunea „manuală” de selectare a celei mai bune funcții, vă puteți limita doar la aceste trei modele.

Hiperbolă:

Parabola de ordinul doi: :

Este ușor de observat că, în exemplul nostru, tendința de modificare a producției de floarea-soarelui pe parcursul celor 10 ani analizați este cel mai bine caracterizată printr-o linie dreaptă, astfel încât ecuația de regresie va fi ecuația unei linii drepte.

A treia procedură. Se calculează parametrii ecuației de regresie care caracterizează această linie sau, cu alte cuvinte, se determină o formulă analitică care descrie cel mai bun model tendinţă.

Găsirea valorilor parametrilor ecuației de regresie, în cazul nostru parametrii și , este nucleul MOL. Acest proces se reduce la rezolvarea unui sistem de ecuații normale.

(9.2)

Acest sistem de ecuații poate fi rezolvat destul de ușor prin metoda Gauss. Să ne amintim că, ca urmare a soluției, în exemplul nostru, se găsesc valorile parametrilor și. Astfel, ecuația de regresie găsită va avea următoarea formă:

Dacă o anumită mărime fizică depinde de o altă mărime, atunci această dependență poate fi studiată prin măsurarea y la diferite valori ale lui x. În urma măsurătorilor, se obțin un număr de valori:

x 1, x 2, ..., x i, ..., x n;

y 1 , y 2 , ..., y i , ... , y n .

Pe baza datelor unui astfel de experiment, este posibil să se construiască un grafic al dependenței y = ƒ(x). Curba rezultată face posibilă aprecierea formei funcției ƒ(x). Cu toate acestea, coeficienții constanți care intră în această funcție rămân necunoscuți. Ele pot fi determinate folosind metoda celor mai mici pătrate. Punctele experimentale, de regulă, nu se află exact pe curbă. Metoda celor mai mici pătrate necesită ca suma pătratelor abaterilor punctelor experimentale de la curbă, i.e.

2 a fost cel mai mic.

În practică, această metodă este folosită cel mai des (și cel mai simplu) în cazul unei relații liniare, adică Când y = kx sau

y = a + bx.

Dependența liniară este foarte răspândită în fizică. Și chiar și atunci când relația este neliniară, de obicei încearcă să construiască un grafic astfel încât să obțină o linie dreaptă. De exemplu, dacă se presupune că indicele de refracție al sticlei n este legat de lungimea de undă a luminii λ prin relația n = a + b/λ 2, atunci dependența lui n de λ -2 este reprezentată pe grafic. În practică, această metodă este folosită cel mai des (și cel mai simplu) în cazul unei relații liniare, adică Când(o linie dreaptă care trece prin origine). Să compunem valoarea φ suma pătratelor abaterilor punctelor noastre de la dreapta

Valoarea lui φ este întotdeauna pozitivă și se dovedește a fi mai mică cu cât punctele noastre sunt mai aproape de linia dreaptă. Metoda celor mai mici pătrate afirmă că valoarea pentru k ar trebui aleasă astfel încât φ să aibă un minim


sau
(19)

Calculul arată că eroarea pătratică medie în determinarea valorii lui k este egală cu

, (20)
unde n este numărul de măsurători.

Să luăm acum în considerare un caz ceva mai dificil, când punctele trebuie să satisfacă formula y = a + bx(o linie dreaptă care nu trece prin origine).

Sarcina este de a găsi cele mai bune valori ale lui a și b din setul disponibil de valori x i, y i.

Să compunem din nou o formă pătratică φ, egală cu suma abaterilor pătrate ale punctelor x i, y i de la dreapta

și găsiți valorile lui a și b pentru care φ are un minim

;

.

.

Rezolvarea comună a acestor ecuații dă

(21)

Erorile pătratice medii ale determinării lui a și b sunt egale

(23)

.  (24)

La prelucrarea rezultatelor măsurătorilor folosind această metodă, este convenabil să rezumați toate datele într-un tabel în care sunt calculate preliminar toate cantitățile incluse în formulele (19)(24). Formele acestor tabele sunt date în exemplele de mai jos.

Exemplul 1. A fost studiată ecuația de bază a dinamicii mișcare de rotațieε = M/J (linia care trece prin origine). La diferite valori ale momentului M, a fost măsurată accelerația unghiulară ε a unui anumit corp. Este necesar să se determine momentul de inerție al acestui corp. Rezultatele măsurătorilor momentului de forță și accelerației unghiulare sunt enumerate în a doua și a treia coloană tabelul 5.

Tabelul 5
n M, N m ε, s -1 M 2 M ε ε - kM (ε - kM) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

Folosind formula (19) determinăm:

.

Pentru a determina eroarea pătratică medie, folosim formula (20)

0.005775kg-1 · m -2 .

Conform formulei (18) avem

; .

S J = (2,996 0,005775)/0,3337 = 0,05185 kg m2.

După ce am stabilit fiabilitatea P = 0,95, folosind tabelul coeficienților Student pentru n = 5, găsim t = 2,78 și determinăm eroarea absolută ΔJ = 2,78 0,05185 = 0,1441 ≈ 0,2 kg m2.

Să scriem rezultatele sub forma:

J = (3,0 ± 0,2) kg m2;


Exemplul 2. Să calculăm coeficientul de temperatură al rezistenței metalului folosind metoda celor mai mici pătrate. Rezistența depinde liniar de temperatură

Rt = R0 (1 + a t°) = R0 + R0 a t°.

Termenul liber determină rezistența R 0 la o temperatură de 0 ° C, iar coeficientul de pantă este produsul dintre coeficientul de temperatură α și rezistența R 0 .

Rezultatele măsurătorilor și calculelor sunt prezentate în tabel ( vezi tabelul 6).

Tabelul 6
n t°, s r, Ohm t-¯t (t-¯t) 2 (t-¯t)r r - bt - a (r - bt - a) 2 .10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/n 85.83333 1.4005 – – – – –

Folosind formulele (21), (22) determinăm

R 0 = ¯ R- α R 0 ¯ t = 1,4005 - 0,002645 85,83333 = 1,1735 Ohm.

Să găsim o eroare în definiția lui α. Deoarece , atunci conform formulei (18) avem:

.

Folosind formulele (23), (24) avem

;

0.014126 Ohm.

După ce am stabilit fiabilitatea la P = 0,95, folosind tabelul coeficienților Student pentru n = 6, găsim t = 2,57 și determinăm eroarea absolută Δα = 2,57 0,000132 = 0,000338 grade -1.

α = (23 ± 4) 10 -4 grindină-1 la P = 0,95.


Exemplul 3. Este necesară determinarea razei de curbură a lentilei folosind inelele lui Newton. Au fost măsurate razele inelelor lui Newton r m și au fost determinate numerele acestor inele m. Razele inelelor lui Newton sunt legate de raza de curbură a lentilei R și de numărul inelului prin ecuație

r 2 m = mλR - 2d 0 R,

unde d 0 grosimea spațiului dintre lentilă și placa plan-paralelă (sau deformarea lentilei),

λ lungimea de undă a luminii incidente.

A = (600 ± 6) nm;
r 2 m = y;
m = x;
λR = b;
-2d 0 R = a,

atunci ecuația va lua forma y = a + bx.

.

Rezultatele măsurătorilor și calculelor sunt introduse tabelul 7.

Tabelul 7
n x = m y = r 2, 10 -2 mm 2 m -¯m (m -¯m) 2 (m -¯ m)y y - bx - a, 10 -4 (y - bx - a) 2 , 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/n 3.5 20.8548333 – – – – –