Nedarbingumo atostogos

Mažiausių kvadratų grafinė interpretacija. Mažiausi kvadratai „Excel“ – naudojant tendencijų funkciją

Mažiausio kvadrato metodas

Mažiausio kvadrato metodas ( MNK, OLS, paprastieji mažiausi kvadratai) - vienas iš pagrindinių regresinės analizės metodų, leidžiančių įvertinti nežinomus regresijos modelių parametrus iš imties duomenų. Metodas pagrįstas regresijos liekanų kvadratų sumos sumažinimu.

Pažymėtina, kad pats mažiausių kvadratų metodas gali būti vadinamas bet kurios srities uždavinio sprendimo metodu, jei sprendimas susideda iš arba atitinka tam tikrą kriterijų, leidžiantį sumažinti kai kurių nežinomų kintamųjų funkcijų kvadratų sumą. Todėl mažiausių kvadratų metodas taip pat gali būti naudojamas apytiksliui tam tikros funkcijos atvaizdavimui (approksimacijai) kitomis (paprastesnėmis) funkcijomis, ieškant dydžių aibės, atitinkančios lygtis ar apribojimus, kurių skaičius viršija šių dydžių skaičių. ir kt.

MNC esmė

Tegul koks nors (parametrinis) tikimybinės (regresijos) priklausomybės tarp (paaiškinamo) kintamojo modelis y ir daug veiksnių (aiškinamieji kintamieji) x

kur yra nežinomų modelio parametrų vektorius

- Atsitiktinė modelio klaida.

Tegul taip pat būna pavyzdiniai nurodytų kintamųjų verčių stebėjimai. Leisti yra stebėjimo numeris (). Tada yra kintamųjų reikšmės --ajame stebėjime. Tada, esant nurodytoms parametrų b reikšmėms, galima apskaičiuoti paaiškinamo kintamojo y teorines (modelio) reikšmes:

Likučių vertė priklauso nuo parametrų verčių b.

LSM (įprasto, klasikinio) esmė yra rasti tokius parametrus b, kurių likučių kvadratų suma (angl. Likutinė kvadratų suma) bus minimalus:

Bendru atveju šią problemą galima išspręsti skaitmeniniais optimizavimo (minimizacijos) metodais. Šiuo atveju kalbama apie netiesiniai mažieji kvadratai(NLS arba NLLS – angl. Netiesiniai mažieji kvadratai). Daugeliu atvejų galima gauti analitinį sprendimą. Norint išspręsti minimizavimo uždavinį, reikia surasti funkcijos stacionariuosius taškus, diferencijuojant ją nežinomų parametrų b atžvilgiu, išvestines prilyginant nuliui ir išsprendžiant gautą lygčių sistemą:

Jei modelio atsitiktinės paklaidos yra normaliai paskirstytos, turi vienodą dispersiją ir nėra koreliuojamos viena su kita, mažiausių kvadratų parametrų įverčiai yra tokie patys kaip didžiausios tikimybės metodo (MLM) įverčiai.

LSM tiesinio modelio atveju

Tegul regresijos priklausomybė yra tiesinė:

Leisti būti y- paaiškinamo kintamojo stebėjimų stulpelio vektorius ir - veiksnių stebėjimų matrica (matricos eilutės - faktorių reikšmių vektoriai tam tikrame stebėjime, stulpeliais - tam tikro faktoriaus reikšmių vektorius visuose stebėjimuose) . Tiesinio modelio matricos vaizdavimas turi tokią formą:

Tada paaiškinamo kintamojo įverčių vektorius ir regresijos likučių vektorius bus lygus

atitinkamai regresijos likučių kvadratų suma bus lygi

Diferencijuodami šią funkciją parametrų vektoriaus atžvilgiu ir prilygindami išvestis nuliui, gauname lygčių sistemą (matricos pavidalu):

.

Šios lygčių sistemos sprendimas pateikia bendrą tiesinio modelio mažiausių kvadratų įverčių formulę:

Analitiniais tikslais paskutinis šios formulės vaizdas yra naudingas. Jei regresijos modelio duomenys centre, tai šiame vaizde pirmoji matrica turi imties faktorių kovariacijos matricos reikšmę, o antroji – faktorių su priklausomu kintamuoju kovariacijų vektorius. Jei, be to, duomenys taip pat yra normalizuotas SKO (tai yra galiausiai standartizuoti), tada pirmoji matrica turi veiksnių imties koreliacijos matricos reikšmę, antrasis vektorius - veiksnių imties koreliacijų vektorius su priklausomu kintamuoju.

Svarbi modelių LLS įverčių savybė su konstanta- sudarytos regresijos linija eina per imties duomenų svorio centrą, tai yra, lygybė įvykdoma:

Visų pirma, kraštutiniu atveju, kai vienintelis regresorius yra konstanta, nustatome, kad vieno parametro (pačios konstantos) OLS įvertis yra lygus aiškinamo kintamojo vidutinei vertei. Tai yra, aritmetinis vidurkis, žinomas dėl savo gerųjų savybių iš didelių skaičių dėsnių, taip pat yra mažiausių kvadratų įvertis – jis atitinka minimalios kvadratinių nukrypimų nuo jo sumos kriterijų.

Pavyzdys: paprasta (porinė) regresija

Suporuotos tiesinės regresijos atveju skaičiavimo formulės yra supaprastintos (galite apsieiti be matricinės algebros):

OLS įverčių savybės

Visų pirma pažymime, kad tiesiniams modeliams mažiausiųjų kvadratų įverčiai yra tiesiniai įverčiai, kaip matyti iš aukščiau pateiktos formulės. Nešališkiems OLS įverčiams būtina ir pakanka įvykdyti svarbiausią regresinės analizės sąlygą: atsitiktinės paklaidos matematinis lūkestis, priklausantis nuo faktorių, turi būti lygus nuliui. Ši sąlyga įvykdyta, ypač jei

  1. atsitiktinių klaidų matematinis lūkestis lygus nuliui, ir
  2. veiksniai ir atsitiktinės paklaidos yra nepriklausomi atsitiktiniai dydžiai.

Antroji sąlyga – egzogeninių veiksnių būklė – yra esminė. Jei ši savybė nepatenkinama, galime manyti, kad beveik bet kokie įverčiai bus itin nepatenkinami: jie net nebus nuoseklūs (tai yra, net ir labai didelis duomenų kiekis neleidžia gauti kokybinių įverčių šiuo atveju). Klasikiniu atveju daroma stipresnė prielaida apie veiksnių determinizmą, priešingai nei atsitiktinė paklaida, kuri automatiškai reiškia, kad egzogeninė sąlyga tenkinama. Bendruoju atveju įverčių nuoseklumui pakanka įvykdyti egzogeniškumo sąlygą kartu su matricos konvergencija prie kažkokios nevienetinės matricos, imties dydį padidinus iki begalybės.

Kad, be nuoseklumo ir nešališkumo, (įprastų) mažiausių kvadratų įverčiai būtų ir veiksmingi (geriausi tiesinių nešališkų įverčių klasėje), būtina įvykdyti papildomas atsitiktinės paklaidos savybes:

Šios prielaidos gali būti suformuluotos atsitiktinės paklaidos vektoriaus kovariacijos matricai

Šias sąlygas tenkinantis tiesinis modelis vadinamas klasikinis. Klasikinės tiesinės regresijos OLS įverčiai yra nešališki, nuoseklūs ir efektyviausi įverčiai visų tiesinių nešališkų įverčių klasėje (anglų literatūroje kartais naudojama santrumpa mėlyna (Geriausias tiesinis nepagrįstas įvertinimo įrankis) yra geriausias tiesinis nešališkas įvertis; buitinėje literatūroje dažniau cituojama Gauso-Markovo teorema). Kaip nesunku parodyti, koeficientų įverčių vektoriaus kovariacijos matrica bus lygi:

Apibendrinti mažiausi kvadratai

Mažiausių kvadratų metodas leidžia plačiai apibendrinti. Užuot sumažinus likučių kvadratų sumą, galima sumažinti kokią nors teigiamą apibrėžtą kvadratinę liekamojo vektoriaus formą, kur yra kokia nors simetriška teigiamo apibrėžtojo svorio matrica. Paprastieji mažiausi kvadratai yra ypatingas šio metodo atvejis, kai svorio matrica yra proporcinga tapatybės matricai. Kaip žinoma iš simetrinių matricų (arba operatorių) teorijos, tokios matricos yra skaidomos. Todėl nurodytas funkcinis gali būti pavaizduotas taip, tai yra, šis funkcinis gali būti pavaizduotas kaip kai kurių transformuotų „likučių“ kvadratų suma. Taigi galime išskirti mažiausių kvadratų metodų klasę – LS-metodus (Least Squares).

Įrodyta (Aitkeno teorema), kad apibendrintam tiesinės regresijos modeliui (kuriame atsitiktinių paklaidų kovariacijos matricai nėra taikomi apribojimai) efektyviausi (tiesinių nešališkų įverčių klasėje) yra vadinamųjų įverčiai. apibendrintas OLS (OMNK, GLS – apibendrinti mažiausi kvadratai)- LS metodas su svorio matrica, lygia atsitiktinių paklaidų atvirkštinei kovariacijos matricai: .

Galima parodyti, kad tiesinio modelio parametrų GLS įverčių formulė turi formą

Šių įverčių kovariacijos matrica atitinkamai bus lygi

Tiesą sakant, OLS esmė slypi tam tikroje (tiesinėje) pirminių duomenų transformacijoje (P) ir įprastų mažiausiųjų kvadratų taikymas transformuotiems duomenims. Šios transformacijos tikslas yra tas, kad transformuotų duomenų atsitiktinės paklaidos jau tenkintų klasikines prielaidas.

Svertiniai mažiausi kvadratai

Įstrižainės svorio matricos (taigi ir atsitiktinių klaidų kovariacijos matricos) atveju turime vadinamuosius svertinius mažiausius kvadratus (WLS – Weighted Least Squares). Šiuo atveju modelio likučių svertinė kvadratų suma yra sumažinta, tai yra, kiekvienas stebėjimas gauna "svorį", kuris yra atvirkščiai proporcingas šio stebėjimo atsitiktinės paklaidos dispersijai: . Tiesą sakant, duomenys transformuojami pasveriant stebėjimus (padalijus iš sumos, proporcingos numanomam atsitiktinių paklaidų standartiniam nuokrypiui), o svertiniams duomenims taikomi normalūs mažiausi kvadratai.

Kai kurie specialūs LSM taikymo atvejai praktikoje

Linijinis aproksimacija

Apsvarstykite atvejį, kai, tiriant tam tikro skaliarinio dydžio priklausomybę nuo tam tikro skaliarinio dydžio (tai gali būti, pavyzdžiui, įtampos priklausomybė nuo srovės stiprumo: , kur yra pastovi vertė, laidininko varža ), šie dydžiai buvo išmatuoti, todėl vertės ir jas atitinkančios vertės. Matavimo duomenys turi būti įrašyti į lentelę.

Lentelė. Matavimo rezultatai.

Matavimo Nr.
1
2
3
4
5
6

Klausimas skamba taip: kokią koeficiento reikšmę galima pasirinkti geriausiai priklausomybei apibūdinti? Pagal mažiausius kvadratus ši vertė turėtų būti tokia, kad reikšmių nuokrypių nuo reikšmių kvadratų suma

buvo minimalus

Nukrypimų kvadratu suma turi vieną ekstremumą – minimumą, leidžiantį naudoti šią formulę. Iš šios formulės raskime koeficiento reikšmę. Norėdami tai padaryti, pakeičiame jo kairę pusę taip:

Paskutinė formulė leidžia mums rasti koeficiento reikšmę, kurios reikėjo uždavinyje.

Istorija

Iki XIX amžiaus pradžios. mokslininkai neturėjo tam tikrų taisyklių, kaip išspręsti lygčių sistemą, kurioje nežinomųjų skaičius yra mažesnis už lygčių skaičių; Iki tol buvo naudojami tam tikri metodai, priklausomai nuo lygčių tipo ir skaičiuoklių išradingumo, todėl skirtingi skaičiuotuvai, remdamiesi tais pačiais stebėjimo duomenimis, priėjo prie skirtingų išvadų. Gausas (1795) priskiriamas prie pirmojo metodo taikymo, o Legendre (1805) savarankiškai atrado ir paskelbė jį šiuolaikiniu pavadinimu (fr. Methode des moindres quarres ). Laplasas metodą susiejo su tikimybių teorija, o amerikiečių matematikas Adrainas (1808) svarstė jo tikimybinius pritaikymus. Metodas yra plačiai paplitęs ir patobulintas tolesnių Encke, Bessel, Hansen ir kitų tyrimų.

Alternatyvus MNC naudojimas

Mažiausių kvadratų metodo idėja gali būti naudojama ir kitais atvejais, tiesiogiai nesusijusiais su regresine analize. Faktas yra tas, kad kvadratų suma yra vienas iš labiausiai paplitusių vektorių artumo matų (Euklido metrika baigtinių matmenų erdvėse).

Viena iš taikomųjų programų yra tiesinių lygčių sistemų „sprendimas“, kuriose lygčių skaičius yra didesnis už kintamųjų skaičių.

kur matrica yra ne kvadratinė, o stačiakampė.

Tokia lygčių sistema bendru atveju neturi sprendinio (jei rangas iš tikrųjų yra didesnis už kintamųjų skaičių). Todėl šią sistemą galima „išspręsti“ tik ta prasme, kad pasirenkamas toks vektorius, siekiant sumažinti „atstumą“ tarp vektorių ir . Norėdami tai padaryti, galite taikyti sistemos kairiosios ir dešiniosios lygčių dalių skirtumų kvadratų sumos sumažinimo kriterijų, ty . Nesunku parodyti, kad šios sumažinimo problemos sprendimas lemia šios lygčių sistemos sprendimą

Mažiausio kvadrato metodas

Mažiausio kvadrato metodas ( MNK, OLS, paprastieji mažiausi kvadratai) - vienas iš pagrindinių regresinės analizės metodų, leidžiančių įvertinti nežinomus regresijos modelių parametrus iš imties duomenų. Metodas pagrįstas regresijos liekanų kvadratų sumos sumažinimu.

Pažymėtina, kad pats mažiausių kvadratų metodas gali būti vadinamas bet kurios srities uždavinio sprendimo metodu, jei sprendimas susideda iš arba atitinka tam tikrą kriterijų, leidžiantį sumažinti kai kurių nežinomų kintamųjų funkcijų kvadratų sumą. Todėl mažiausių kvadratų metodas taip pat gali būti naudojamas apytiksliui tam tikros funkcijos atvaizdavimui (approksimacijai) kitomis (paprastesnėmis) funkcijomis, ieškant dydžių aibės, atitinkančios lygtis ar apribojimus, kurių skaičius viršija šių dydžių skaičių. ir kt.

MNC esmė

Tegul koks nors (parametrinis) tikimybinės (regresijos) priklausomybės tarp (paaiškinamo) kintamojo modelis y ir daug veiksnių (aiškinamieji kintamieji) x

kur yra nežinomų modelio parametrų vektorius

- Atsitiktinė modelio klaida.

Tegul taip pat būna pavyzdiniai nurodytų kintamųjų verčių stebėjimai. Leisti yra stebėjimo numeris (). Tada yra kintamųjų reikšmės --ajame stebėjime. Tada, esant nurodytoms parametrų b reikšmėms, galima apskaičiuoti paaiškinamo kintamojo y teorines (modelio) reikšmes:

Likučių vertė priklauso nuo parametrų verčių b.

LSM (įprasto, klasikinio) esmė yra rasti tokius parametrus b, kurių likučių kvadratų suma (angl. Likutinė kvadratų suma) bus minimalus:

Bendru atveju šią problemą galima išspręsti skaitmeniniais optimizavimo (minimizacijos) metodais. Šiuo atveju kalbama apie netiesiniai mažieji kvadratai(NLS arba NLLS – angl. Netiesiniai mažieji kvadratai). Daugeliu atvejų galima gauti analitinį sprendimą. Norint išspręsti minimizavimo uždavinį, reikia surasti funkcijos stacionariuosius taškus, diferencijuojant ją nežinomų parametrų b atžvilgiu, išvestines prilyginant nuliui ir išsprendžiant gautą lygčių sistemą:

Jei modelio atsitiktinės paklaidos yra normaliai paskirstytos, turi vienodą dispersiją ir nėra koreliuojamos viena su kita, mažiausių kvadratų parametrų įverčiai yra tokie patys kaip didžiausios tikimybės metodo (MLM) įverčiai.

LSM tiesinio modelio atveju

Tegul regresijos priklausomybė yra tiesinė:

Leisti būti y- paaiškinamo kintamojo stebėjimų stulpelio vektorius ir - veiksnių stebėjimų matrica (matricos eilutės - faktorių reikšmių vektoriai tam tikrame stebėjime, stulpeliais - tam tikro faktoriaus reikšmių vektorius visuose stebėjimuose) . Tiesinio modelio matricos vaizdavimas turi tokią formą:

Tada paaiškinamo kintamojo įverčių vektorius ir regresijos likučių vektorius bus lygus

atitinkamai regresijos likučių kvadratų suma bus lygi

Diferencijuodami šią funkciją parametrų vektoriaus atžvilgiu ir prilygindami išvestis nuliui, gauname lygčių sistemą (matricos pavidalu):

.

Šios lygčių sistemos sprendimas pateikia bendrą tiesinio modelio mažiausių kvadratų įverčių formulę:

Analitiniais tikslais paskutinis šios formulės vaizdas yra naudingas. Jei regresijos modelio duomenys centre, tai šiame vaizde pirmoji matrica turi imties faktorių kovariacijos matricos reikšmę, o antroji – faktorių su priklausomu kintamuoju kovariacijų vektorius. Jei, be to, duomenys taip pat yra normalizuotas SKO (tai yra galiausiai standartizuoti), tada pirmoji matrica turi veiksnių imties koreliacijos matricos reikšmę, antrasis vektorius - veiksnių imties koreliacijų vektorius su priklausomu kintamuoju.

Svarbi modelių LLS įverčių savybė su konstanta- sudarytos regresijos linija eina per imties duomenų svorio centrą, tai yra, lygybė įvykdoma:

Visų pirma, kraštutiniu atveju, kai vienintelis regresorius yra konstanta, nustatome, kad vieno parametro (pačios konstantos) OLS įvertis yra lygus aiškinamo kintamojo vidutinei vertei. Tai yra, aritmetinis vidurkis, žinomas dėl savo gerųjų savybių iš didelių skaičių dėsnių, taip pat yra mažiausių kvadratų įvertis – jis atitinka minimalios kvadratinių nukrypimų nuo jo sumos kriterijų.

Pavyzdys: paprasta (porinė) regresija

Suporuotos tiesinės regresijos atveju skaičiavimo formulės yra supaprastintos (galite apsieiti be matricinės algebros):

OLS įverčių savybės

Visų pirma pažymime, kad tiesiniams modeliams mažiausiųjų kvadratų įverčiai yra tiesiniai įverčiai, kaip matyti iš aukščiau pateiktos formulės. Nešališkiems OLS įverčiams būtina ir pakanka įvykdyti svarbiausią regresinės analizės sąlygą: atsitiktinės paklaidos matematinis lūkestis, priklausantis nuo faktorių, turi būti lygus nuliui. Ši sąlyga įvykdyta, ypač jei

  1. atsitiktinių klaidų matematinis lūkestis lygus nuliui, ir
  2. veiksniai ir atsitiktinės paklaidos yra nepriklausomi atsitiktiniai dydžiai.

Antroji sąlyga – egzogeninių veiksnių būklė – yra esminė. Jei ši savybė nepatenkinama, galime manyti, kad beveik bet kokie įverčiai bus itin nepatenkinami: jie net nebus nuoseklūs (tai yra, net ir labai didelis duomenų kiekis neleidžia gauti kokybinių įverčių šiuo atveju). Klasikiniu atveju daroma stipresnė prielaida apie veiksnių determinizmą, priešingai nei atsitiktinė paklaida, kuri automatiškai reiškia, kad egzogeninė sąlyga tenkinama. Bendruoju atveju įverčių nuoseklumui pakanka įvykdyti egzogeniškumo sąlygą kartu su matricos konvergencija prie kažkokios nevienetinės matricos, imties dydį padidinus iki begalybės.

Kad, be nuoseklumo ir nešališkumo, (įprastų) mažiausių kvadratų įverčiai būtų ir veiksmingi (geriausi tiesinių nešališkų įverčių klasėje), būtina įvykdyti papildomas atsitiktinės paklaidos savybes:

Šios prielaidos gali būti suformuluotos atsitiktinės paklaidos vektoriaus kovariacijos matricai

Šias sąlygas tenkinantis tiesinis modelis vadinamas klasikinis. Klasikinės tiesinės regresijos OLS įverčiai yra nešališki, nuoseklūs ir efektyviausi įverčiai visų tiesinių nešališkų įverčių klasėje (anglų literatūroje kartais naudojama santrumpa mėlyna (Geriausias tiesinis nepagrįstas įvertinimo įrankis) yra geriausias tiesinis nešališkas įvertis; buitinėje literatūroje dažniau cituojama Gauso-Markovo teorema). Kaip nesunku parodyti, koeficientų įverčių vektoriaus kovariacijos matrica bus lygi:

Apibendrinti mažiausi kvadratai

Mažiausių kvadratų metodas leidžia plačiai apibendrinti. Užuot sumažinus likučių kvadratų sumą, galima sumažinti kokią nors teigiamą apibrėžtą kvadratinę liekamojo vektoriaus formą, kur yra kokia nors simetriška teigiamo apibrėžtojo svorio matrica. Paprastieji mažiausi kvadratai yra ypatingas šio metodo atvejis, kai svorio matrica yra proporcinga tapatybės matricai. Kaip žinoma iš simetrinių matricų (arba operatorių) teorijos, tokios matricos yra skaidomos. Todėl nurodytas funkcinis gali būti pavaizduotas taip, tai yra, šis funkcinis gali būti pavaizduotas kaip kai kurių transformuotų „likučių“ kvadratų suma. Taigi galime išskirti mažiausių kvadratų metodų klasę – LS-metodus (Least Squares).

Įrodyta (Aitkeno teorema), kad apibendrintam tiesinės regresijos modeliui (kuriame atsitiktinių paklaidų kovariacijos matricai nėra taikomi apribojimai) efektyviausi (tiesinių nešališkų įverčių klasėje) yra vadinamųjų įverčiai. apibendrintas OLS (OMNK, GLS – apibendrinti mažiausi kvadratai)- LS metodas su svorio matrica, lygia atsitiktinių paklaidų atvirkštinei kovariacijos matricai: .

Galima parodyti, kad tiesinio modelio parametrų GLS įverčių formulė turi formą

Šių įverčių kovariacijos matrica atitinkamai bus lygi

Tiesą sakant, OLS esmė slypi tam tikroje (tiesinėje) pirminių duomenų transformacijoje (P) ir įprastų mažiausiųjų kvadratų taikymas transformuotiems duomenims. Šios transformacijos tikslas yra tas, kad transformuotų duomenų atsitiktinės paklaidos jau tenkintų klasikines prielaidas.

Svertiniai mažiausi kvadratai

Įstrižainės svorio matricos (taigi ir atsitiktinių klaidų kovariacijos matricos) atveju turime vadinamuosius svertinius mažiausius kvadratus (WLS – Weighted Least Squares). Šiuo atveju modelio likučių svertinė kvadratų suma yra sumažinta, tai yra, kiekvienas stebėjimas gauna "svorį", kuris yra atvirkščiai proporcingas šio stebėjimo atsitiktinės paklaidos dispersijai: . Tiesą sakant, duomenys transformuojami pasveriant stebėjimus (padalijus iš sumos, proporcingos numanomam atsitiktinių paklaidų standartiniam nuokrypiui), o svertiniams duomenims taikomi normalūs mažiausi kvadratai.

Kai kurie specialūs LSM taikymo atvejai praktikoje

Linijinis aproksimacija

Apsvarstykite atvejį, kai, tiriant tam tikro skaliarinio dydžio priklausomybę nuo tam tikro skaliarinio dydžio (tai gali būti, pavyzdžiui, įtampos priklausomybė nuo srovės stiprumo: , kur yra pastovi vertė, laidininko varža ), šie dydžiai buvo išmatuoti, todėl vertės ir jas atitinkančios vertės. Matavimo duomenys turi būti įrašyti į lentelę.

Lentelė. Matavimo rezultatai.

Matavimo Nr.
1
2
3
4
5
6

Klausimas skamba taip: kokią koeficiento reikšmę galima pasirinkti geriausiai priklausomybei apibūdinti? Pagal mažiausius kvadratus ši vertė turėtų būti tokia, kad reikšmių nuokrypių nuo reikšmių kvadratų suma

buvo minimalus

Nukrypimų kvadratu suma turi vieną ekstremumą – minimumą, leidžiantį naudoti šią formulę. Iš šios formulės raskime koeficiento reikšmę. Norėdami tai padaryti, pakeičiame jo kairę pusę taip:

Paskutinė formulė leidžia mums rasti koeficiento reikšmę, kurios reikėjo uždavinyje.

Istorija

Iki XIX amžiaus pradžios. mokslininkai neturėjo tam tikrų taisyklių, kaip išspręsti lygčių sistemą, kurioje nežinomųjų skaičius yra mažesnis už lygčių skaičių; Iki tol buvo naudojami tam tikri metodai, priklausomai nuo lygčių tipo ir skaičiuoklių išradingumo, todėl skirtingi skaičiuotuvai, remdamiesi tais pačiais stebėjimo duomenimis, priėjo prie skirtingų išvadų. Gausas (1795) priskiriamas prie pirmojo metodo taikymo, o Legendre (1805) savarankiškai atrado ir paskelbė jį šiuolaikiniu pavadinimu (fr. Methode des moindres quarres ). Laplasas metodą susiejo su tikimybių teorija, o amerikiečių matematikas Adrainas (1808) svarstė jo tikimybinius pritaikymus. Metodas yra plačiai paplitęs ir patobulintas tolesnių Encke, Bessel, Hansen ir kitų tyrimų.

Alternatyvus MNC naudojimas

Mažiausių kvadratų metodo idėja gali būti naudojama ir kitais atvejais, tiesiogiai nesusijusiais su regresine analize. Faktas yra tas, kad kvadratų suma yra vienas iš labiausiai paplitusių vektorių artumo matų (Euklido metrika baigtinių matmenų erdvėse).

Viena iš taikomųjų programų yra tiesinių lygčių sistemų „sprendimas“, kuriose lygčių skaičius yra didesnis už kintamųjų skaičių.

kur matrica yra ne kvadratinė, o stačiakampė.

Tokia lygčių sistema bendru atveju neturi sprendinio (jei rangas iš tikrųjų yra didesnis už kintamųjų skaičių). Todėl šią sistemą galima „išspręsti“ tik ta prasme, kad pasirenkamas toks vektorius, siekiant sumažinti „atstumą“ tarp vektorių ir . Norėdami tai padaryti, galite taikyti sistemos kairiosios ir dešiniosios lygčių dalių skirtumų kvadratų sumos sumažinimo kriterijų, ty . Nesunku parodyti, kad šios sumažinimo problemos sprendimas lemia šios lygčių sistemos sprendimą

Kuris randa plačiausią pritaikymą įvairiose mokslo ir praktikos srityse. Tai gali būti fizika, chemija, biologija, ekonomika, sociologija, psichologija ir t. t. ir taip toliau. Likimo valia man dažnai tenka susidurti su ekonomika, todėl šiandien pasirūpinsiu jums bilietu į nuostabią šalį, vadinamą Ekonometrija=) ... Kaip tu to nenori?! Ten labai gerai – tereikia apsispręsti! …Tačiau tikriausiai tikrai norite išmokti spręsti problemas mažiausių kvadratų. O ypač stropūs skaitytojai išmoks juos išspręsti ne tik tiksliai, bet ir LABAI GREITAI ;-) Bet pirmiausia bendras problemos išdėstymas+ susijęs pavyzdys:

Tegul rodikliai tiriami kokioje nors dalykinėje srityje, kuri turi kiekybinę išraišką. Tuo pačiu yra pagrindo manyti, kad rodiklis priklauso nuo rodiklio. Ši prielaida gali būti ir mokslinė hipotezė, ir pagrįsta elementariu sveiku protu. Tačiau palikime mokslą nuošalyje ir tyrinėkime patrauklesnes sritis – būtent bakalėjos parduotuves. Pažymėti taip:

– maisto prekių parduotuvės prekybos plotas, kv.m,
- maisto prekių parduotuvės metinė apyvarta, milijonai rublių.

Visiškai aišku, kad kuo didesnis parduotuvės plotas, tuo daugeliu atvejų didesnė jos apyvarta.

Tarkime, atlikę stebėjimus / eksperimentus / skaičiavimus / šokius su tamburinu, turime skaitinius duomenis:

Su bakalėjos parduotuvėmis, manau, viskas aišku: - tai 1-os parduotuvės plotas, - jos metinė apyvarta, - 2-osios parduotuvės plotas, - jos metinė apyvarta ir t.t. Beje, prieiti prie įslaptintos medžiagos visai nebūtina – gana tikslų apyvartos įvertinimą galima gauti naudojant matematinė statistika. Tačiau nesiblaškykite, komercinio šnipinėjimo kursas jau mokamas =)

Lentelinius duomenis taip pat galima rašyti taškų forma ir pavaizduoti mums įprastu būdu. Dekarto sistema .

Atsakykime į svarbų klausimą: kiek balų reikia kokybiniam tyrimui?

Kuo didesnis, tuo geriau. Minimalus leistinas rinkinys susideda iš 5-6 balų. Be to, esant nedideliam duomenų kiekiui, „nenormalūs“ rezultatai neturėtų būti įtraukti į imtį. Taigi, pavyzdžiui, maža elitinė parduotuvė gali padėti daug daugiau nei „jų kolegos“ ir taip iškreipti bendrą modelį, kurį reikia rasti!

Jei tai gana paprasta, turime pasirinkti funkciją, tvarkaraštį kuri eina kuo arčiau taškų . Tokia funkcija vadinama apytikslis (apytikslis - apytikslis) arba teorinė funkcija . Paprastai tariant, čia iš karto atsiranda akivaizdus „pretendentas“ – aukšto laipsnio daugianario, kurio grafikas eina per VISUS taškus. Tačiau ši parinktis yra sudėtinga ir dažnai tiesiog neteisinga. (nes diagrama visą laiką „vėjo“ ir prastai atspindės pagrindinę tendenciją).

Taigi norima funkcija turi būti pakankamai paprasta ir tuo pačiu adekvačiai atspindėti priklausomybę. Kaip jau galima spėti, vienas iš būdų rasti tokias funkcijas vadinamas mažiausių kvadratų. Pirmiausia bendrai panagrinėkime jo esmę. Tegul kuri nors funkcija apytiksliai atitinka eksperimentinius duomenis:


Kaip įvertinti šio aproksimavimo tikslumą? Taip pat apskaičiuokime skirtumus (nukrypimus) tarp eksperimentinių ir funkcinių verčių (mes studijuojame piešinį). Pirma mintis, kuri ateina į galvą, yra įvertinti, kokia suma yra didelė, tačiau problema ta, kad skirtumai gali būti neigiami. (pvz., ) ir nukrypimai dėl tokio sumavimo panaikins vienas kitą. Todėl, kaip aproksimacijos tikslumo įvertinimą, ji siūlo paimti sumą moduliai nukrypimai:

arba sulankstyta forma: (staiga, kas nežino: yra sumos piktograma ir yra pagalbinis kintamasis - "skaitiklis", kuris užima reikšmes nuo 1 iki ).

Aproksimuodami eksperimentinius taškus su skirtingomis funkcijomis, gausime skirtingas reikšmes ir akivaizdu, kad kur ši suma mažesnė, ta funkcija tikslesnė.

Toks metodas egzistuoja ir vadinamas mažiausio modulio metodas. Tačiau praktikoje jis tapo daug plačiau paplitęs. mažiausių kvadratų metodas, kuriame galimos neigiamos reikšmės pašalinamos ne pagal modulį, o padalijus nuokrypius kvadratu:

, po kurio pastangos nukreipiamos į tokios funkcijos parinkimą, kad kvadratinių nuokrypių suma buvo kuo mažesnis. Tiesą sakant, iš čia ir kilo metodo pavadinimas.

Ir dabar grįžtame prie kito svarbaus dalyko: kaip minėta aukščiau, pasirinkta funkcija turėtų būti gana paprasta, tačiau tokių funkcijų taip pat yra daug: linijinis , hiperbolinis, eksponentinis, logaritminis, kvadratinis ir tt Ir, žinoma, čia iš karto norėčiau „sumažinti veiklos sritį“. Kokią funkcijų klasę pasirinkti tyrimui? Primityvi, bet efektyvi technika:

- Lengviausias būdas traukti taškus brėžinyje ir išanalizuokite jų vietą. Jei jie linkę būti tiesia linija, tuomet turėtumėte ieškoti tiesios linijos lygtis su optimaliomis reikšmėmis ir . Kitaip tariant, užduotis yra rasti TOKIUS koeficientus – kad kvadratinių nuokrypių suma būtų mažiausia.

Jei taškai yra, pavyzdžiui, išilgai hiperbolė, tada aišku, kad tiesinė funkcija duos prastą aproksimaciją. Šiuo atveju mes ieškome „palankiausių“ hiperbolės lygties koeficientų - tie, kurie duoda mažiausią kvadratų sumą .

Dabar atkreipkite dėmesį, kad abiem atvejais kalbame apie dviejų kintamųjų funkcijos, kurio argumentai yra ieškojo priklausomybės parinkčių:

O iš esmės reikia išspręsti standartinę problemą – surasti mažiausiai dviejų kintamųjų funkcijos.

Prisiminkite mūsų pavyzdį: tarkime, kad „parduotuvės“ taškai paprastai yra tiesioje linijoje ir yra pagrindo manyti, kad yra tiesinė priklausomybė apyvartos iš prekybos zonos. Raskime TOKIUS koeficientus "a" ir "būti", kad kvadratinių nuokrypių suma buvo mažiausias. Viskas kaip įprasta – pirma I eilės daliniai vediniai. Pagal tiesiškumo taisyklė galite atskirti tiesiai po sumos piktograma:

Jei norite šią informaciją panaudoti rašiniui ar kursiniam darbui, būsiu labai dėkingas už nuorodą šaltinių sąraše, tokių detalių skaičiavimų niekur nerasite:

Sukurkime standartinę sistemą:

Kiekvieną lygtį sumažiname „dviem“ ir, be to, „išskaidome“ sumas:

Pastaba : savarankiškai analizuokite, kodėl „a“ ir „be“ galima išimti iš sumos piktogramos. Beje, formaliai tai galima padaryti su suma

Perrašykime sistemą „taikoma“ forma:

po kurio pradedamas brėžti mūsų problemos sprendimo algoritmas:

Ar žinome taškų koordinates? Mes žinome. Sumos ar galime rasti? Lengva. Mes sudarome paprasčiausią dviejų tiesinių lygčių su dviem nežinomaisiais sistema(„a“ ir „beh“). Mes išsprendžiame sistemą, pvz. Cramerio metodas, todėl susidaro stacionarus taškas . Tikrinama pakankama sąlyga ekstremumui, galime patikrinti, ar šiuo metu funkcija tiksliai pasiekia minimumas. Patikrinimas yra susijęs su papildomais skaičiavimais, todėl paliksime jį užkulisiuose. (jei reikia, trūkstamą kadrą galima peržiūrėti). Padarome galutinę išvadą:

Funkcija geriausias būdas (bent jau lyginant su bet kuria kita tiesine funkcija) priartina eksperimentinius taškus . Grubiai tariant, jo grafikas eina kuo arčiau šių taškų. Pagal tradiciją ekonometrija taip pat vadinama gauta aproksimacinė funkcija suporuota tiesinės regresijos lygtis .

Nagrinėjama problema turi didelę praktinę reikšmę. Mūsų pavyzdyje – lygtis leidžia numatyti, kokia apyvarta ("yig") bus parduotuvėje su vienokia ar kitokia pardavimo ploto verte (viena ar kita "x" reikšmė). Taip, gauta prognozė bus tik prognozė, tačiau daugeliu atvejų ji pasirodys gana tiksli.

Išanalizuosiu tik vieną problemą su „tikraisiais“ skaičiais, nes joje nėra jokių sunkumų - visi skaičiavimai yra 7-8 klasių mokyklos programos lygiu. 95 procentais atvejų jūsų bus paprašyta rasti tiesiog tiesinę funkciją, tačiau pačioje straipsnio pabaigoje parodysiu, kad optimalios hiperbolės, eksponento ir kai kurių kitų funkcijų lygtis nėra sunkiau rasti.

Tiesą sakant, belieka išdalinti žadėtas gėrybes – kad išmoktumėte tokius pavyzdžius išspręsti ne tik tiksliai, bet ir greitai. Atidžiai studijuojame standartą:

Užduotis

Ištyrus ryšį tarp dviejų rodiklių, gautos šios skaičių poros:

Naudodami mažiausių kvadratų metodą, raskite tiesinę funkciją, kuri geriausiai atitinka empirinę funkciją (Patyręs) duomenis. Padarykite brėžinį, kuriame Dekarto stačiakampėje koordinačių sistemoje nubraižykite eksperimentinius taškus ir aproksimacinės funkcijos grafiką . Raskite kvadratinių nuokrypių tarp empirinių ir teorinių verčių sumą. Sužinokite, ar funkcija geresnė (pagal mažiausiųjų kvadratų metodą) apytiksliai eksperimentiniai taškai.

Atkreipkite dėmesį, kad „x“ reikšmės yra natūralios vertybės, ir tai turi būdingą prasmingą reikšmę, apie kurią pakalbėsiu šiek tiek vėliau; bet jie, žinoma, gali būti trupmeniniai. Be to, atsižvelgiant į konkrečios užduoties turinį, „X“ ir „G“ reikšmės gali būti visiškai arba iš dalies neigiamos. Na, mes gavome „beveidę“ užduotį, ir mes ją pradedame sprendimą:

Kaip sistemos sprendimą randame optimalios funkcijos koeficientus:

Siekiant kompaktiškesnio žymėjimo, kintamojo „skaitiklis“ galima praleisti, nes jau aišku, kad sumavimas atliekamas nuo 1 iki .

Patogiau reikiamas sumas apskaičiuoti lentelės forma:


Skaičiavimai gali būti atliekami naudojant mikroskaičiuotuvą, tačiau daug geriau naudoti „Excel“ - tiek greičiau, tiek be klaidų; žiūrėkite trumpą vaizdo įrašą:

Taigi gauname štai ką sistema:

Čia galite padauginti antrą lygtį iš 3 ir iš 1-osios lygties atimkite 2-ąjį dėmenį. Bet tai yra sėkmė – praktikoje sistemos dažnai nėra padovanotos, ir tokiais atvejais tai gelbsti Cramerio metodas:
, todėl sistema turi unikalų sprendimą.

Patikrinkime. Suprantu, kad nenoriu, bet kam praleisti klaidas ten, kur jų tikrai negalima praleisti? Rastą sprendimą pakeiskite kiekvienos sistemos lygties kairėje pusėje:

Gaunamos tinkamos atitinkamų lygčių dalys, o tai reiškia, kad sistema išspręsta teisingai.

Taigi norima aproksimacinė funkcija: – nuo visos tiesinės funkcijos eksperimentinius duomenis geriausiai atitinka jis.

Skirtingai nei tiesiai parduotuvės apyvartos priklausomybė nuo jos ploto, nustatyta priklausomybė yra atvirkščiai (principas "kuo daugiau - tuo mažiau"), ir šį faktą iš karto atskleidžia neigiamas kampo koeficientas. Funkcija informuoja, kad padidėjus tam tikram rodikliui 1 vienetu, priklausomo rodiklio reikšmė mažėja vidutinis 0,65 vnt. Kaip sakoma, kuo didesnė grikių kaina, tuo mažiau parduodama.

Norėdami nubraižyti apytikslę funkciją, randame dvi jos reikšmes:

ir atlikite piešinį:


Sukonstruota linija vadinama tendencijų linija (būtent linijinė tendencijos linija, t. y. bendruoju atveju tendencija nebūtinai yra tiesi linija). Visi žino posakį „būti tendencijoje“, ir manau, kad šiam terminui papildomų komentarų nereikia.

Apskaičiuokite kvadratinių nuokrypių sumą tarp empirinių ir teorinių vertybių. Geometriškai tai yra „raudonųjų“ atkarpų ilgių kvadratų suma (iš kurių du tokie maži, kad net nesimatote).

Apibendrinkime skaičiavimus lentelėje:


Jie vėl gali būti atliekami rankiniu būdu, tik tuo atveju, jei pateiksiu 1 punkto pavyzdį:

bet daug efektyviau daryti jau žinomu būdu:

Pakartokime: kokia rezultato prasmė?visos tiesinės funkcijos funkcija eksponentas yra mažiausias, tai yra, jis yra geriausias aproksimacija savo šeimoje. Ir čia, beje, galutinis problemos klausimas neatsitiktinis: o jeigu siūloma eksponentinė funkcija ar bus geriau apytiksliai eksperimento taškus?

Raskime atitinkamą kvadratinių nuokrypių sumą – kad juos atskirčiau, pažymėsiu raide „epsilon“. Technika lygiai tokia pati:


Ir dar kartą kiekvienam gaisro skaičiavimui 1 taškui:

Programoje „Excel“ naudojame standartinę funkciją EXP (Sintaksę galite rasti „Excel“ žinyne).

Išvestis: , todėl eksponentinė funkcija eksperimentinius taškus aproksimuoja blogiau nei tiesė .

Bet čia reikia pažymėti, kad „blogiau“ yra dar nereiškia, kas blogai. Dabar sukūriau šios eksponentinės funkcijos grafiką – ji taip pat praeina arti taškų - tiek, kad be analitinio tyrimo sunku pasakyti, kuri funkcija tikslesnė.

Tai užbaigia sprendimą, ir aš grįžtu prie ginčo gamtinių vertybių klausimo. Įvairiuose tyrimuose, kaip taisyklė, ekonominiai ar sociologiniai mėnesiai, metai ar kiti vienodi laiko intervalai numeruojami natūraliu „X“. Apsvarstykite, pavyzdžiui, tokią problemą.

Mažiausio kvadrato metodas

Paskutinėje temos pamokoje susipažinsime su garsiausia programa FNP, kuris randa plačiausią pritaikymą įvairiose mokslo ir praktikos srityse. Tai gali būti fizika, chemija, biologija, ekonomika, sociologija, psichologija ir t. t. ir taip toliau. Likimo valia man dažnai tenka susidurti su ekonomika, todėl šiandien pasirūpinsiu jums bilietu į nuostabią šalį, vadinamą Ekonometrija=) ... Kaip tu to nenori?! Ten labai gerai – tereikia apsispręsti! …Tačiau tikriausiai tikrai norite išmokti spręsti problemas mažiausių kvadratų. O ypač stropūs skaitytojai išmoks juos išspręsti ne tik tiksliai, bet ir LABAI GREITAI ;-) Bet pirmiausia bendras problemos išdėstymas+ susijęs pavyzdys:

Tegul rodikliai tiriami kokioje nors dalykinėje srityje, kuri turi kiekybinę išraišką. Tuo pačiu yra pagrindo manyti, kad rodiklis priklauso nuo rodiklio. Ši prielaida gali būti ir mokslinė hipotezė, ir pagrįsta elementariu sveiku protu. Tačiau palikime mokslą nuošalyje ir tyrinėkime patrauklesnes sritis – būtent bakalėjos parduotuves. Pažymėti taip:

– maisto prekių parduotuvės prekybos plotas, kv.m,
- maisto prekių parduotuvės metinė apyvarta, milijonai rublių.

Visiškai aišku, kad kuo didesnis parduotuvės plotas, tuo daugeliu atvejų didesnė jos apyvarta.

Tarkime, atlikę stebėjimus / eksperimentus / skaičiavimus / šokius su tamburinu, turime skaitinius duomenis:

Su bakalėjos parduotuvėmis, manau, viskas aišku: - tai 1-os parduotuvės plotas, - jos metinė apyvarta, - 2-osios parduotuvės plotas, - jos metinė apyvarta ir t.t. Beje, prieiti prie įslaptintos medžiagos visai nebūtina – gana tikslų apyvartos įvertinimą galima gauti naudojant matematinė statistika. Tačiau nesiblaškykite, komercinio šnipinėjimo kursas jau mokamas =)

Lentelinius duomenis taip pat galima rašyti taškų forma ir pavaizduoti mums įprastu būdu. Dekarto sistema .

Atsakykime į svarbų klausimą: kiek balų reikia kokybiniam tyrimui?

Kuo didesnis, tuo geriau. Minimalus leistinas rinkinys susideda iš 5-6 balų. Be to, esant nedideliam duomenų kiekiui, „nenormalūs“ rezultatai neturėtų būti įtraukti į imtį. Taigi, pavyzdžiui, maža elitinė parduotuvė gali padėti daug daugiau nei „jų kolegos“ ir taip iškreipti bendrą modelį, kurį reikia rasti!



Jei tai gana paprasta, turime pasirinkti funkciją, tvarkaraštį kuri eina kuo arčiau taškų . Tokia funkcija vadinama apytikslis (apytikslis - apytikslis) arba teorinė funkcija . Paprastai tariant, čia iš karto atsiranda akivaizdus „pretendentas“ – aukšto laipsnio daugianario, kurio grafikas eina per VISUS taškus. Tačiau ši parinktis yra sudėtinga ir dažnai tiesiog neteisinga. (nes diagrama visą laiką „vėjo“ ir prastai atspindės pagrindinę tendenciją).

Taigi norima funkcija turi būti pakankamai paprasta ir tuo pačiu adekvačiai atspindėti priklausomybę. Kaip jau galima spėti, vienas iš būdų rasti tokias funkcijas vadinamas mažiausių kvadratų. Pirmiausia bendrai panagrinėkime jo esmę. Tegul kuri nors funkcija apytiksliai atitinka eksperimentinius duomenis:


Kaip įvertinti šio aproksimavimo tikslumą? Taip pat apskaičiuokime skirtumus (nukrypimus) tarp eksperimentinių ir funkcinių verčių (mes studijuojame piešinį). Pirma mintis, kuri ateina į galvą, yra įvertinti, kokia suma yra didelė, tačiau problema ta, kad skirtumai gali būti neigiami. (pvz., ) ir nukrypimai dėl tokio sumavimo panaikins vienas kitą. Todėl, kaip aproksimacijos tikslumo įvertinimą, ji siūlo paimti sumą moduliai nukrypimai:

arba sulankstyta forma: (nežinantiems: yra sumos piktograma ir - pagalbinis kintamasis - "skaitiklis", kuris ima reikšmes nuo 1 iki ) .

Apytiksliai eksperimentinius taškus su skirtingomis funkcijomis gausime skirtingas reikšmes, ir akivaizdu, kur ši suma mažesnė – ta funkcija tikslesnė.

Toks metodas egzistuoja ir vadinamas mažiausio modulio metodas. Tačiau praktikoje jis tapo daug plačiau paplitęs. mažiausių kvadratų metodas, kuriame galimos neigiamos reikšmės pašalinamos ne pagal modulį, o padalijus nuokrypius kvadratu:



, po kurio pastangos nukreipiamos į tokios funkcijos parinkimą, kad kvadratinių nuokrypių suma buvo kuo mažesnis. Tiesą sakant, iš čia ir kilo metodo pavadinimas.

Ir dabar grįžtame prie kito svarbaus dalyko: kaip minėta aukščiau, pasirinkta funkcija turėtų būti gana paprasta, tačiau tokių funkcijų taip pat yra daug: linijinis , hiperbolinis , eksponentinis , logaritminis , kvadratinis ir tt Ir, žinoma, čia iš karto norėčiau „sumažinti veiklos sritį“. Kokią funkcijų klasę pasirinkti tyrimui? Primityvi, bet efektyvi technika:

- Lengviausias būdas traukti taškus brėžinyje ir išanalizuokite jų vietą. Jei jie linkę būti tiesia linija, tuomet turėtumėte ieškoti tiesios linijos lygtis su optimaliomis reikšmėmis ir . Kitaip tariant, užduotis yra rasti TOKIUS koeficientus – kad kvadratinių nuokrypių suma būtų mažiausia.

Jei taškai yra, pavyzdžiui, išilgai hiperbolė, tada aišku, kad tiesinė funkcija duos prastą aproksimaciją. Šiuo atveju mes ieškome „palankiausių“ hiperbolės lygties koeficientų - tie, kurie duoda mažiausią kvadratų sumą .

Dabar atkreipkite dėmesį, kad abiem atvejais kalbame apie dviejų kintamųjų funkcijos, kurio argumentai yra ieškojo priklausomybės parinkčių:

O iš esmės reikia išspręsti standartinę problemą – surasti mažiausiai dviejų kintamųjų funkcijos.

Prisiminkite mūsų pavyzdį: tarkime, kad „parduotuvės“ taškai paprastai yra tiesioje linijoje ir yra pagrindo manyti, kad yra tiesinė priklausomybė apyvartos iš prekybos zonos. Raskime TOKIUS koeficientus "a" ir "būti", kad kvadratinių nuokrypių suma buvo mažiausias. Viskas kaip įprasta – pirma I eilės daliniai vediniai. Pagal tiesiškumo taisyklė galite atskirti tiesiai po sumos piktograma:

Jei norite šią informaciją panaudoti rašiniui ar kursiniam darbui, būsiu labai dėkingas už nuorodą šaltinių sąraše, tokių detalių skaičiavimų niekur nerasite:

Sukurkime standartinę sistemą:

Kiekvieną lygtį sumažiname „dviem“ ir, be to, „išskaidome“ sumas:

Pastaba : savarankiškai analizuokite, kodėl „a“ ir „be“ galima išimti iš sumos piktogramos. Beje, formaliai tai galima padaryti su suma

Perrašykime sistemą „taikoma“ forma:

po kurio pradedamas brėžti mūsų problemos sprendimo algoritmas:

Ar žinome taškų koordinates? Mes žinome. Sumos ar galime rasti? Lengva. Mes sudarome paprasčiausią dviejų tiesinių lygčių su dviem nežinomaisiais sistema(„a“ ir „beh“). Mes išsprendžiame sistemą, pvz. Cramerio metodas, todėl susidaro stacionarus taškas . Tikrinama pakankama sąlyga ekstremumui, galime patikrinti, ar šiuo metu funkcija tiksliai pasiekia minimumas. Patikrinimas yra susijęs su papildomais skaičiavimais, todėl paliksime jį užkulisiuose. (jei reikia, trūkstamą kadrą galima peržiūrėtičia ) . Padarome galutinę išvadą:

Funkcija geriausias būdas (bent jau lyginant su bet kuria kita tiesine funkcija) priartina eksperimentinius taškus . Grubiai tariant, jo grafikas eina kuo arčiau šių taškų. Pagal tradiciją ekonometrija taip pat vadinama gauta aproksimacinė funkcija suporuota tiesinės regresijos lygtis .

Nagrinėjama problema turi didelę praktinę reikšmę. Mūsų pavyzdyje – lygtis leidžia numatyti, kokia apyvarta ("yig") bus parduotuvėje su vienokia ar kitokia pardavimo ploto verte (viena ar kita "x" reikšmė). Taip, gauta prognozė bus tik prognozė, tačiau daugeliu atvejų ji pasirodys gana tiksli.

Išanalizuosiu tik vieną problemą su „tikraisiais“ skaičiais, nes joje nėra jokių sunkumų - visi skaičiavimai yra 7-8 klasių mokyklos programos lygiu. 95 procentais atvejų jūsų bus paprašyta rasti tiesiog tiesinę funkciją, tačiau pačioje straipsnio pabaigoje parodysiu, kad optimalios hiperbolės, eksponento ir kai kurių kitų funkcijų lygtis nėra sunkiau rasti.

Tiesą sakant, belieka išdalinti žadėtas gėrybes – kad išmoktumėte tokius pavyzdžius išspręsti ne tik tiksliai, bet ir greitai. Atidžiai studijuojame standartą:

Užduotis

Ištyrus ryšį tarp dviejų rodiklių, gautos šios skaičių poros:

Naudodami mažiausių kvadratų metodą, raskite tiesinę funkciją, kuri geriausiai atitinka empirinę funkciją (Patyręs) duomenis. Padarykite brėžinį, kuriame Dekarto stačiakampėje koordinačių sistemoje nubraižykite eksperimentinius taškus ir aproksimacinės funkcijos grafiką . Raskite kvadratinių nuokrypių tarp empirinių ir teorinių verčių sumą. Sužinokite, ar funkcija geresnė (pagal mažiausiųjų kvadratų metodą) apytiksliai eksperimentiniai taškai.

Atkreipkite dėmesį, kad „x“ reikšmės yra natūralios vertybės, ir tai turi būdingą prasmingą reikšmę, apie kurią pakalbėsiu šiek tiek vėliau; bet jie, žinoma, gali būti trupmeniniai. Be to, atsižvelgiant į konkrečios užduoties turinį, „X“ ir „G“ reikšmės gali būti visiškai arba iš dalies neigiamos. Na, mes gavome „beveidę“ užduotį, ir mes ją pradedame sprendimą:

Kaip sistemos sprendimą randame optimalios funkcijos koeficientus:

Siekiant kompaktiškesnio žymėjimo, kintamojo „skaitiklis“ galima praleisti, nes jau aišku, kad sumavimas atliekamas nuo 1 iki .

Patogiau reikiamas sumas apskaičiuoti lentelės forma:


Skaičiavimai gali būti atliekami naudojant mikroskaičiuotuvą, tačiau daug geriau naudoti „Excel“ - tiek greičiau, tiek be klaidų; žiūrėkite trumpą vaizdo įrašą:

Taigi gauname štai ką sistema:

Čia galite padauginti antrą lygtį iš 3 ir iš 1-osios lygties atimkite 2-ąjį dėmenį. Bet tai yra sėkmė – praktikoje sistemos dažnai nėra padovanotos, ir tokiais atvejais tai gelbsti Cramerio metodas:
, todėl sistema turi unikalų sprendimą.

Patikrinkime. Suprantu, kad nenoriu, bet kam praleisti klaidas ten, kur jų tikrai negalima praleisti? Rastą sprendimą pakeiskite kiekvienos sistemos lygties kairėje pusėje:

Gaunamos tinkamos atitinkamų lygčių dalys, o tai reiškia, kad sistema išspręsta teisingai.

Taigi norima aproksimacinė funkcija: – nuo visos tiesinės funkcijos eksperimentinius duomenis geriausiai atitinka jis.

Skirtingai nei tiesiai parduotuvės apyvartos priklausomybė nuo jos ploto, nustatyta priklausomybė yra atvirkščiai (principas "kuo daugiau - tuo mažiau"), ir šį faktą iš karto atskleidžia neigiamas kampo koeficientas. Funkcija informuoja, kad padidėjus tam tikram rodikliui 1 vienetu, priklausomo rodiklio reikšmė mažėja vidutinis 0,65 vnt. Kaip sakoma, kuo didesnė grikių kaina, tuo mažiau parduodama.

Norėdami nubraižyti apytikslę funkciją, randame dvi jos reikšmes:

ir atlikite piešinį:

Sukonstruota linija vadinama tendencijų linija (būtent linijinė tendencijos linija, t. y. bendruoju atveju tendencija nebūtinai yra tiesi linija). Visi žino posakį „būti tendencijoje“, ir manau, kad šiam terminui papildomų komentarų nereikia.

Apskaičiuokime kvadratinių nuokrypių tarp empirinių ir teorinių verčių sumą. Geometriškai tai yra „raudonųjų“ atkarpų ilgių kvadratų suma (iš kurių du tokie maži, kad net nesimatote).

Apibendrinkime skaičiavimus lentelėje:


Jie vėl gali būti atliekami rankiniu būdu, tik tuo atveju, jei pateiksiu 1 punkto pavyzdį:

bet daug efektyviau daryti jau žinomu būdu:

Pakartokime: kokia rezultato prasmė?visos tiesinės funkcijos funkcija eksponentas yra mažiausias, tai yra, jis yra geriausias aproksimacija savo šeimoje. Ir čia, beje, galutinis problemos klausimas neatsitiktinis: o jeigu siūloma eksponentinė funkcija ar bus geriau apytiksliai eksperimento taškus?

Raskime atitinkamą kvadratinių nuokrypių sumą – kad juos atskirčiau, pažymėsiu raide „epsilon“. Technika lygiai tokia pati:


Ir dar kartą kiekvienam gaisro skaičiavimui 1 taškui:

Programoje „Excel“ naudojame standartinę funkciją EXP (Sintaksę galite rasti „Excel“ žinyne).

Išvestis: , todėl eksponentinė funkcija eksperimentinius taškus aproksimuoja blogiau nei tiesė .

Bet čia reikia pažymėti, kad „blogiau“ yra dar nereiškia, kas blogai. Dabar sukūriau šios eksponentinės funkcijos grafiką – ji taip pat praeina arti taškų - tiek, kad be analitinio tyrimo sunku pasakyti, kuri funkcija tikslesnė.

Tai užbaigia sprendimą, ir aš grįžtu prie ginčo gamtinių vertybių klausimo. Įvairiuose tyrimuose, kaip taisyklė, ekonominiai ar sociologiniai mėnesiai, metai ar kiti vienodi laiko intervalai numeruojami natūraliu „X“. Apsvarstykite, pavyzdžiui, šią problemą:

Turime šiuos duomenis apie parduotuvės mažmeninę apyvartą pirmąjį pusmetį:

Naudodami tiesiosios linijos analitinį lygiavimą raskite liepos mėnesio pardavimo apimtį.

Taip, ne bėda: numeruojame mėnesius 1, 2, 3, 4, 5, 6 ir naudojame įprastą algoritmą, ko pasekoje gauname lygtį – vienintelis dalykas, kai kalbama apie laiką, dažniausiai yra raidė „te “ (nors tai nėra kritiška). Gauta lygtis rodo, kad pirmąjį pusmetį apyvarta vidutiniškai padidėjo 27,74 CU. per mėnesį. Gaukite liepos mėnesio prognozę (7 mėnuo): e.u.

Ir panašios užduotys – tamsa tamsu. Norintys gali pasinaudoti papildoma paslauga, būtent mano Excel skaičiuoklė (demo versija), kuris beveik akimirksniu išsprendžia problemą! Yra darbinė programos versija mainais arba už simbolinis mokėjimas.

Pamokos pabaigoje trumpa informacija apie kai kurių kitų tipų priklausomybių radimą. Tiesą sakant, nėra ką ypatingo pasakyti, nes pagrindinis požiūris ir sprendimo algoritmas išlieka tie patys.

Tarkime, kad eksperimentinių taškų vieta primena hiperbolę. Tada, norint rasti geriausios hiperbolės koeficientus, reikia rasti funkcijos minimumą – norintys gali atlikti detalius skaičiavimus ir ateiti prie panašios sistemos:

Formaliu techniniu požiūriu jis gaunamas iš „linijinės“ sistemos (pažymėkime žvaigždute)"x" pakeitimas į . Na, tiesiog apskaičiuokite sumas, po kurių iki optimalių koeficientų "a" ir "būti" rankoje.

Jei yra pagrindo manyti, kad taškai yra išdėstyti pagal logaritminę kreivę, tada ieškoti optimalių verčių ir rasti funkcijos minimumą . Formaliai sistemoje (*) turėtų būti pakeista taip:

Skaičiuodami „Excel“, naudokite funkciją LN. Prisipažįstu, kad kiekvienam iš nagrinėjamų atvejų man nebus sunku sukurti skaičiuotuvus, bet vis tiek bus geriau, jei skaičiavimus „užprogramuosite“ patys. Video pamokos, padėsiančios.

Esant eksponentinei priklausomybei, situacija yra šiek tiek sudėtingesnė. Norėdami sumažinti dalyką iki tiesinio atvejo, imame funkcijos ir naudojimo logaritmą logaritmo savybės:

Dabar, lygindami gautą funkciją su tiesine funkcija , darome išvadą, kad sistemoje (*) turi būti pakeista , ir - . Patogumui pažymime:

Atkreipkite dėmesį, kad sistema yra išspręsta ir atžvilgiu, todėl, suradę šaknis, turite nepamiršti surasti ir paties koeficiento.

Norėdami apytiksliai įvertinti eksperimentinius taškus reikia rasti optimalią parabolę mažiausiai trijų kintamųjų funkcijos. Atlikę standartinius veiksmus, gauname tokį „veikia“ sistema:

Taip, žinoma, čia yra daugiau sumų, tačiau naudojant mėgstamą programą nėra jokių sunkumų. Ir galiausiai aš jums pasakysiu, kaip greitai patikrinti naudojant „Excel“ ir sukurti norimą tendencijų liniją: sukurti sklaidos diagramą, pele pasirinkti bet kurį iš taškų. ir dešiniuoju pelės mygtuku spustelėkite parinktį "Pridėti tendencijų liniją". Tada pasirinkite diagramos tipą ir skirtuke "Parametrai" suaktyvinkite parinktį „Rodyti lygtį diagramoje“. Gerai

Kaip visada, noriu baigti straipsnį gražia fraze ir beveik įvedžiau „Būk tendencijoje!“. Tačiau laikui bėgant jis persigalvojo. Ir ne todėl, kad tai yra formulė. Nežinau kaip kas, bet visai nenoriu sekti propaguojamomis Amerikos ir ypač europietiškomis tendencijomis =) Todėl linkiu kiekvienam laikytis savo linijos!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

Mažiausių kvadratų metodas yra vienas iš labiausiai paplitusių ir labiausiai išvystytas dėl jo tiesinių ekonometrinių modelių parametrų įvertinimo metodų paprastumas ir efektyvumas. Tuo pačiu metu jį naudojant reikia laikytis tam tikro atsargumo, nes naudojant jį sukurti modeliai gali neatitikti daugelio savo parametrų kokybės reikalavimų ir dėl to „negerai“ atspindėti proceso raidos modelius.

Išsamiau panagrinėkime tiesinio ekonometrinio modelio parametrų įvertinimo taikant mažiausių kvadratų metodą procedūrą. Tokį modelį bendra forma galima pavaizduoti (1.2) lygtimi:

y t = a 0 + a 1 x 1t +...+ a n x nt + ε t .

Pradiniai duomenys vertinant parametrus a 0 , a 1 ,..., a n yra priklausomo kintamojo reikšmių vektorius y= (y 1 , y 2 , ... , y T)" ir nepriklausomų kintamųjų reikšmių matrica

kuriame pirmasis stulpelis, susidedantis iš vienetų, atitinka modelio koeficientą .

Mažiausių kvadratų metodas gavo savo pavadinimą remiantis pagrindiniu principu, kad jo pagrindu gauti parametrų įverčiai turi atitikti: modelio paklaidos kvadratų suma turi būti minimali.

Užduočių sprendimo mažiausių kvadratų metodu pavyzdžiai

2.1 pavyzdys. Prekybos įmonė turi 12 parduotuvių tinklą, apie kurių veiklą informacija pateikta lentelėje. 2.1.

Įmonės vadovybė norėtų sužinoti, kaip metinės apyvartos dydis priklauso nuo parduotuvės prekybinio ploto.

2.1 lentelė

Parduotuvės numeris Metinė apyvarta, milijonai rublių Prekybos plotas, tūkst.m 2
19,76 0,24
38,09 0,31
40,95 0,55
41,08 0,48
56,29 0,78
68,51 0,98
75,01 0,94
89,05 1,21
91,13 1,29
91,26 1,12
99,84 1,29
108,55 1,49

Mažiausių kvadratų sprendimas. Nurodykime - metinės parduotuvės apyvartą, milijonus rublių; - parduotuvės prekybos plotas, tūkst.m2.

2.1 pav. 2.1 pavyzdžio sklaida

Nustatyti funkcinio ryšio tarp kintamųjų formą ir sudaryti sklaidos diagramą (2.1 pav.).

Remiantis sklaidos diagrama, galime daryti išvadą, kad metinė apyvarta teigiamai priklauso nuo pardavimo ploto (t.y. y didės augant ). Tinkamiausia funkcinio ryšio forma yra linijinis.

Informacija apie tolesnius skaičiavimus pateikta lentelėje. 2.2. Naudodami mažiausių kvadratų metodą, įvertiname tiesinio vieno koeficiento ekonometrinio modelio parametrus

2.2 lentelė

t y t x 1t y t 2 x1t2 x 1t y t
19,76 0,24 390,4576 0,0576 4,7424
38,09 0,31 1450,8481 0,0961 11,8079
40,95 0,55 1676,9025 0,3025 22,5225
41,08 0,48 1687,5664 0,2304 19,7184
56,29 0,78 3168,5641 0,6084 43,9062
68,51 0,98 4693,6201 0,9604 67,1398
75,01 0,94 5626,5001 0,8836 70,5094
89,05 1,21 7929,9025 1,4641 107,7505
91,13 1,29 8304,6769 1,6641 117,5577
91,26 1,12 8328,3876 1,2544 102,2112
99,84 1,29 9968,0256 1,6641 128,7936
108,55 1,49 11783,1025 2,2201 161,7395
S 819,52 10,68 65008,554 11,4058 858,3991
Vidutinis 68,29 0,89

Taigi,

Todėl prekybos plotui padidėjus 1 tūkst. m 2, o kitiems rodikliams nesikeičiant, vidutinė metinė apyvarta padidėja 67,8871 mln. rublių.

2.2 pavyzdys.Įmonės vadovybė pastebėjo, kad metinė apyvarta priklauso ne tik nuo parduotuvės prekybos ploto (žr. 2.1 pavyzdį), bet ir nuo vidutinio lankytojų skaičiaus. Atitinkama informacija pateikta lentelėje. 2.3.

2.3 lentelė

Sprendimas. Pažymėkite - vidutinis parduotuvės lankytojų skaičius per dieną, tūkst. žmonių.

Nustatyti funkcinio ryšio tarp kintamųjų formą ir sudaryti sklaidos diagramą (2.2 pav.).

Remiantis sklaidos diagrama, galime daryti išvadą, kad metinė apyvarta yra teigiamai susijusi su vidutiniu lankytojų skaičiumi per dieną (t.y. y didės augant ). Funkcinės priklausomybės forma yra tiesinė.

Ryžiai. 2.2. Taškinė diagrama, pavyzdžiui, 2.2

2.4 lentelė

t x 2t x 2t 2 yt x 2t x 1t x 2t
8,25 68,0625 163,02 1,98
10,24 104,8575 390,0416 3,1744
9,31 86,6761 381,2445 5,1205
11,01 121,2201 452,2908 5,2848
8,54 72,9316 480,7166 6,6612
7,51 56,4001 514,5101 7,3598
12,36 152,7696 927,1236 11,6184
10,81 116,8561 962,6305 13,0801
9,89 97,8121 901,2757 12,7581
13,72 188,2384 1252,0872 15,3664
12,27 150,5529 1225,0368 15,8283
13,92 193,7664 1511,016 20,7408
S 127,83 1410,44 9160,9934 118,9728
Vidutinis 10,65

Apskritai būtina nustatyti dviejų faktorių ekonometrinio modelio parametrus

y t \u003d a 0 + a 1 x 1t + a 2 x 2t + ε t

Informacija, reikalinga tolesniems skaičiavimams, pateikta lentelėje. 2.4.

Įvertinkime tiesinio dviejų faktorių ekonometrinio modelio parametrus mažiausių kvadratų metodu.

Taigi,

Įvertinus koeficientą = 61,6583, matyti, kad, esant kitoms sąlygoms, prekybos plotui padidėjus 1 tūkst. m 2, metinė apyvarta padidės vidutiniškai 61,6583 mln.

Koeficiento įvertis = 2,2748 rodo, kad esant kitoms sąlygoms, didėjant vidutiniam lankytojų skaičiui, tenkančiam 1 tūkst. per dieną metinė apyvarta padidės vidutiniškai 2,2748 mln.

2.3 pavyzdys. Naudojant lentelėje pateiktą informaciją. 2.2 ir 2.4, įvertinti vienfaktorinio ekonometrinio modelio parametrą

kur yra centrinė -osios parduotuvės metinės apyvartos vertė, milijonai rublių; - t-osios parduotuvės vidutinio dienos lankytojų skaičiaus centre, tūkst. žmonių. (žr. 2.1-2.2 pavyzdžius).

Sprendimas. Papildoma informacija, reikalinga skaičiavimams, pateikta lentelėje. 2.5.

2.5 lentelė

-48,53 -2,40 5,7720 116,6013
-30,20 -0,41 0,1702 12,4589
-27,34 -1,34 1,8023 36,7084
-27,21 0,36 0,1278 -9,7288
-12,00 -2,11 4,4627 25,3570
0,22 -3,14 9,8753 -0,6809
6,72 1,71 2,9156 11,4687
20,76 0,16 0,0348 3,2992
22,84 -0,76 0,5814 -17,413
22,97 3,07 9,4096 70,4503
31,55 1,62 2,6163 51,0267
40,26 3,27 10,6766 131,5387
Suma 48,4344 431,0566

Naudodami (2.35) formulę gauname

Taigi,

http://www.cleverstudents.ru/articles/mnk.html

Pavyzdys.

Eksperimentiniai duomenys apie kintamųjų reikšmes X ir adresu pateikiami lentelėje.

Dėl jų išlyginimo funkcija

Naudojant mažiausių kvadratų metodas, apytiksliai apskaičiuokite šiuos duomenis tiesine priklausomybe y=kirvis+b(raskite parinktis a ir b). Sužinokite, kuri iš dviejų eilučių yra geresnė (mažiausių kvadratų metodo prasme) sulygina eksperimentinius duomenis. Padarykite piešinį.

Sprendimas.

Mūsų pavyzdyje n=5. Lentelę užpildome, kad būtų patogiau apskaičiuoti sumas, kurios yra įtrauktos į reikalingų koeficientų formules.

Ketvirtoje lentelės eilutėje esančios reikšmės gaunamos 2-os eilutės reikšmes padauginus iš 3-osios kiekvieno skaičiaus reikšmių i.

Penktosios lentelės eilutės reikšmės gaunamos 2-os eilutės reikšmes padalijus į kvadratą kiekvienam skaičiui i.

Paskutinio lentelės stulpelio reikšmės yra reikšmių visose eilutėse sumos.

Koeficientams rasti naudojame mažiausių kvadratų metodo formules a ir b. Juose pakeičiame atitinkamas vertes iš paskutinio lentelės stulpelio:

Vadinasi, y=0,165x+2,184 yra norima apytikslė tiesi linija.

Belieka išsiaiškinti, kuri iš eilučių y=0,165x+2,184 arba geriau apytiksliai atitinka pirminius duomenis, t. y. atlikti įvertinimą naudojant mažiausių kvadratų metodą.

Įrodymas.

Taip kad radus a ir b funkcija įgauna mažiausią reikšmę, būtina, kad šioje vietoje funkcijos antros eilės diferencialo kvadratinės formos matrica buvo teigiamas. Parodykime.

Antrosios eilės skirtumas turi tokią formą:

Tai yra

Todėl kvadratinės formos matrica turi formą

ir elementų reikšmės nepriklauso a ir b.

Parodykime, kad matrica yra teigiama apibrėžtoji. Tam reikia, kad kampas minoras būtų teigiamas.

Pirmos eilės kampinis minoras . Nelygybė yra griežta, nes taškai

3. Funkcijų aproksimacija naudojant metodą

mažiausių kvadratų

Apdorojant eksperimento rezultatus naudojamas mažiausių kvadratų metodas apytiksliai (apytiksliai) eksperimentiniai duomenys analitinė formulė. Konkreti formulės forma paprastai parenkama remiantis fiziniais sumetimais. Šios formulės gali būti:

kitas.

Mažiausių kvadratų metodo esmė yra tokia. Tegul matavimo rezultatai pateikiami lentelėje:

Lentelė 4

x n

y n

(3.1)

kur f yra žinoma funkcija, a 0, a 1, …, a m - nežinomi pastovūs parametrai, kurių reikšmes reikia rasti. Mažiausių kvadratų metodu funkcijos (3.1) aproksimacija eksperimentinei priklausomybei laikoma geriausia, jei sąlyga

(3.2)

tai yra sumos a norimos analitinės funkcijos nuokrypiai kvadratu nuo eksperimentinės priklausomybės turėtų būti minimalūs .

Atkreipkite dėmesį, kad funkcija K paskambino inviscidinis.


Nuo neatitikimo

tada jis turi minimumą. Būtina kelių kintamųjų funkcijos minimumo sąlyga yra visų šios funkcijos dalinių išvestinių parametrų lygybė su nuliu. Taigi, surandant geriausias aproksimacinės funkcijos (3.1) parametrų reikšmes, ty tas vertes, kurioms Q = Q (a 0 , a 1 , …, a m ) yra minimalus, redukuojasi iki lygčių sistemos sprendimo:

(3.3)

Mažiausių kvadratų metodą galima interpretuoti taip: tarp begalinės tam tikro tipo tiesių šeimos randama viena tiesė, kuriai suskaičiuojama eksperimentinių taškų ir atitinkamų taškų ordinačių skirtumų kvadratu suma. rasta pagal šios tiesės lygtį bus mažiausia.

Tiesinės funkcijos parametrų radimas

Tegul eksperimentiniai duomenys pateikiami tiesine funkcija:

Būtina pasirinkti tokias vertes a ir b , kuriai skirta funkcija

(3.4)

bus minimalus. Būtinos funkcijos minimumo sąlygos (3.4) redukuojamos į lygčių sistemą:

Po transformacijų gauname dviejų tiesinių lygčių su dviem nežinomaisiais sistemą:

(3.5)

tai išspręsdami randame norimas parametrų reikšmes a ir b.

Kvadratinės funkcijos parametrų radimas

Jei aproksimacinė funkcija yra kvadratinė priklausomybė

tada jo parametrai a , b , c raskite iš minimalios funkcijos sąlygos:

(3.6)

Funkcijos (3.6) minimalios sąlygos sumažinamos iki lygčių sistemos:


Po transformacijų gauname trijų tiesinių lygčių sistemą su trimis nežinomaisiais:

(3.7)

adresu spręsdami randame norimas parametrų reikšmes a , b ir c .

Pavyzdys . Tegul eksperimento rezultatas yra tokia verčių lentelė x ir y:

Lentelė 5

y i

0,705

0,495

0,426

0,357

0,368

0,406

0,549

0,768

Eksperimentinius duomenis reikia aproksimuoti tiesinėmis ir kvadratinėmis funkcijomis.

Sprendimas. Aproksimuojančių funkcijų parametrų radimas redukuojasi į tiesinių lygčių (3.5) ir (3.7) sistemų sprendimą. Norėdami išspręsti problemą, naudojame skaičiuoklės procesorių Excel.

1. Pirmiausia susiejame 1 ir 2 lapus. Įveskite eksperimentines reikšmes x i ir y iį kolonas A ir B, pradedant nuo antros eilutės (pirmoje eilutėje dedame stulpelių antraštes). Tada apskaičiuojame šių stulpelių sumas ir dedame į dešimtą eilutę.

C–G stulpeliuose atitinkamai padėkite apskaičiavimą ir sumavimą

2. Atkabinkite lakštus. Tolesni skaičiavimai bus atliekami panašiu būdu tiesinei priklausomybei nuo 1 lapo ir kvadratinei priklausomybei nuo 2 lapo.

3. Po gauta lentele sudarome koeficientų matricą ir laisvųjų dėmenų stulpelio vektorių. Išspręskime tiesinių lygčių sistemą pagal tokį algoritmą:

Norėdami apskaičiuoti atvirkštinę matricą ir padauginti matricas, naudojame Meistras funkcijas ir funkcijas MOBR ir MUMNOŽAS.

4. Langelių bloke H2: H 9 pagal gautus koeficientus apskaičiuojame apytikslės vertės daugianarioy i skaičiuok., I bloke 2: I 9 - nukrypimai D y i = y i exp. - y i skaičiuok., J stulpelyje – neatitikimas:

Lentelės gautos ir pagamintos naudojant Diagramų vedliai diagramos parodytos 6, 7, 8 paveiksluose.


Ryžiai. 6. Lentelė tiesinės funkcijos koeficientams apskaičiuoti,

apytikslis eksperimentiniai duomenys.


Ryžiai. 7. Kvadratinės funkcijos koeficientų skaičiavimo lentelė,

apytiksliseksperimentiniai duomenys.


Ryžiai. 8. Aproksimacijos rezultatų grafinis pavaizdavimas

eksperimentinių duomenų tiesinės ir kvadratinės funkcijos.

Atsakymas. Eksperimentiniai duomenys buvo aproksimuoti tiesine priklausomybe y = 0,07881 x + 0,442262 su likutine K = 0,165167 ir kvadratinė priklausomybė y = 3,115476 x 2 – 5,2175 x + 2,529631 su likutine K = 0,002103 .

Užduotys. Aproksimuokite funkciją, pateiktą lentelės, tiesinės ir kvadratinės funkcijos.

6 lentelė

№0

x

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

y

3,030

3,142

3,358

3,463

3,772

3,251

3,170

3,665

1

3,314

3,278

3,262

3,292

3,332

3,397

3,487

3,563

2

1,045

1,162

1,264

1,172

1,070

0,898

0,656

0,344

3

6,715

6,735

6,750

6,741

6,645

6,639

6,647

6,612

4

2,325

2,515

2,638

2,700

2,696

2,626

2,491

2,291

5

1.752

1,762

1,777

1,797

1,821

1,850

1,884

1,944

6

1,924

1,710

1,525

1,370

1,264

1,190

1,148

1,127

7

1,025

1,144

1,336

1,419

1,479

1,530

1,568

1,248

8

5,785

5,685

5,605

5,545

5,505

5,480

5,495

5,510

9

4,052

4,092

4,152

4,234

4,338

4,468

4,599