Statisztikai modell: a módszer lényege, felépítése és elemzése

A statisztikai modell egy matematikai vetület, amely különböző feltételezések halmazát testesíti meg egyes mintaadatok előállításával kapcsolatban. , ezt a kifejezést gyakran jelentősen idealizált formában mutatják be.

A statisztikai modellben kifejezett feltételezések valószínűségi eloszlások halmazát mutatják. Ezek közül sok, amint azt feltételezzük, helyesen közelíti meg azt az eloszlást, amelyből egy bizonyos információkészlet van kiválasztva. , a statisztikai modellekre jellemző valószínűségi eloszlások különböztetik meg a vetületet a többi matematikai módosítástól.

Általános vetítés

folyamatok statisztikai modelljei

A matematikai modell egy olyan rendszer leírása, amely bizonyos fogalmakat és nyelvet használ. Alkalmazzák a természettudományokban (mint például a fizika, a biológia, a földtudomány, a kémia) és a mérnöki tudományágakban (mint például a számítástechnika, az elektrotechnika), valamint a társadalomtudományokban (mint például a közgazdaságtan, a pszichológia, a szociológia, a politológia).

A modell segíthet megmagyarázni a rendszert, tanulmányozni a különböző összetevők hatását, valamint előrejelzéseket készíteni a viselkedésről.

A matematikai modellek különféle formákat ölthetnek, beleértve a dinamikus rendszereket, statisztikai vetületeket, differenciálegyenleteket vagy játékelméleti paramétereket. Ezek és más típusok átfedésben lehetnek, és ez a modell számos absztrakt struktúrát tartalmaz. Általában a matematikai vetületek logikai összetevőket tartalmazhatnak. Sok esetben a tudományos terület minősége attól függ, hogy az elméleti oldalról kifejlesztett matematikai modellek mennyire értenek egyet az ismételt kísérletek eredményeivel. Az elméleti folyamatok és a kísérleti mérések közötti egyetértés hiánya gyakran fontos előrelépésekhez vezet, mivel fejlettebb elméletek alakulnak ki.

A fizikai tudományokban a hagyományos matematikai modell a következő elemek nagy számát tartalmazza:

  • Ellenőrző egyenletek.
  • További almodellek.
  • Az egyenletek meghatározása.
  • Alkotó egyenletek.
  • Feltételezések és korlátozások.
  • Kezdeti és határfeltételek.
  • Klasszikus kényszerek és kinematikus egyenletek.

Képlet

A statisztikai modellt általában matematikai egyenletek adják, amelyek egy vagy több véletlen változót, esetleg más természetesen előforduló változókat kombinálnak. Hasonlóképpen, a vetítést "formális koncepciónak"tekintik.

Minden statisztikai hipotézis tesztek és statisztikai becslések szerzett matematikai modellek.

Bevezetés

statisztikai matematikai modellek

Informálisan egy statisztikai modell feltételezésnek (vagy feltételezések halmazának) tekinthető egy bizonyos tulajdonsággal: lehetővé teszi bármely esemény valószínűségének kiszámítását. Példaként tekinthetünk egy pár közönséges hatszögletű kockát. , két különböző statisztikai feltételezést kell tanulmányozni a kockáról.

Az első feltételezés a következő:

Az egyes kocka, a valószínűsége, hogy az egyik szám esik ki (1, 2, 3, 4, 5, és 6) jelentése: 1/6.

Ebből a feltételezésből kiszámíthatjuk mindkét kocka valószínűségét: 1: 1/6 6/6=1/36.

Általánosabban, bármely esemény valószínűségét ki lehet számítani. Meg kell azonban érteni, hogy lehetetlen kiszámítani bármely más nem triviális esemény valószínűségét.

Csak az első vélemény gyűjt statisztikai matematikai modellt: annak a ténynek köszönhetően, hogy csak egy feltételezéssel lehet meghatározni az egyes cselekvések valószínűségét.

A fenti mintában a kezdeti engedéllyel könnyen meghatározható egy esemény lehetősége. Néhány más példával a számítás nehéz vagy akár irreális is lehet (például sokéves számításokat igényelhet). A statisztikai elemzési modellt alkotó személy számára az ilyen összetettség elfogadhatatlannak tekinthető: a számítások végrehajtása nem lehet gyakorlatilag kivitelezhetetlen vagy elméletileg lehetetlen.

Formális meghatározás

Matematikai szempontból a rendszer statisztikai modelljét általában párnak tekintik (S, P), ahol S a lehetséges megfigyelések halmaza, vagyis egy mintatér, P pedig a valószínűségi eloszlások halmaza S.

Ennek a meghatározásnak az intuíciója a következő. Feltételezzük, hogy van egy "valódi" valószínűségi eloszlás, amelyet egy bizonyos adatokat generáló folyamat okoz.

Készlet

Ő határozza meg a modell paramétereit. A paraméterezés általában megköveteli, hogy a különböző értékek különböző eloszlásokhoz vezessenek,. azaz.

a modell következménye

meg kell tartani (más szóval, injektívnek kell lennie). A követelménynek megfelelő paraméterezést azonosíthatónak nevezzük.

Példa

Statisztikai grafikon

Tegyük fel, hogy van egy bizonyos számú iskolás, akik különböző korúak. A gyermek növekedése sztochasztikusan kapcsolódik a születési évhez: például, ha egy diák 7 éves, ez befolyásolja a növekedés valószínűségét, csak úgy, hogy egy személy 3 centiméter felett legyen.

Ezt a megközelítést lineáris regressziós modellbe formalizálhatja, például így: magasság i = b 0 + b 1agei + εén, ahol b 0 a kereszteződés, b 1 az a paraméter, amellyel az életkor megszorozódik a magasságfigyelés fogadásakor. Ez a hiba ideje. Vagyis feltételezi, hogy a növekedést az életkor egy bizonyos hibával előre jelzi.

Az érvényes űrlapnak meg kell felelnie az összes információs pontnak. Így az egyenes vonalú irány (I. szint = b 0 + b 1agei) nem képes egyenlet lenni egy adatmodell számára — ha nem felel meg egyértelműen minden pontnak. Vagyis kivétel nélkül minden információ hibátlanul fekszik a vonalon. Hiba résztvevőεegyenlőségbe kell lépnem, hogy az űrlap abszolút minden információs pontnak megfeleljen.

Statisztikai következtetés levonásához először meg kell vennie néhány valószínűségi eloszlást ε i. Például feltételezhetjük, hogy a disztribúciók ε van egy Gauss-alakom nulla átlaggal. Ebben az esetben a modellnek 3 paramétere lesz: b 0, b 1, valamint a Gauss-Eloszlás varianciája.

A modellt formálisan (S, P)formában adhatja meg.

Ebben a példában a modell meghatározása s megadásával történik, ezért néhány feltételezést tehet a következővel kapcsolatban: P. Két lehetőség van:

Ezt a növekedést az életkor lineáris függvényével lehet közelíteni;

Hogy a közelítés hibái eloszlanak egy Gauss-ban.

Általános megjegyzések

A modellek statisztikai paraméterei a matematikai vetítés speciális osztálya. Mi különbözteti meg az egyik fajt a másiktól? Tehát az, hogy a statisztikai modell nem determinisztikus. Így benne, a matematikai egyenletekkel ellentétben, bizonyos változóknak nincs bizonyos értékük,hanem a lehetőségek eloszlása. Vagyis az egyes változókat sztochasztikusnak tekintik. A korábban megadott példában ε egy sztochasztikus változó. Enélkül a vetítés determinisztikus lenne.

A statisztikai modellkonstrukciókat gyakran akkor is használják, ha az anyagi folyamatot determinisztikusnak tekintik. Például az érmék feldobása alapvetően előre meghatározott művelet. A legtöbb esetben azonban sztochasztikusnak modellezik (a Bernoulli-folyamaton keresztül).

Konishi és Kitagawa szerint a statisztikai modellnek három célja van:

  • Jóslatok.
  • Információ bányászat.
  • Sztochasztikus struktúrák leírása.

Vetítési Méret

Tegyük fel, hogy van egy statisztikai előrejelzési modell,

Egy modellt paraméteresnek nevezünk, ha O véges dimenzióval rendelkezik. A megoldásban meg kell írni, hogy

A modell különbsége

ahol k pozitív egész szám (R bármely valós számot jelöl). Itt k a modell dimenziójának nevezik.

Például feltételezhetjük, hogy minden adat egydimenziós Gauss-eloszlásból származik:

A statisztikai képlet

Ebben a példában a K Dimenzió 2.

Egy másik példaként feltételezhetjük, hogy az adatok pontokból állnak (x, y), amelyekről feltételezzük, hogy egyenes vonalban oszlanak el Gauss-maradványokkal (nulla átlaggal). Ekkor a statisztikai gazdasági modell dimenziója egyenlő 3-mal: a vonal metszéspontja, lejtése és a maradványok eloszlásának varianciája. Meg kell megjegyzendő, hogy a geometriában egy egyenes vonalnak van dimenziója 1.

Bár a fenti érték formálisan az egyetlen paraméter, amelynek dimenziója van k, néha úgy tekintik, hogy tartalmaz k külön értékek. Például egydimenziós Gauss-eloszlás esetén az O az egyetlen paraméter, amelynek mérete 2, de néha úgy tekintik, hogy két különálló paramétert tartalmaz - az átlagot és a szórást.

A folyamat statisztikai modellje nem paraméteres, ha a kb. Félparaméteres is, ha mind véges, mind végtelen dimenziós paraméterekkel rendelkezik. Formálisan, ha k az O dimenziója és n a Minták száma, akkor a félparaméteres és nemparaméteres modellek

A modell képlete

ezután a modell félparaméteres. Ellenkező esetben a vetület nem paraméteres.

A parametrikus modellek a leggyakrabban használt statisztikai adatok. A félparaméteres és nem parametrikus vetületekkel kapcsolatban Sir David Cox kijelentette:

"Általános szabály, hogy a legkisebb számú hipotézist jelentik az eloszlás textúrájáról és alakjáról ,de erőteljes elméleteket tartalmaznak a".

Beágyazott modellek

Ne keverje össze őket többszintű vetületekkel.

Két statisztikai modell van beágyazva, ha az első átalakítható a másodikba az első paramétereinek korlátozásával. Például az összes Gauss-Eloszlás halmazának beágyazott eloszlása van nulla átlaggal:

Vagyis korlátoznia kell az átlagot az összes Gauss-Eloszlás halmazában, hogy nulla átlagú eloszlásokat kapjon. Második példaként a másodfokú modell y = b 0 + b 1 x + b 2 x 2 + ε, ε ~N (0, σ2) van egy lineáris modell beágyazva y = b0 + b1x + ε, ε ~ N (0, σ2)- vagyis a B paraméter2 az 0.

Mindkét példában az első modell nagyobb dimenzióval rendelkezik, mint a második modell. Ez gyakran történik, de nem mindig. Másik példaként adhatunk egy sor Gauss-eloszlást pozitív átlaggal, amelynek 2. dimenziója van.

A modellek összehasonlítása

statisztikai modell

Feltételezzük, hogy van egy" valódi " valószínűségi eloszlás a megfigyelt adatok mögött, amelyeket az őket generáló folyamat indukált.

a modellek összehasonlíthatók egymással, feltáró elemzés vagy megerősítő elemzés segítségével. A kutatási elemzés során különféle modelleket fogalmaznak meg, valamint felmérik, hogy mindegyik mennyire írja le az adatokat. A megerősítő elemzésben a korábban megfogalmazott hipotézist összehasonlítjuk az eredetivel. Ennek közös kritériumai a következők P2, Bayes-faktor és relatív valószínűség.

Konishi és Kitagawa gondolatai

"A statisztikai matematikai modell legtöbb problémája az előrejelzéssel kapcsolatos kérdéseknek tekinthető. Ezeket általában több tényező összehasonlításaként fogalmazzák meg.".

Ezenkívül Sir David Cox azt mondta: "a téma fordításaként a statisztikai modell problémája leggyakrabban a leginkább fontos rész az elemzésről".

Cikkek a témában