Zanimivo

Kaj so ostanki?

Kaj so ostanki?

Linearna regresija je statistično orodje, ki določa, kako dobro ravna črta ustreza nizu seznanjenih podatkov. Ravna črta, ki najbolj ustreza tem podatkom, se imenuje regresijska črta z najmanj kvadratki. To vrstico je mogoče uporabiti na več načinov. Ena od teh uporab je oceniti vrednost odzivne spremenljivke za dano vrednost pojasnjevalne spremenljivke. Ta ideja je povezana s preostalim.

Ostanke dobimo z odštevanjem. Vse, kar moramo storiti, je odšteti predvideno vrednost y od opazovane vrednosti y za določeno x. Rezultat se imenuje preostali.

Formula za preostale

Formula za ostanke je preprosta:

Preostali = opažen y - napoveduje y

Pomembno je upoštevati, da predvidena vrednost izvira iz naše regresijske črte. Opažena vrednost izvira iz našega podatkovnega niza.

Primeri

Uporabo te formule bomo ponazorili s primerom. Predpostavimo, da nam je dodeljen naslednji niz seznama podatkov:

(1, 2), (2, 3), (3, 7), (3, 6), (4, 9), (5, 9)

S pomočjo programske opreme lahko vidimo, da je regresijska črta najmanj kvadratov y = 2x. To bomo uporabili za napovedovanje vrednosti za vsako vrednost x.

Na primer, kdaj x = 5 vidimo, da je 2 (5) = 10. Tako dobimo točko vzdolž naše regresijske črte, ki ima an x koordinata 5.

Za izračun preostalega v točkah x = 5 odštejemo predvideno vrednost od naše opazovane vrednosti. Od takrat y koordinata naše podatkovne točke je bila 9, to pomeni ostanek 9 - 10 = -1.

V spodnji tabeli vidimo, kako izračunati vse naše ostanke za ta nabor podatkov:

XOpaženo yNapovedoval yPreostali
1220
234-1
3761
3660
4981
5910-1

Značilnosti preostalih

Zdaj, ko smo videli primer, je treba opozoriti na nekaj značilnosti ostankov:

  • Preostali rezultati so pozitivni za točke, ki padejo nad regresijsko črto.
  • Preostali rezultati so negativni za točke, ki padejo pod regresijsko črto.
  • Zaostale točke so ničle za točke, ki padejo točno vzdolž regresijske črte.
  • Večja kot je absolutna vrednost ostanka, toliko več, da točka leži od regresijske črte.
  • Vsota vseh ostankov mora biti nič. V praksi včasih ta vsota ni popolnoma nič. Razlog za to neskladje je v tem, da se lahko nabirajo okrogle napake.

Uporaba ostankov

Za ostanke obstaja več uporab. Ena od načinov je, da nam pomagajo ugotoviti, ali imamo nabor podatkov s splošnim linearnim trendom ali če bi morali razmisliti o drugačnem modelu. Razlog za to je, da ostanki pomagajo razširiti kateri koli nelinearni vzorec v naših podatkih. Kar je težko videti s pregledom raztresenega plina, je mogoče lažje opaziti s pregledom ostankov in ustrezne rezidualne ploskve.

Drugi razlog za preučitev ostankov je preverjanje, ali so izpolnjeni pogoji za sklepanje o linearni regresiji. Po preverjanju linearnega trenda (s preverjanjem ostankov) preverimo tudi porazdelitev ostankov. Da bi lahko sklepali regresijo, želimo, da se ostanki naše regresijske črte približno normalno porazdelijo. Histogram ali ostanki ostankov bodo pomagali preveriti, ali je bil ta pogoj izpolnjen.


Video, Sitemap-Video, Sitemap-Videos