Læsevejledning til afsnit 0.

 

Afsnit 0.1 I dette afsnit introduceres fordelinger af observationer (målinger).

Observerede hyppighedsfordelinger beskrives grafisk bl.a. ved et histogram (definition 1.2 side 88), en sumpolygon (definition 1.3 side 88), eller en empirisk fordelingsfunktion (definition 1.1 side 86).

Eksempel 0.1 Her introduceres enkelte målinger, kumuleret antal og relativ hyppighed/frekvens samt empirisk frekvensfunktion (pindediagram) og empirisk fordelingsfunktion (en trappefunktion), defineret i def. 1.1 side 86.

Eksempel 0.2 betragter grupperede målinger. Her indføres histogram (modsvarer pindediagram) og sumpolygon (modsvarer empirisk fordelingsfunktion). Endvidere introduceres kvartiler og median.

Eksempel 0.4 indfører begreberne diskret fordelt variabel og kontinuert fordelt variabel.

Eksempel 0.5 er lidt tricky. Her er den interessante størrelse diameteren af et enkelt korn, men i stedet for en antalsfordeling af korndiametre observerer vi en fordeling af vægten.

Eksemplet illustrerer endvidere at i et histogram bør arealerne af søjlerne være proportionale med observationsantallet i det pågældende interval.

Eksempel 0.6 illustrerer at de relative hyppigheder af observationerne minder om de sandsynligheder, man ville kunne regne sig til.

 

Afsnit 0.4.1 angiver den formelle definition af et sandsynlighedsfelt og af en stokastisk variabel.

En stokastisk variabel er et fundamentalt begreb i den statistiske teori.

Den formelle definition tager udgangspunkt i et sandsynlighedsfelt. Et sandsynlighedsfelt er et abstrakt rum, hvorpå der er defineret nogle mængder, kaldet hændelser. Til enhver af disse hændelser er der tilknyttet et tal mellem 0 og 1, kaldet sandsynligheder, som tilfredsstiller (0.14), (0.15) og (0.16).

Sædvanligvis vil et sandsynlighedsfelt beskrive de mulige resultater af et 'eksperiment'. Eksperimentet kunne eksempelvis bestå i at udvælge en tilfældig person i klassen og registrere personens køn. Elementarhændelserne er her {dreng, pige} og de tilknyttede sandsynligheder angiver chancen for at udvælge hhv en dreng og en pige.

En stokastisk variabel afbilder dette abstrakte rum ind i de reelle tal på en sådan måde at hændelserne flyttes over i intervaller. På denne måde føres sandsynlighederne på det abstrakte rum over i en sandsynlighedsfordeling på den reelle akse, (formelt: i sandsynligheder tilknyttet intervaller på den reelle akse). Formålet med dette er at man nu kan integrere og summere etc. , hvilket man ikke nødvendigvis kan gøre i det abstrakte rum. (Eksempelvis føres {dreng, pige} over i {0,1}. Man kan sagtens udregne gennemsnit mellem en række nuller og ettaller, men det kræver en ikke-entydig genmanipulation at definere et 'gennemsnit' mellem drenge og piger).

I praksis kan man således opfatte en stokastisk variabel som en størrelse med værdier på den reelle akse, der beskriver resultatet af en enkelt udførelse af et 'eksperiment', og som har tilknyttet en sandsynlighedsfordeling.

Afsnit 0.5: Afsnittet vedrører regning med sandsynligheder, og drejer sig ikke direkte om stokastiske variable.

Begreberne betinget sandsynlighed og stokastisk uafhængighed (definition 0.1 og 0.2) skal kendes, ligesom additionssætningen, sætning 0.3 bør kendes.

Sætning 0.4 formel (0.23) udsiger at man kan bruge et sæt af disjunkte (hinanden udelukkende) hændelser, som tilsammen udfylder hele udfaldsrummet, til at bestemme sandsynligheden for en bestemt hændelse ved at splitte denne hændelse op i dens fællesmængder med sættet af disjunkte hændelser.

Eksemplerne er ikke-trivielle og kan overspringes.

Afsnit 0.6. Begreberne Fordelingsfunktion og frekvensfunktion er fundamentale for beskrivelsen af sandsynlighedsmodeller. Definitionen af fraktiler skal også kendes. Den meget stringente definition er lidt kompliceret - men undertiden er man nødt til at bruge denne definition - ogs å i praksis.

Afsnit 0.7. Her skal man kende begrebet uafhængighed og betinget fordeling af stokastiske variable.

 

Afsnit 0.8 er af teknisk karakter og kan overspringes.

Afsnit 0.9 Her introduceres momenterne, forventningsvsærdi og varians i fordelingen af en stokastisk variabel. Symbolet E[X] fortolkes som 'middelværdien' (tyngdepunktet) i fordelingen af målestørrelsen X Symbolet V[X] fortolkes som 'variansen' (inertimomentet omkring tyngdepunktet) i fordelingen af målestørrelsen X Bemærk, at middelværdi og varians er begreber, der er knyttet til modellen, nemlig modellen for fordelingen af målestørrelsen.

Regnereglerne (0.40)- (0.42) og (0.46) - (0.49) er vigtige

En vigtig - og ofte benyttet - konsekvens af regnereglerne er anført i Eksempel 0.15 og 0.16.

Resultatet i Eksempel 0.15 og 0.16 er vigtigt, men beviset er lidt teknisk.

Afsnit 0.10. Regnereglerne øverst på side 68 bø kendes og kunne bruges. Fejlophobningsloven midt på side 69 er god at kende.

Afsnit 0.11. giver en meget abstrakt baggrund for dele af den statistiske teori.

Afsnit 0.12. Her er den formelle beskrivelse af den notation for fordelingsmodeller, som bruges i resten af bogen.

Afsnit 0.13. Dette afsnit benytter en række begreber, som først bliver introduceret senere. Afsnittet kan derfor overspringes ved den første gennemlæsning af bogen. I øvrigt er teksten til Figur 0.9 forkert. Snittet er foretaget væsentligt længere nede på kroppen.


fil://home2/pt/tex/stat1/web/afsn0.html                                 Sidst oændret 2000-09-03