• No results found

Grunnkurs i statistikk og sannsynlighetsteori

N/A
N/A
Protected

Academic year: 2022

Share "Grunnkurs i statistikk og sannsynlighetsteori"

Copied!
168
0
0

Laster.... (Se fulltekst nå)

Fulltekst

(1)

Grunnkurs i statistikk og sannsynlighetsteori

Gunnar Taraldsen

1. august 1997

(revidert 12. juni 2006)

(2)
(3)

Innhold

Figurer . . . 8

Tabeller . . . 9

I Innledende manøvre 11

1 Litt historikk og mengdeteori 13 1.1 Kort om statistikkfagets historiske utvikling . . . 13

1.2 Litt mengdeteori . . . 14

1.3 Oppgaver . . . 15

II Sannsynlighetsteori 19

2 Sjanse-eksperiment og Kolmogorovs aksiomer 21 2.1 Utfallsrom og eksperiment . . . 21

2.2 Sannsynlighet og statistiske eksperiment . . . 23

2.3 Oppgaver . . . 25

3 Sannsynlighetstetthet 27 3.1 Diskrete fordelinger. . . 28

3.2 Kontinuerlige fordelinger . . . 29

3.3 Oppgaver . . . 32

4 Betinget sannsynlighet og uavhengighet 33 4.1 Betinget sannsynlighet . . . 33

4.2 Uavhengighet . . . 36

4.3 Oppgaver . . . 37

5 Kombinatorisk sannsynlighet 39 5.1 Multiplikasjonsregelen og permutasjoner . . . 39

5.2 Binomialkoeffisienter og kombinatoriske sannsynligheter . . . 42

5.3 Oppgaver . . . 43

6 Observatorer og tilfeldige variable 47 6.1 Observatorer og fordelingen til en observator . . . 47

6.2 Tilfeldige variable, vektorer og uavhengighet. . . 48

6.3 Oppgaver . . . 53

7 Forventningsverdi 55 7.1 Definisjon av forventningsverdi og substitusjonsformelen . . . 55

7.2 Forventningsverdier av summer og produkt . . . 57

7.3 Geometrisk tolkning av forventningsverdi og varians . . . 58

7.4 Beregning av forventningsverdi og varians . . . 59 3

(4)

7.5 Chebyshevs ulikhet . . . 60

7.6 Oppgaver . . . 61

8 Beregning av tettheter og betingede tettheter 63 8.1 Funksjoner av observatorer . . . 63

8.2 Beregning av tettheter . . . 65

8.3 Betingede tettheter . . . 67

8.4 Oppgaver . . . 68

9 Poissonfordelingen og de sm˚a talls lov 71 9.1 Poissonfordelingen og Poisson-punktprosesser . . . 71

9.2 Fordelinger knyttet til en Bernoulli-forsøksrekke. . . 72

9.3 Fra binomisk fordeling til poissonfordelingen. . . 74

9.4 Fra poissonfordelingen til gammafordelingen. . . 76

9.5 Oppgaver . . . 77

10 Normalfordelingen og det viktigste grenseteoremet 79 10.1 Egenskaper til normalfordelingen . . . 79

10.2 Bevis av det viktigste grenseteoremet i statistikken . . . 80

10.3 Khi-kvadrat-, Fisher- og Student-t-fordelingene . . . 81

10.4 Oppgaver . . . 82

11 Noen andre viktige fordelinger 85 11.1 Khi-kvadrat-, FisherF- og studentt-fordelingene . . . 85

III Statistikk 87

12 Statistiske modeller og punktestimering 89 12.1 Statistiske modeller kontra sannsynlighets modeller . . . 89

12.2 Punktestimering . . . 90

12.3 Oppgaver . . . 94

13 Nøyaktighet, konsistens og tilstrekkelighet 97 13.1 Nøyaktigheten til en punktestimator . . . 97

13.2 Konsistente estimatorer . . . 99

13.3 Tilstrekkelige observatorer . . . 100

13.4 Oppgaver . . . 101

14 Metoder for ˚a finne estimatorer 103 14.1 Innledning . . . 103

14.2 Momentmetoden . . . 104

14.3 Rimelighetsmetoden . . . 105

14.4 Oppgaver . . . 107

15 Intervallestimering og konfidensintervall 109 15.1 Omr˚ade- og intervallestimatorer. . . 109

15.2 Metoder for ˚a finne konfidensintervall . . . 111

15.3 Oppgaver . . . 114

16 Konfidensintervall: Flere eksempler 117 16.1 Oppsummering . . . 117

16.2 Eksempler . . . 118

16.3 Oppgaver . . . 121

(5)

INNHOLD 5

17 Hypotesetesting 123

17.1 Terningen p˚a tiltalebenken. . . 123

17.2 Hypotese, forkastningsregel og signifikansniv˚a . . . 125

17.3 Utledning av en test med et gitt niv˚a . . . 126

17.4 Oppgaver . . . 127

18 Styrkefunksjonen og rimelighetsmetoden for hypotesetester 129 18.1 Innledning . . . 129

18.2 Klassifisering av feil og styrkefunksjonen . . . 130

18.3 Rimelighetstesten . . . 131

18.4 Oppgaver . . . 133

19 Eksempler p˚a konstruksjon av rimelighetstester 135 19.1 Oppgaver . . . 139

IV Appendiks 141

A Faginformasjon 1997 143

B Eksamen desember 1997 145

C Eksamen juni 1997 147

(6)
(7)

Figurer

1.1 Den historiske utviklingen av moderne matematisk statistikk. . . 13

1.2 Venn-diagram. . . 16

3.1 Atomene til en diskret fordeling og en hendelse. . . 28

3.2 Den geometriske rekken 1/2 + 1/4 + 1/8 +· · ·= 1. . . 29

3.3 Addisjonregelen for en kontinuerlig tetthet tilsvarer addisjon av areal under grafen. 30 3.4 Tettheten til en uniform fordeling. . . 30

3.5 Tettheten til standard normalfordeling.. . . 31

3.6 Tettheten til en eksponensialfordeling. . . 31

4.1 Terningkastet resulterte i at Ω0 inntraff. . . 33

4.2 Betingede sannsynligheter ved trekking av 4 brikker fra en urne. . . 35

4.3 En partisjon av Ω. . . 35

5.1 Tre-diagram for et spesielt Mynt + Terning eksperiment.. . . 40

5.2 Tre-diagram for multiplikasjonsregelen.. . . 40

5.3 Matrise for multiplikasjonsregelen. . . 41

5.4 Pascals trekant. . . 42

5.5 Binomialkoeffisientene i Pascals trekant. . . 43

6.1 Tre typer fordelingsfunksjoner. . . 50

6.2 Produktet av to intervall er et rektangel.. . . 51

6.3 Eny-enkel mengde.. . . 52

7.1 Tyngdepunkt til en fordeling. . . 58

7.2 Variansen = Treghetsmoment om tyngdepunktet til en fordeling. . . 59

8.1 Funksjon av en observator. . . 64

8.2 Integrasjonsomr˚adet ved konvolusjon. . . 65

8.3 Et trinomisk utfall. . . 66

8.4 Geometrisk tolkning av betinget tetthet. . . 67

9.1 Skjønnhetsfeil tilfeldig fordelt p˚a tallerkener. Hver feil er gitt ved et kryss. . . 72

9.2 De sm˚a talls lov. N˚arn→ ∞er antallet punkter poissonfordelt. SamlingenT1, T2, . . . av punkter er da en Poisson-punktprosessT. . . 75

12.1 Tettheten til observatorenW ved n= 4 ogθ= 1 . . . 91

13.1 Fordelingen til estimatorenW har bedre posisjon enn fordelingen tilV i forhold til τ(θ). . . 98

13.2 Fordelingen til estimatorenW har mindre spredning enn fordelingen tilV.. . . 98

14.1 Rimelighetsestimat . . . 105 7

(8)

14.2 Fortegnsskjema . . . 106

15.1 Mengdeestimat forµ= (µ1, µ2) . . . 110

15.2 P(a≤X ≤b) = 1−αn˚ar P(a > X) =P(X > b) =α/2. . . 113

15.3 Kvantilen uα 2 til standard normalfordelingen. . . 113

15.4 Kvantilen tα 2,n−1 til Student-t(n−1)-fordelingen. . . 114

16.1 Kvantiler i khi-kvadrat fordelingen. . . 119

16.2 Intervallestimat forp. . . 120

17.1 Kritisk omr˚adew≥w for en test med signifikanskoeffisientα. . . 126

18.1 Klassifisering av feil i en hypotesetest. . . 130

18.2 Styrkefunksjonene viser at test A er uniformt bedre enn test B. . . 132

19.1 Nullhypotesen er ikke enkel. . . 136

19.2 P(|T| ≥tα/2,n−1) =α/2 +α/2 =α. . . 137

19.3 Nullhypotesen er enkel. . . 137

19.4 Nullhypotesen er gitt ved en linje i parameterrommet. . . 138

19.5 Kritisk omr˚ade i enχ2-test. . . 139

(9)

Tabeller

4.1 Værmelding i forhold til tilsvarende observert vær. . . 37 9.1 Fordelinger knyttet til poissonfordelingen. . . 77

9

(10)
(11)

Del I

Innledende manøvre

11

(12)
(13)

Kapittel 1

Litt historikk og mengdeteori

Some people hate the very name of statistics, but I find them full of beauty and interest. Whenever they are not brutalized, but delicately handled by the higher methods, and are warily interpreted, their power of dealing with complicated phenomena is extraordinary. They are the only tools by which an opening can be cut through the formidable thicket of difficulties that bars the path of those who pursue the Science of man.

F.Galton (1908)

1.1 Kort om statistikkfagets historiske utvikling

Moderne matematisk statistikk vokste frem fra sannsynlighetsteorien og beskrivende statistikk slik som indikert i figur1.1. I det etterfølgende gis en kort gjennomgangen av statistikkfagets historikk og derved gis ogs˚a et inntrykk av noen av de mange mulige anvendelsesomr˚adene for teorien.

Egyptiske gravsteder vitner om terningspill. Dermed synes det klart at de tidligste sivilisas- joner hadde et forhold til sannsynlighetsbegrepet. Utviklingen av den matematiske teorien for sannsynlighetsberegninger kan oppsummeres ved noen av høydepunktene:

1654 Korrespondanse mellom Blaise Pascal og Pierre de Fermat anng˚aende beregningen av sannsyn- ligheter i forbindelse med terningspill. Dette regnes av mange som starten p˚a den matema- tiske sannsynlighetsteorien.

1657 Christiaan Huygens, kjent for sine arbeider innen optikk, publiserteDe Ratiocintiis in Alea Ludo(Beregninger i sjansespill). Dette er den første publiserte avhandling om sannsynlighet.

1713 Jacob Bernoullis avhandling Ars Conjectandi (Kunsten ˚a gjette) ble publisert etter hans død. Avhandlingen inneholder blant annet et teorem for grenseverdien til en sannsynlighet knyttet til gjentagelsen av et enkelt sjanseeksperiment. Lignende grenseverdibetraktninger er fortsatt et forskningstema. Denne avhandlingen er en milepel i sannsynlighetsteoriens fødsel.

Sannsynlighetsteori, 1654–

(Sjansespill)

))T

TT TT TT TT TT TT TT

Statistiske slutninger, 1662–

(Sosiale forhold)

ttjjjjjjjjjjjjjjj

Moderne statistikk, 1812–

Figur 1.1: Den historiske utviklingen av moderne matematisk statistikk.

13

(14)

1919 Richard von Mises publiserte Grundlagen der Wahrscheinlichkeitsrechnung hvor den em- piriske definisjonen av sannsynlighet ved relativ frekvens ble formulert.

1933 Andrei Kolmogorov ga sannsynlighetsteorien et aksiomatisk fundament ved publiseringen av Grundbegriffe der Wahrscheinlichkeitrechnung. Arbeidet bygde p˚a den abstrakte teorien for m˚al og integrasjon som hadde blitt grunnlagt av blant annet Henri Lebesgue og Mau- rice Fr´echet. Kolmogorovs aksiomer vil ogs˚a være v˚art utgangspunkt for den matematiske formuleringen av teorien.

Ordet statistikk vil i v˚ar sammenheng benyttes i to betydninger. Ordet betegner en samling av data, som i f.eks. Statistisk ˚Arbok, men betegner ogs˚a en metode for ˚a trekke slutninger p˚a grunnlag av en samling med data. Statistikk i ordets første betydning har sine røtter tilbake til skrivekunstens vugge. Utviklingen av teorien for statistiske slutninger kan oppsummeres ved noen høydepunkter:

1662 John Graunt publiserte boken Natural and Political Observations Made upon the Bills of Mortality som var basert p˚a fødsels- og dødsrater for befolkningen i England som var rammet av pest.

ca 1662 Sir William Petty begynte utviklingen av en teori forthe art of reasoning by figures upon things relating to government.

1700 Edmund Halley, kjent for ˚a ha en komet oppkalt etter seg, publiserte arbeider knyttet til dødelighetstabeller og forventet levetid. Etter disse arbeidene fremsto statistikken som en egen livskraftig vitenskap.

Det logiske fundamentet for den matematiske statistikken er gitt ved den matematiske formu- leringen av sannsynlighetsteorien. En kan dermed se p˚a sannsynlighetsteorien som en viktig del av statistikkfaget, eller alternativt se p˚a den matematiske statistikk som en naturlig videreføring av sannsynlighetsteorien.

Utgangspunktet i sannsynlighetsteorien er ˚a beregne sannsynligheter for visse utfall n˚ar en sannsynlighetsmodell er gitt. Ved statistiske slutninger snus dette p˚a hodet ved at en forsøker ˚a finne den eller de blant flere mulige sannsynlightesmodeller som beskriver gitte data best mulig.

Oppdagelsen av samspillet mellom sannsynlighetsteori og statistikk kan sees p˚a som fødselen av den moderne matematiske statistikk. En kort historikk er gitt ved:

1812 Pierre-Simon Laplace publiserte boken Theorie Analytique de Probabilities som oppsum- merte teorien til da, og ga en mengde anvendelser av sannsynlighetsregningen. En av anven- delsene var analysen av feilobservasjoner i eksperimentalfysikk.

ca 1812 Adolphe Quetelet, en student av Laplace, reiste rundt i Europa og demonstrerte bruken av sannsynlighetsmodeller i beskrivelsen av sosiale og biologiske fenomen.

1908 Francis Galton publiserteNatural Inheritance.

1930 Ronald Aylmer Fisher publiserteThe genetical theory of natural selectionog etablerte derved en syntese av Darwinismen og Mendelismen. Fisher er antagelig den enkeltperson som har hatt størst innflytelse p˚a utviklingen av den matematiske statistikken i dette ˚arhundre.

1.2 Litt mengdeteori

Abstrakt mengdeteori st˚ar sentralt i Kolmogorovs formulering av sannsynlighetsteorien. I det følgende vil vi ikke gjøre noe forsøk p˚a ˚a bygge opp mengdeteorien aksiomatisk, men vil ta som gitt at leseren har en viss fortrolighet med manipulering med mengder. Hovedinnholdet her blir da ˚a fastlegge noen notasjons- og spr˚aklige konvensjoner.

Paranteser av type{· · · }benyttes for ˚a beskrive mengder. Noen eksempler p˚a endelige mengder er gitt ved{a, b, c}og{1,2, . . . , n}. Den tomme mengden∅er ogs˚a endelig, den har ingen elementer.

(15)

1.3. OPPGAVER 15 Vi har∅={ω|ω6=ω}. Symbolet | leses i denne sammenhengen somslik atog brukes generelt til definisjon av mengder. Mengden av de naturlige tall betegnes medN={1,2,3, . . .}, og mengden av de reelle tall betegnes medR={x| −∞< x <∞}.

En mengdeI er tellbar dersom den er i en-en korrespondanse med en endelig mengde eller Definisjon:

tellbar mengden av de naturlige tall.Dette betyr at vi kan liste opp alle elementene iIvedi1, i2, . . .. Dette

burde forklare navnet. Bortsett fra mengden R av reelle tall er dermed alle overnevnte mengder tellbare.

Vi skrivera∈A dersomaer et element i mengdenA.Symbolet∈leser vi somer et element Definisjon:

∈, element i

i. Symbolet6∈leser vi tilsvarende somer ikke et element i. To eksempler er gitt vedb ∈ {a, b, c}

ogd6∈ {a, b, c}.

En mengdeAer en delmengde av en mengdeB dersom alle elementer i Aogs˚a er elementer Definisjon:

⊂, del- mengde iB. Vi benytter notasjonen A ⊂B for dette. Vi har da ata∈A⇒a∈B. Tegnet ⊂leses som

er en delmengde av. Tegnet⇒leses sommedfører at. Tre eksempler er gitt ved{1,100,14} ⊂N,

∅ ⊂R og{a, b, c} ⊂ {a, b, c}. Merk: Den vanligste metoden for ˚a bevise at A =B er gitt ved ˚a vise atA⊂B ogB⊂A.

Anta atAι er en mengde for hvert elementι i en mengdeI. Da er{Aι},ι∈I, en indeksert Definisjon:

{Aι}, indeksert familie familie av mengder. Et eksempel er gitt vedAι= [ι,∞) forι∈R,{Aι}={[ι,∞)},ι∈R.

Unionen og snittet av mengdene i familien{Ai} er gitt ved henholdsvis

Definisjon:

∪, union

∩, snitt [

i∈I

Ai={ω| ∃i, ω∈Ai} og \

i∈I

Ai={ω| ∀i, ω∈Ai}.

Tegnet∃leses somdet eksisterer en. Tegnet∀leses somfor alle. Unionen er dermed mengden av elementer i Ω som er inneholdt i minst enAi og snittet er mengden av elementer som er inneholdt i alle Ai. Her har vi antatt at alle mengdene Ai er delmengder av en mengde Ω. To eksempler er gitt ved ∪ι∈

R[ι,∞) = R og ∩ι∈

R[ι,∞) = ∅. I noen sammenhenger er det underforst˚att eller uviktig hva indeksmengdenI er og union og snitt skrives kortere p˚a formen∪iAieller ∩iAi.

Komplementet tilA iΩer gitt ved Ac={ω|ω6∈A}, dvs komplementet til A er mengden av Definisjon:

(· · ·)c, komple- ment

alle elementer iΩsom ikke er elementer iA.F eks gir Ω ={1,2,3,4},A={1,3} atAc={2,4}.

Differansen mellom A og B er mengden av alle elementer som er inneholdt i A men ikke i

Definisjon:

\, differans B.Formelt noteres dette som A\B ={ω|ω ∈A, ω 6∈ B}. Det følger atA\B =A∩Bc og at

Ac= Ω\A. Et eksempel er gitt ved R\N= (−∞,0]∪(∪n=1(n−1, n)).

To mengderAogBsies ˚a være disjunkte dersom de ikke har noen felles elementer, dvs dersom Definisjon:

disjunkt A∩B=∅.F eks er mengdene gitt ved intervallene (0,1) og (1,2) disjunkte.

En union av to disjunkte mengder noteres som A]B. Operasjonen ] er kun definert for Definisjon:

], disjunkt union disjunkte mengder. N˚ar vi skriverA]B, s˚a er det underforst˚att at mengdeneA, B er disjunkte.

Denne konvensjonen er sammenlignbar med at vi ofte skriverf(x) for verdien til en funksjonf i et punktxuten ˚a eksplisitt skrive ned at vi antar atxer et element i definisjonsmengden tilf. Notasjonen]iAibenyttes tilsvarende for unionen av en vilk˚arlig familie disjunkte mengder. Dette siste betyr ati6=j⇒[Ai∩Aj=∅]. Et eksempel er gitt ved

]

t∈R {t}.

Relasjoner mellom mengder og operasjoner p˚a mengder som gjelder generelt vil ogs˚a m˚atte gjelde for delmengder av et rektangel i planet. Dette gir muligheten til illustrasjon av sammen- henger som ellers kan virke uoversiktlige i Venn-diagram. Noen eksempler er gitt i figur1.2.

1.3 Oppgaver

1 La Ω =R2={(x, y)|x, y∈R}, dvs Ω er mengden av punkter i planet. Illustrer delmengdene A={(x, y)|x= 5},B ={(x, y)|x≥5},C ={(x, y)|x≥y2},D=C\B, E={(x, y)|x≥y}, F =C∩E,G=F∪A,H =N2={(x, y)|x, y∈N}.

ErH tellbar?

(16)

Union

&%

'$

&%

'$

Snitt

&%

'$

&%

'$

Komplement Ac

A

&%

'$

Differans A\B

A B

&%

'$

&%

'$

Figur 1.2: Venn-diagram.

(17)

1.3. OPPGAVER 17 2 LaQ+være mengden av alle positive rasjonale tall, dvsQ={m/n|m, n∈N}. ErQ+tellbar?

Er mengden av rasjonale tall tellbar?

3 Kontroller om følgende regneregler gjelder:A∩(B∪C) = (A∩B)∪(A∩C),A∪(B∩C) = (A∪B)∩(A∪C), (A∪B)∩(C∪D) = (A∩C)∪(A∩D)∪(B∩C)∪(B∩D), (A∪B)c=Ac∩Bc, (A∩B)c=Ac∪Bc.

Illustrer konklusjonene med Venn-diagram.

Kan regnereglene generaliseres til union/snitt av vilk˚arlige familier av mengder?

4 LaAn= [0,1/n]. FinnB=∪10n=1An,C=∩10n=1An, D=∩n=1An,E=∪n=1An. 5 LaA, B være delmengder av Ω. Vis at Ω =A]Ac.

Vis at Ω = (A∪B)c](A∩B)](A\B)](B\A). Illustrer dette i et Venn-diagram.

Kan du generalisere dette til tilfellet hvor vi tar utgangspunkt i tre delmengder A, B, C?

Hva med tilfellet medndelmengder, eller et tellbart antall delmengder?

(18)
(19)

Del II

Sannsynlighetsteori

19

(20)
(21)

Kapittel 2

Sjanse-eksperiment og Kolmogorovs aksiomer

The situations we are going to model can all be thought of as random experi- ments. Viewed naively, an experiment is an action which consists in observing or preparing a set of circumstances and then observing the outcomes of this sit- uation. We add to this notion the requirement that to be called an experiment such an action must be repeatable, at least conceptually. The adjective “random”

is used only to indicate that we do not, in addition, require that every repetition yield the same outcome, although we do not exclude this case. What we expect and observe in practice when we repeat a random experiment many times is that the frequency of each of the possible outcomes will tend to stabilize. This “long term frequency” is to many statisticians, including the authors, the operational interpretation of the mathematical concept of probability. In this sense, almost any kind of activity involving uncertainty, from horse races to genetic experi- ments, falls under the vague heading, “random experiment”.

P. J. Bickel og Kjell A. Doksum (1977)

2.1 Utfallsrom og eksperiment

Følgende definisjoner bygger p˚a mengdeteorien og er utgangspunktet for Kolmogorovs matematiske formulering av sannsynlighetsteorien.

Definisjon:

Utfallsrom Utfall Et utfallsrom er en ikke-tom mengde. Et utfall er et element i utfallsrommet.

Et eksempel p˚a et utfallsrom Ω er gitt ved enhetsintervallet, dvs Ω = [0,1]. I dette eksemplet er ω= 1/2 et utfall, mensω =−1 er ikke et utfall. Et annet eksempel er gitt ved utfallsrommet Ω =N. I s˚a fall er ikkeω= 1/2 et utfall, mensω=−1 er et utfall.

Definisjon:

Hendelsesfamilie hendelse

En familie av delmengder av utfallsrommet er en hendelsesfamilie dersom 1. Komplementet til en hendelse er en hendelse.

2. En tellbar union av hendelser er en hendelse.

En hendelse er et medlem av hendelsesfamilien.

Merk: En familieEav delmengder er det samme som en mengde av delmengder, dvs at dersom A∈ E s˚a erAen mengde. Spesielt betyr dette at en hendelse er en delmengde av utfallsrommet.

21

(22)

De to aksiomene for en hendelsesfamilie E kan skrives [E∈ E]⇒[Ec∈ E], [Ai∈ E]⇒[[

i

Ai∈ E],

hvor det siste aksiomet skal gjelde for enhver tellbar familie{Ai}av hendelser.

Begrepet hendelsesfamilie er identisk med begrepet σ-algebra av mengder. Denne siste beteg- nelsen er den vanlige i generell integrasjonsteori. Vi benytter betegnelsen hendelsesfamilie fordi dette ligger nærmere spr˚akbruken ellers i sannsynlighetsteorien.

Det følger av aksiomene at den tomme mengden er en hendelse fordi ∅=∪i∈∅Ai, og dermed er utfallsrommet selv ogs˚a en hendelse. Et tellbart snitt av hendelser er en hendelse fordi∩iAi= [∪iAci]c.

Det er kanskje en bekymring for leseren at overst˚aende er meget generelt. Vi ser p˚a tre konkrete eksempler for ˚a belyse begrepene og for ˚a vise anvendelsen i forbindelse med modellering av eksperiment.

Eksempel 2.1.1 (Eksperiment: Tre myntkast i rekkefølge) Resulatet av et enkelt myntkast er M (mynt) ellerK(krone). Utfallsrommet for eksperimentet gitt av tre myntkast i rekkefølge er Ω ={M M M, M M K, M KM, M KK, KM M, KM K, KKM, KKK}og best˚ar dermed av 8 enkeltutfall. Vi lar hendelsesfamilienEvære familien av alle delmengder. LaE={M KK, KM K, KKM, KKK}og anta at utfallet av eksperimentet bleω=M KK.

Da inntraff hendelsenE, dvs vi fikkωE. ˚A si at hendelsenEinntraff er det samme som ˚a si at vi fikk flere krone enn mynt.

Et alternativt utfallsrom i dette eksemplet er ˜Ω ={000,001,010,011,100,101,110,111}ved ˚a identifisere 0 med mynt og 1 med krone. Fordelen med dette valget er at alle de mulige utfallene kommer fram ved ˚a telle binært.

Eksempel 2.1.2 (Eksperiment: Gjentatt myntkast inntil resultatet er krone) Ut-fallsrommet er Ω ={K, M K, M M K, M M M K, . . .}og vi kan la hendelsesfamilienEvære familien av alle delmengder.

Eksempel 2.1.3 (Eksperiment: Levetiden til en lyspære) La eksperimentet være ˚a m˚ale tiden det tar før en nyinnkjøpt lyspære brenner ut. Det naturlige utfallsrommet er mengden av alle positive reelle tall, dvs Ω = (0,∞).

Det er naturlig ˚a kreve at mengdenE= [a,∞) er en hendelse for alle vilk˚arligea0 fordi dette er hendelsen at levetiden er større enn eller lika. Dette kravet gir at enhver union av intervall, at alle ˚apne delmengder og at alle lukkede delmengder av Ω er hendelser. Den naturlige familienE av hendelser er den minste familien av hendelser som inneholder alle overnevnte hendelser.

I det foreg˚aende eksemplet var den naturlige familien E av hendelser lik den minste familien Definisjon:

Borel- mengde

av hendelser som inneholder alle ˚apne mengder. Dette er det samme som at E er familien av Borelmengder i Ω.Eksistensen og entydigheten til slike familier behandles i videreg˚aende kurs.

Her nøyer vi oss med ˚a fastsl˚a at det finnes delmengder av Ω som ikke er Borelmengder. Dette gjelder ikke bare for Ω =R(talllinjen), men ogs˚a for Ω =R2 (planet), Ω =R3 (rommet) og for Ω =Rn(generelt euklidsk rom). Dersom en insisterer p˚a at alle delmengder skal være hendelser i disse eksemplene s˚a leder dette til problemer n˚ar alle disse skal tilordnes en sannsynlighet.

De foreg˚aende eksemplene viser at utfallsrommet Ω kan være en endelig mengde, en tellbar mengde, eller en mengde som ikke er tellbar. Ordet eksperiment stammer fra det latinskeexperiri som betyr prøve. I det foreg˚aende og i det som følger vil ordet eksperiment bli brukt i en mer generell betydning. Spesielt vil aldri ordet eksperiment bli definert som et matematisk begrep.

Med et eksperiment mener vi enhver prosess hvor de mulige resultatene av eksperimentet kan identifiseres med elementer i en mengde. Denne mengden er utfallsrommet for eksperimentet.

Identifiseringen av utfallsrommet for et eksperiment er første skritt i den matematiske beskriv- elsen av eksperimentet.

(23)

2.2. SANNSYNLIGHET OG STATISTISKE EKSPERIMENT 23

2.2 Sannsynlighet og statistiske eksperiment

La Ω være et utfallsrom med en hendelsesfamilieE. En fordelingP for Ω er en funksjon slik at enhver hendelseEer tilordnet en sannsynlighetP(E)≥0 med P(Ω) = 1 og slik at addisjonsregelen

P(]

i

Ai) =X

i

P(Ai)

gjelder for enhver tellbar familie{Ai} av disjunkte hendelser.

Et sannsynlighetsrom er et utfallsrom Ω utstyrt med en hendelsesfamilieE og en fordelingP.

Definisjon:

fordeling, addisjons- regelen, sannsynlig- hetsrom

En fordeling er dermed en funksjon P :E →[0,∞) som oppfyller to krav. Dersom normalis- eringskravet P(Ω) = 1 fjernes, s˚a sies P ˚a være et m˚al. En fordeling er dermed et normalisert m˚al. Dersom addisjonsregelen bare kreves for endelige familier, s˚a siesP˚a være en endelig additiv fordeling. I det følgende vil vi bevise noen av de viktigste regnereglene for fordelinger. Det vil fremg˚a av bevisene at mange av regnereglene ogs˚a er gyldige for endelig additive m˚al fordi det kun er den endelige addisjonsregelen som benyttes.

Ligningen P

i∈∅P Ai= 0 gir

P(∅) = 0 Spesialtilfellet P(U

C∈{A,B}C) =P A+P B gir

P(A]B) =P A+P B

Inklusjonen A⊂B girB =A](B\A), s˚aP B =P A+P(B\A)≥P A, dvsP er monotont voksende:

A⊂B⇒P A≤P B Spesialtilfellet A⊂Ω av det foreg˚aende gir

P A≤1

En generell union kan skrives som en disjunkt union vedA∪B= (A\B)](A∩B)](B\A).

Dette girP(A∪B) =P(A\B)+P(A∩B)+P(B\A). VedB= (B\A)](A∩B) og addisjonsregelen følgerP(B\A) =P B−P(A∩B), ogP(A\B) =P A−P(A∩B) bevises tilsvarende. Innsetting gir den mer generelle addisjonsregelen

P(A∪B) =P A+P B−P(A∩B)

I mange problem kan det være enklere ˚a beregne sannsynligheten til den komplementære hendelsen. LikhetenP(Ω) =P(A]Ac) =P A+P Ac gir at sannsynligheten til hendelsen deretter kan finnes ved:

P(A) = 1−P(Ac)

En fordeling benyttes for ˚a beskrive graden av usikkerhet i sjanse-eksperiment.

Vi ser p˚a noen eksempler for ˚a belyse dette.

Eksempel 2.2.1 (Sjanse-Eksperiment: Terningkast) Utfallsrommet for et terningkast er Ω ={1,2,3,4,5,6}.

(24)

Ved symmetri er det rimelig ˚a anta at hvert enkelt utfall er like sannsynlig, dvsP{ω} =p. Sannsynligheten til en generell hendelseE er da gitt ved addisjonsregelen, dvsP E =P

ω∈EP{ω}. Normaliseringen gir 1 =PΩ = P6

ω=1P{ω} = 6p gir p = 1/6, og det følger atP er en fordeling, N˚ar fordelingen er gitt kan f eks sannsyn- ligheten for at terningkastet gir 5 eller 6 øyne beregnes vedP{5,6} = P

ω∈{5,6}p = 2p = 1/3. Videre finnes P(odde antall øyne) =P{1,3,5}= 1/2.

Eksempel 2.2.2 (Sjanse-Eksperiment: To myntkast) Utfallsrommet er Ω ={M M, M K, KM, KK}.

Det er rimelig ˚a anta at enkeltutfallene er like sannsynlige. Dermed kan en f eks beregneP(To kronesider opp) = P{KK}= 1/4, ogP(Minst en myntside opp) = 1P(Ingen myntsider opp) = 1P{KK}= 3/4.

Dersom myntene er identiske og eksperimentet er ˚a kaste de samtidig, s˚a er utfallsrommet Ω ={0,1,2},

hvor enkeltutfallene teller antall myntsider opp. I dette tilfellet er en rimelig fordeling gitt vedP{0}=P{2}= 1/4 ogP{1}= 1/2, som kan begrunnes ved likheten med eksperimentet hvor myntkastene ble utført i rekkefølge.

Eksempel 2.2.3 (Sjanse-Eksperiment: Fotballkamp) La eksperimentet være gitt ved Norges neste hjemme- landskamp i fotball med utfallsrom

Ω ={00,01,10,11,03, . . .}.

En mulig vurdering er gitt vedP(Norge vinner) =P{10,20,21,31, . . .}= 80%.

I alle eksemplene over er eksperimentene karakterisert ved et utfallsrom, og utfallet av eksper- imentet er usikkert. Slike eksperiment kaller vi sjanse-eksperiment.

Et sjanse-eksperiment er et eksperiment hvor det er knyttet usikkerhet til ut- fallet av eksperimentet.

Dersom resultatet av et eksperiment erω, s˚a sier vi at hendelsenEhar inntruffet dersomω∈E.

En mulig modell for et sjanse-eksperiment er gitt ved at utfallsrommet er et sannsynlighetsrom.

Fordelingen P gir sannsynligheten P(E) for at hendelsen E inntreffer. Sannsynligheten tolkes i dette tilfellet som en vurdering av rimeligheten for at hendelsenE inntreffer.

En sannsynlighetsmodell for et sjanse-eksperiment er gitt ved en 1-1 korrespon- danse mellom de mulige utfallene i eksperimentet og utfallene i et sannsynlighet- srom.

Bortsett fra fotballkamp eksemplet, s˚a kan alle overnevnte eksperiment gjentas et vilk˚arlig antall ganger.

Et statistiske eksperiment er et eksperiment som kan gjentas et vilk˚arlig antall ganger.

La nA være antall ganger hendelsen A inntreffer n˚ar et statistisk eksperiment er utført n Definisjon:

relativ hyppighet

ganger. Den relative hyppigheten til Aer da definert ved Pn(A) =nA

n . Det følger atPn er en fordeling (bevis dette!).

Et eksperiment er et statistisk lovmessig eksperiment dersom grenseverdien Definisjon:

statistisk lovmessig eksperi- ment

P E= lim

n→∞Pn(E),

eksisterer for alle hendelser E. Det følger at dette definerer en endelig additiv fordelingP. Det kan ogs˚a bevises (Vitali-Hahn-Saks teoremet) atP er en fordeling. Denne unike fordelingen er den empiriske fordelingen. Konklusjonen er da:

(25)

2.3. OPPGAVER 25 I et statistisk lovmessig eksperiment er enhver hendelseE tilordnet en entydig

empirisk sannsynlighetP(E). Vi sier i s˚a fall at hendelsenE inntreffer iP(E)· 100% av eksperimentene n˚ar eksperimentet gjentas flere ganger.

I praksis vil et eksperiment kun gjentas et endelig antall ganger, men vi vil analysere eksper- imentet ved ˚a tenke oss at eksperimentet kan gjentas et vilk˚arlig antall ganger. I praksis vil observasjonen av en statistisk lovmessighet være gitt ved at den relative frekvensen til en hendelse synes ˚a n˚a en grenseverdi n˚ar eksperimentet gjentas mange ganger. De filosofiske sidene knyttet til hva vi egentlig mener med at eksperimentet kan gjentas et vilk˚arlig antall ganger lar vi vile.

2.3 Oppgaver

6 Hva er utfallsrommet for et enkelt terningkast?

Hva er utfallsrommet for gjentatt kast med terning inntil resultatet blir seks øyne? Hva er sannsynligheten for at terningen m˚a kastes 2 ganger? Hva er sannsynligheten for at terningen m˚a kastesnganger?

7 En student som snart er ferdig med utdannelsen er innkalt til tre jobbintervju. Hun vil karak- terisere et intervju som en suksess dersom det resulterer i en invitasjon til en omvisning p˚a arbei- dstedet. I motsatt fall karakteriseres intervjuet som en fiasko.

Definer et utfallsrom Ω for dette eksperimentet.

Hvilke utfall er inneholdt i hendelsen A= “andre suksess forekommer i tredje intervju”?

Finn hendelsenB= “første suksess forekommer aldri”.

8 En urne inneholder 6 brikker som er nummerert fra 1 til 6. Tre brikker trekkes fra urnen.

Hvilke utfall er inneholdt i hendelsen “den nestminste verdien er 3”?

9 I et terningsspill (craps) kastes to terninger. Kasteren vinner dersom resultatet er 7 eller 11, og taper dersom resultatet er 2, 3 eller 12. Dersom resultatet er noe annet, anta 9, s˚a fortsetter kastingen inntil resultatet er 7 (tap) eller inntil resultatet 9 fra det første kastet gjentas (vinst).

Karakteriser utfallene i hendelsen “kasteren vinner med en 9”.

10 Studentsamskipnaden viste filmen “Ny student i byen” to ganger i løpet av orienteringsdagen.

Av totalt 2000 nye studenter var det 850 som s˚a p˚a den første forestillingen, 690 s˚a p˚a den andre forestillingen, mens 730 unnlot ˚a se filmen. Hvor mange nye studenter s˚a filmen to ganger?

11 LaP A= 1/3,P B= 1/2 ogP(A∪B) = 3/4. FinnP(A∩B),P(Ac∪Bc) ogP(Ac∩B).

12 Et eksperiment har to mulige utfall. Det ene har sannsynlighetpog det andre har sannsyn- lighetp2. Finnp.

13 To kort trekkes i rekkefølge fra en kortstokk med 52 kort. Hva er sannsynligheten for at det andre kortet som trekkes er større enn det første kortet?

Hint: Enten er kortene like store eller s˚a er det første størst eller s˚a er det andre størst. Disse tre hendelsene er disjunkte.

14 La Ω være et utfallsrom utstyrt med en hendelsesfamilie. Vis at∅og Ω er hendelser.

Vis at et tellbart snitt av hendelser er en hendelse.

15 Vis at den relative hyppigheten er en fordeling.

Vis at den endelige addisjonsregelen gjelder for en empirisk fordeling.

(26)

16 LaEi være hendelsesfamilier i Ω. Vis atF=E1∩ E2 er en hendelsesfamilie.

Vis atG=∩iEi er en hendelsesfamilie.

Anta at{Ei}er familien av hendelsesfamilier i Ω som inneholder alle ˚apne mengder. Vis atG er familien av Borel-mengder.

(27)

Kapittel 3

Sannsynlighetstetthet

Tyche, in Greek religion, the goddess of chance, with whom the Roman Fortuna was later identified; a capricious dispenser of good and ill fortune. The Greek poet Hesiod called her the daughter of the Titan Oceanus and his consort Tethys;

other writers attributed her fatherhood to Zeus, the supreme god. She was also associated with the more beneficent Agathos Daimon, a good spirit, protective of individuals and families, and with Nemesis, who, as an abstraction, represented punishment of overprosperous man and so was believed to act as a moderating influence. She was often shown winged, wearing a crown, and bearing a scep- tre and cornucopia; but she also appeared blindfolded and with various devices signifying uncertainty and risk. Among her monuments was a temple at Argos, where the legendary Palamedes is said to have dedicated to her the first set of dice, which he is supposed to have invented.

Britannica Online (1997) Fortuna, in Roman religion, goddess of chance or lot who became identified with the Greek Tyche; the original Italian deity was probably regarded as the bearer of prosperity and increase. As such she resembles a fertility deity, hence her association with the bounty of the soil and the fruitfulness of women. Frequently she was an oracular goddess consulted in various ways regarding the future.

Fortuna was worshiped extensively in Italy from the earliest times. At Praeneste her shrine was a well-known oracular seat, as was her shrine at Antium. Fortuna is often represented bearing a cornucopia as the giver of abundance and a rudder as controller of destinies, or standing on a ball to indicate the uncertainty of fortune.

Britannica Online (1997)

En funksjon f er en tetthet for fordelingen P med hensyn p˚a µ dersom sannsynligheter kan beregnes ved integrasjon som ved

P(A) = Z

A

f(ω)µ(dω).

Vi skal se p˚a tilfellet hvorµA = antall punkter i hendelsen A. I dette tilfellet er integralet over definert ved summasjon og vi sier at f er en diskret tetthet. Et annet tilfelle er gitt ved at utfallsrommet er tallinjen og µA = størrelsen til A, hvor spesielt µ[a, b] = b−a. Dersom f er stykkevis kontinuerlig er integralet over gitt ved Riemann-integralet. I dette tilfellet er f en tetthet for R. Et poeng med innføringen av tettheter er at det kan være enklere ˚a spesifisere en fordelingP ved en tetthetf fremfor ˚a spesifisereP direkte.

27

(28)

Figur 3.1: Atomene til en diskret fordeling og en hendelse.

3.1 Diskrete fordelinger

La Ω være et utfallsrom. En funksjon f : Ω→[0,∞)er en diskret sannsynlighetstetthet dersom Definisjon:

diskret

tetthet X

ω∈Ω

f(ω) = 1

Et utfallω er et atom dersomf(ω)>0. Det kan vises at det overst˚aende gir det finnes høyst et tellbart antall atomerω1, ω2, . . ..

En fordelingP er en diskret fordeling dersom det finnes en diskret sannsynlighetstetthetf slik Definisjon:

diskret fordeling

at

P(A) =X

ω∈A

f(ω).

Spesielt gir dette at P{ω} = f(ω). Dersom f er en diskret sannsynlighetstetthet, s˚a kan P defineres ved formelen over. En diskret fordeling for Ω er karakterisert av atomeneω1, ω2, . . . og sannsynlighetenpi=P{ωi} til hvert atomωi. Dette er illustrert i figur3.1.

Eksempel 3.1.1 (Tettheten tilsvarende to myntkast) Utfallsrommet er Ω ={M M, M K, KM, KK}, og det er rimelig ˚a anta at alle utfallene er like sannsynlige. Dette girP{ω}= 1/4. Definerfvedf(ω) =P{ω}. Det følger atfer en diskret sannsynlighetstetthet og atP(A) =P

ω∈Af(ω). Dermed erP en diskret fordeling.

Et utfallsrom Ω er et diskret utfallsrom dersom Ω er tellbar og er utstyrt med en hendelses- Definisjon:

diskret utfallsrom

familie slik at alle enpunktsmengder{ω}er hendelser.Eksperimentet over kunne beskrives ved en diskret sannsynlighetstetthet fordi utfallsrommet var diskret. Dersom Ω er et diskret utfallsrom, s˚a følger det generelt atP er diskret. Det neste eksemplet viser atP kan være diskret uten at Ω er diskret.

Eksempel 3.1.2 (Endelig empirisk tetthet ved pilkast) Utfallsrommet er Ω ={BOM}∪

{(x, y)|x2+y2R2}. Her erx, ypilens horisontale og vertikale koordinater med origo (0,0) i sentrum av blinken som har radiusR. Anta at en person har kastetnganger med resultatω1, . . . , ωn. En mulig fordeling for det neste pilkastet er gitt vedP A=nA/n, hvornAer antall gangerAinntraff i de foreg˚aende pilkastene. Med andre ord er nAantalljslik atωjer iA. Formelt kan dette skrives somnA=Pn

i=11Ai), hvor 1Aer indikatorfunksjonen til A. Tettheten er gitt ved

f(ω) =n{ω}

n =X

i

1ωi(ω) n .

En diskret fordeling er uniform dersom det kun er et endelig antall ulike atomer ω1, . . . , ωn

Definisjon:

diskret uniform fordeling

ogP{ωi}=puavhengig avi.Det følger atp= 1/n. Dette er den viktigste diskrete fordelingen. I gode tilfeller kan symmetriargumenter benyttes for ˚a konkludere at en uniform fordeling er rimelig.

(29)

3.2. KONTINUERLIGE FORDELINGER 29

Figur 3.2: Den geometriske rekken 1/2 + 1/4 + 1/8 +· · ·= 1.

F eks vil vi anta at det er 1/6 sannsynlighet for ˚a f˚a en 5’er i et terningkast dersom terningen er symmetrisk, dvs dersom det ikke er noen forskjell p˚a de seks sidene p˚a terningen. Det neste eksemplet viser at uniforme fordelinger kan benyttes til utledning av andre fordelinger.

Eksempel 3.1.3 (Myntkast inntil resultatet er krone) Det diskrete utfallsrommet Ω ={K, M K, M M K, . . .}

bør være selvforklarende. Vi vil n˚a finne en fordeling ved ˚a finne sannsynligheten til hvert enkeltutfall. Vi antar at mynten er symmetrisk og konkluderer atP{K}= 1/2. KonklusjonenP{M K}= 1/4 følger fordi hver av de fire utfalleneM M, M K, KM, KKi eksperimentet hvor en mynt kastes 2 ganger er like sannsynlige ved symmetri med hensyn til kastrekkefølgen og myntens to sider. UtfalletM K i dette siste eksperimentet gir sannsynligheten for utfalletM Ki Ω fordi betingelsene for dette utfallet er like i de to eksperimentene. Tilsvarende kan sannsynligheten for hvert enkeltutfall i Ω finnes ved sannsynligheten for et tilsvarende utfall i et eksperiment med 2nlike sannsyn- lige utfall. Dette gir generelt atP{ω}= 1/2nhvorner antall myntkast tilsvarendeω. Vi kan kontrollere at P er normalisert vedPΩ = 1/2 + 1/4 + 1/8 +· · ·= 1. Dette summasjonsresultatet er illustrert i figur3.2. Generelt er summen av en geometrisk rekkea+ak+ak2+· · ·=a/(1k) dersom|k|<1. Vi kan n˚a regne ut sannsynligheten for mer kompliserte hendelser. F eks er sannsynligheten for at vi m˚a kaste mynten et odde antall ganger før vi f˚ar krone lik 2/3:

P{K, M M K, M M M M K, . . .}=

X

i=0

1 2

2i+1

=1 2

X

i=0

1 4

i

=1 2

1

11/4 = 2/3.

3.2 Kontinuerlige fordelinger

La utfallsrommet væreR= “de reelle tall”. FordelingenP er kontinuerlig dersom Definisjon:

kontinuer- lig

fordeling P(A) =

Z

A

f(x)dx.

Generelt defineres R

Af(x)dx=R

1A(x)f(x)dxhvor 1A er indikatorfunksjonen tilA. Funksjonen f er sannsynlighetstettheten til sannsynlighetsfordelingen P. Kravet P(A) ≥ 0 gir at f ≥ 0.

NormaliseringenPΩ = 1 gir normaliseringsbetingelsen Z

−∞

f(x)dx= 1,

dvsf er normalisert. Generelt er en tetthetf for tallinjen en funksjonf :R→[0,∞)som er nor- Definisjon:

tetthet for R

malisert. Det er en-en korrespondanse mellom kontinuerlige tettheter og kontinuerlige fordelinger.

Hendelsesfamilien tilsvarendeP er familien av alle Borel-mengder, dvs den minste hendelsesfami- lien som inneholder alle intervall.

Det at en kontinuerlig tetthet definerer en fordeling er en egenskap til integralet. Addisjon- sregelen kan bevises ved

P(]i=1Ei) = Z

]i=1Ei

f(x)dx= Z

1]i=1Ei(x)f(x)dx= Z

X

i=1

1Ei(x)f(x)dx=

X

i=1

Z

1Ei(x)f(x)dx

=

X

i=1

P(Ei).

Den endelige addisjonregelen er illustrert i figur3.3.

Noen tettheter er s˚a viktige at de har f˚att egne navn. Vi vil nevne tre eksempler her.

(30)

Figur 3.3: Addisjonregelen for en kontinuerlig tetthet tilsvarer addisjon av areal under grafen.

Figur 3.4: Tettheten til en uniform fordeling.

Tettheten til den uniforme fordelingen p˚a[a, b] er gitt ved (se figur 3.4) Definisjon:

uniform fordeling f(x) = 1

b−a, a≤x≤b.

Det er her underforst˚att atf(x) = 0 n˚ar x6∈[a, b].

Tettheten til standard normalfordelingen er gitt ved (se figur3.5) Definisjon:

standard normal- fordeling

f(x) = 1

√2πex

2 2 .

Tettheten til eksponensialfordelingen er gitt ved Definisjon:

eksponensial- fordelin- gen

(se figur 3.6)

f(x) = 1

λexλ, x >0. (3.1)

Det er her underforst˚att atf(x) = 0 n˚arx≤0.

Eksempel 3.2.1 (Fri veilengde) Den frie veilengden er avstanden et molekyl tilbakelegger mellom to kollisjoner med andre molekyler i en gass. Det kan argumenteres for at den frie veilengden er eksponensialfordelt med parameter λ. Vi definerer

midlere fri veilengde = Z

xf(x)dx= Z

0

x1

λe−x/λdxdelv.int.= λ,

(31)

3.2. KONTINUERLIGE FORDELINGER 31

Figur 3.5: Tettheten til standard normalfordeling.

Figur 3.6: Tettheten til en eksponensialfordeling.

(32)

dvs parameterenλer den midlere frie veilengden. Vi kan n˚a f eks beregne sannsynligheten for at den frie veilengden er mindre eller lik halvparten av den midlere frie veilengden:

P(fri veilengdeλ/2) = Z λ/2

0

1

λe−x/λdx=

λ/2

1

λ(-λ)e-x/λ

0

= 1e−1/20,39.

3.3 Oppgaver

17 Laλ≥0. Vis at

f(n) = 1 1 +λ

λ 1 +λ

n

, n= 0,1,2, . . .

definerer en diskret tetthet for utfallsrommetR. Er dette utfallsrommet diskret? Hva med tilfellet λ= 0?

18 Laf være en diskret sannsynlighetstetthet. Vis at da erP definert ved P(A) =X

ω∈A

f(ω) en sannsynlighetsfordeling.

19 Vis at dersom utfallsrommet er diskret, s˚a m˚a fordelingen ogs˚a være diskret. Gjelder det motsatte?

20 Anta at P er den uniforme fordelingen p˚a et utfallsrom Ω. Finn tettheten til P n˚ar det er gitt at Ω inneholder 1001 elementer. Hva med tilfellet n˚ar Ω =N?

21 Vis at 1/2 + 1/4 + 1/8 +· · ·= 1.

22 La k være en konstant. Finn P(Personen lever mer enn 60 ˚ar) n˚ar tettheten for personens alder er

f(t) =k·t2(100−t)2,0≤t≤100.

Hva verdien tilk?

23 Finn sannsynligheten for at det er mellom 50 og 100 dager mellom to gruveulykker n˚ar det er gitt at tiden mellom to gruveulykker er eksponensialfordelt med parameterλ= 241 dager.

24 Vis at 1]iAi=P

i1Ai.

25 La utfallsrommet være tallinjenR. Vis at det er en-en korrespondanse mellom kontinuerlige fordelinger og tettheter forR.

(33)

Kapittel 4

Betinget sannsynlighet og uavhengighet

The concept of mutual independence of two or more experiments holds, in a certain sense, a central position in the theory of probability.

A.N. Kolmogorov (1933)

Uavhengighet av hendelser er et meget viktig begrep. Begrepet er tildels utgangspunktet for at sannsynlighetsteorien har utviklet seg til noe mer enn det som finnes i den grunnleggende integrasjonsteorien. To hendelser A, B som har positiv sannsynlighet er uavhengige dersom den betingede sannsynligheten tilAgittB er lik sannsynligheten tilA. Med dette som utgangspunkt m˚a vi først si litt om betingede sannsynligheter.

4.1 Betinget sannsynlighet

Eksempel 4.1.1 (Terningkast med informasjon) En terning kastes og det er oppgitt at resultatet er et partall.

Noen rimelige vurderinger er da gitt vedP{1}= 0 (1 er ikke et partall.),P{2}= 1/3 (Det finnes 3 mulige partall.), ogP{2,4,5}= 2/3 (Hendelsen inneholder 2 av de 3 mulige partallene.). Figur4.1 kan være en hjelp til ˚a forst˚a den siste vurderingen.

Anta at vi har et statistisk lovmessig eksperiment, dvs sannsynligheten for en hendelse er det samme som det relative antall ganger hendelsen inntreffer n˚ar eksperimentet gjentas. Sannsyn- lighetenP(A|Ω0) for atAinntreffer gitt at Ω0 inntreffer er gitt ved ˚a kun telle utfallene innenfor

Figur 4.1: Terningkastet resulterte i at Ω0 inntraff.

33

(34)

0. Dette leder til

P(A|Ω0) = limn(A∩Ω0) nΩ0 = lim

n(A∩Ω0) n nΩ0

n

= P(A∩Ω0) P(Ω0) .

Denne regningen motiverer en generell definisjon. Sannsynligheten til Agitt B defineres generelt Definisjon:

Betinget sannsyn- lighet

ved

P(A|B) = P(A∩B)

P(B) , P(B)6= 0.

Definisjonen av den betingede sannsynlighetenP(A|B) gjelder generelt n˚arP er en fordeling.

N˚arBfikseres gir dette en ny fordelingQvedQ(A) =P(A|B). Vi vil bevise atQer en fordeling. Vi harQ(A)≥0 ogQ(Ω) =P(Ω∩B)/P(B) = 1. Addisjonsregelen følger fordi (]iAi)∩B=]i(Ai∩B)

Q(]iAi) = P((]iAi)∩B)

P(B) = P(]i(Ai∩B))

P(B) =

P

iP(Ai∩B)

P(B) =X

i

P(Ai∩B) P(B)

=X

i

Q(Ai).

Eksempel 4.1.2 (Kortstokk) Et kort trekkes fra en kortstokk. Hva er sannsynligheten for at det er et kløverkort gitt at det er en konge?

Svar a): Utfallsrommet best˚ar av de fire kongene, og en av disse er kløver. Sannsynligheten er dermed 1/4.

Svar b): Det opprinnelige utfallsrommet kan ogs˚a brukes ved P(kløver|konge) =P(kløver og konge)

P(konge) =

1 52

4 52

=1 4. Eksempel 4.1.3 (Levealder) Anta at levealderen til en person er gitt ved tettheten

f(t) = 3·10−9·t2(100t)2,0t100.

Hva er sannsynligheten for at en person dør med en alder mellom 80 og 85 ˚ar gitt at levetiden er>70 ˚ar? Denne betingede sannsynligheten kan beregnes ved

P(80<levetid<85|levetid>70) =P(80<levetid<85levetid>70) P(levetid>70)

=P(80<levetid<85) P(levetid>70) =

R85 80 f(t)dt R100

70 f(t)dt 0,19

Definisjonen avP(A|B) har en viktig omskrivning P(A∩B) =P(A|B)P(B).

Mer generelt kan sannsynligheten til snittet avnhendelser finnes ved produktet avnsannsyn- ligheter ved gjentatt bruk av regneregelen over

P(An∩ · · · ∩A1) =P(An|An−1∩ · · · ∩A1)P(An−1∩ · · · ∩A1)

=P(An|An−1∩ · · · ∩A1)P(An−1|An−2∩ · · · ∩A1)P(An−2∩ · · · ∩A1)

=P(An|An−1∩ · · · ∩A1)P(An−1|An−2∩ · · · ∩A1)· · ·P(A2|A1)P(A1).

Vi tar med et eksempel p˚a bruk av denne regneregelen.

Eksempel 4.1.4 (Snittet av4hendelser ved betingede sannsynligheter) En urne inneholder 5 hvite brikker, 4 sorte brikke og 3 røde brikker. Hva er sannsynligheten for ˚a trekke sekvensen (hvit, rød, hvit, sort) n˚ar 4 brikker trekkes uten tilbakelegning?

Definer hendelseneA1 = “hvit trekkes i 1.trekning”,A2 = “rød trekkes i 2.trekning”, A3 = “hvit trekkes i 3.trekning” ogA4= “sort trekkes i 4.trekning”. Den søkte sannsynligheten er gitt ved (se figur4.2)

P(A1A2A3A4) =P(A1)P(A2|A1)P(A3|A1A2)P(A4|A1A2A3)

= 5 12

3 11

4 10

4 9 0,02.

(35)

4.1. BETINGET SANNSYNLIGHET 35

Figur 4.2: Betingede sannsynligheter ved trekking av 4 brikker fra en urne.

Figur 4.3: En partisjon av Ω.

(36)

En familie {Ai} av hendelser er en partisjon (= oppdeling) av Ω dersom Ω = ]iAi. En Definisjon:

partisjon partisjon med 5 hendelser er illustrert i figur 4.3. Dersom {Ai} er en tellbar partisjon av Ω, s˚a følger det at

P(B) =P(B∩Ω) =P(B∩(]iAi)) =P(]i(B∩Ai)) =X

i

P(B∩Ai)

=X

i

P(B|Ai)P(Ai).

Innsetting av dette gir Bayes formel:

P(Aj|B) = P(Aj∩B)

P(B) = P(B|Aj)P(Aj) P

iP(B|Ai)P(Ai).

Formelen gir sannsynligheten forAjgittBved sannsynlighetene forBgittAiog sannsynlighetene forAi. Legg merke til at betingelsene er snudd!

Eksempel 4.1.5 (Valg) Et valg mellom 1 republikaner og 3 demokrater foreg˚ar ved at 1 av demokratene velges ut først i et primærvalg. Sannsynligheten for at demokrat 1, 2, eller 3 vinner primærvalget estimeres til ˚a være henholdsvis 35%, 40% og 25%. Hva er sannsynligheten for at republikaneren blir sittende i Kongressen dersom republikaneren med sannsynlighet 40%, 35% og 60% vinner et valg mot henholdsvis demokrat 1, 2 og 3?

La Bvære hendelsen at republikaneren beholder sitt sete etter valget. HendelseneA1, A2, A3 tilsvarende at henholdsvis demokrat 1, 2 eller 3 vinner primærvalget gir en partisjon av utfallsrommet. Dermed har vi

P(B) =X

i

P(B|Ai)P(Ai) = 0,40·0,35 + 0,35·0,40 + 0,60·0,2543%.

Eksempel 4.1.6 (Varsellampe) Hva er sannsynligheten for at bilen du kjører har for lite olje gitt at oljelampen lyser rødt og indikerer at det er for lite olje?

Vi antar at sannsynligheten for at oljelampen lyser ved for lite olje er 99%. Videre antar vi at oljelampen i 2%

av tilfellene lyser uten grunn. Tilslutt antar vi at det er 10% sjanse for at det er for lite olje p˚a bilen.

Sannsynligheten for at oljelampen lyser er gitt ved

P(varsel) =P(varsel og nok olje)P(nok olje) +P(varsel og lite olje)P(lite olje).

Dette gir den søkte sannsynligheten

P(lite olje|varsel) =P(lite olje og varsel)

P(varsel) =P(varsel|lite olje)P(lite olje) P(varsel)

= 0,99·0,10

0,02·0,90 + 0,99·0,1085%.

4.2 Uavhengighet

Hendelsene i familien{Ai} er uavhengige dersom vi har den generelle produktregelen Definisjon:

uavhengighet

P(Ai1∩ · · · ∩Ain) =P(Ai1)· · ·P(Ain), ij6=ik forj 6=k.

Det viktigste tilfellet er gitt ved at hendelseneA, Ber uavhengige dersomP(A∩B) =P(A)P(B), eller ekvivalent dersomP(A|B) =P(A∩B)/P(B) =P(A) i tilfellet hvorP(B)6= 0.

DersomAogBer uavhengige er sannsynligheten tilAgittBlik sannsynligheten tilA.

Eksempel 4.2.1 (Uavhengige myntkast) Utfallsrommet tilsvarendenmyntkast er gitt ved Ω ={k1. . . kn|kj= K, M}. Hver av de 2nmulige utfallene er like sannsynlige ved symmetri. Dermed erP(A) =P

ω∈A2−n. LaA1= “K i 1.kast” ogA2= “Mi 2.kast”. Da erP(A1) = 2n−1/2n= 1/2 og tilsvarende erP(A2) = 1/2 ogP(A1A2) = 1/4.

Dette gir P(A1A2) =P(A1)P(A2) og det er bevist at hendelsene A1 ogA2 er uavhengige. Det kan bevises tilsvarende at dersomA1, . . . , Aner hendelser tilsvarende resultatene i henholdsvis myntkast nummer 1, . . . , n, s˚a er hendelseneA1, . . . , Anuavhengige.

(37)

4.3. OPPGAVER 37

Tabell 4.1: Værmelding i forhold til tilsvarende observert vær.

Mynteksemplet ga et eksempel hvor vi kunne bevise at de gjentatte forsøkene var uavhengige. I det neste eksemplet er en antagelse om uavhengighet utgangspunktet for beregning av en sannsyn- lighet.

Eksempel 4.2.2 (Uavhengige lyskryss) a vei til jobben passerer Eva 4 lyskryss. Anta at hvert av lyskryssene lyser grønt 40 sekunder i løpet av hvert minutt. Anta videre at avstanden mellom lyskryssene er s˚a stor at hvert av lyskryssene er uavhengige. Sannsynligheten for at Eva m˚a stoppe minst tre ganger er da

P{RRRR, GRRR, RGRR, RRGR, RRRG}=P{RRRR}+ 4P{RRRG}

= (20/60)4+ 4(20/60)3(40/60) = 1/9.

4.3 Oppgaver

26 Tabell4.1gir sannsynligheter for snittet av hendelser definert av henholdsvis været og den tilsvarende værmeldingen til et meterologisk institutt. Hva er sannsynligheten for at det skal bli sol? Hva er sannsynligheten for regn dersom det var varslet sol? Hvor ofte gjetter instituttet galt?

Hvordan ville du g˚a frem for ˚a lage en tabell tilsvarende Tabell4.1?

27 La fordelingenP være eksponensialfordelingen med parameter λ. Vis at P((s+t,∞)|(t,∞)) =P(s,∞).

Hva betyr dette resultatet dersom fordelingen tilsvarer tiden mellom gruveulykker?

28 Hva er sannsynligheten for sekvensen “sort, sort, rød, hvit, hvit” n˚ar 5 brikker trekkes uten tilbakelegning fra en urne inneholdende 6 hvite, 4 sorte og 5 røde brikker?

29 En gambler har tre kort; det 1. er rødt p˚a begge sidene, det 2. er bl˚att p˚a begge sidene, det 3.

er rødt p˚a den ene siden og bl˚att p˚a den andre siden. Et kort trekkes tilfeldig og legges p˚a bordet.

Anta at kortet som vises er rødt. Gambleren vedder Kr 1000 p˚a at den andre siden av kortet er rødt? Bør du vedde i mot?

30 En bøyd mynt gir krone med dobbel s˚a stor sannsynlighet som den gir mynt. Dersom den viser krone, s˚a trekkes en brikke fra en urne med 3 hvite og 4 røde brikker. Dersom mynten viser mynt, s˚a trekkes en brikke fra en urne med 6 hvite og 3 røde brikker. Hva er sannsynligheten for at mynten viste mynt, n˚ar en hvit brikke ble trukket?

(38)

31 En sort og en hvit terning kastes. Se p˚a hendelseneA= “odde tall p˚a den sorte terningen”, B= “odde tall p˚a den hvite terningen” ogC= “summen p˚a terningene er odde”. Vis at hver av disse hendelsene er parvis uavhengige. Er hendelseneA, B, C uavhengige?

32 To terninger kastes. Hva er sannsynligheten for at den ene terningen viser dobbelt s˚a mange øyne som den andre?

33 Følgende problem ble stilt til Pascal av de M´er´e i 1654: Hvor mange ganger m˚a to terninger kastes for at sannsynligheten for ˚a f˚a minst en dobbel 6’er er større enn 1/2?

34 Vis at (]iAi)∩B=]i(Ai∩B).

35 La A være en hendelse slik at P(A) > 0. Vis at familien av alle hendelser inneholdt i A er en hendelsesfamilie i A. Vis at A blir et sannsynlighetsrom med fordeling Q n˚ar vi definerer Q(B) =P(B)/P(A). Hva er forskjellen p˚aQog den betingede sannsynligheten gittA?

36 Formuler og bevis Bayes teorem.

37 Vis ved ˚a anta uavhengighet at sannsynligheten for at du m˚a kaste en mynt 10 ganger før du f˚ar krone er lik (1/2)10. Kan du gi et argument som ikke bygger p˚a uavhengighet?

38 Skriv opp alle betingelser som skal være oppfylt for at hendelseneA1, A2, A3 er uavhengige.

Er hendelsene∅,∅,∅uavhengige?

39 Anta atAogB er uavhengige. Er daAogBc uavhengige?

Referanser

RELATERTE DOKUMENTER