Sannolikhetsfördelning
I Matte 1 fick vi lära oss grunderna i sannolikhet med olika utfall för en eller fler händelser och i Matte 2 fick vi bekanta oss med normalfördelning, vi kommer att fördjupa oss i dessa områden i detta avsnitt. Vi kommer mer specifikt lära oss hur vi kan integraler ska hjälpa oss att göra beräkningar inom sannolikhet med fokus på sannolikhetsfördelning. Vi börjar med att definiera slumpförsök, slumpvariabel och sannolikhetsfördelning.
Slumpförsök är en händelse som har ett utfall vi inte kan förutse, några exempel på slumpförsök kan vara att kasta en tärning, att singla slant, att dra en lott eller dra ett kort ur en kortlek.
Slumpvariabel är vilka resultat våra slumpförsök kan få, exempelvis är antal prickar en slumpvariabel vi får om vi har slumpförsöket att kasta en tärning.
Sannolikhetsfördelning beskriver utfallen i form av en funktion, detta kan vara både kontinuerligt och diskreta funktioner. Vi tittar på några exempel.
Exempel 1, sannolikhetsfördelning för kast med en tärning
Vi tittar på ett exempel som inte är en diskret sannolikhetsfördelning
Exempel 2, utifrån data från SMHI kan vi skapa en sannolikhetsfördelning för slumpvariabeln x nederbörd i mm och y-axeln motsvarar sannolikheten, likt föregående exempel.
Notera att summan av sannolikheterna, som vi oftast betecknar P (från engelskans probability), för alla utfall vid slumpförsök är alltid 1 eller i procent 100%. I Sannolikhetsfördelningarnas fall blir denna summa arean under funktionen, det första exemplet med tärningarna kan vi visa detta genom att bekräfta att summan av sannolikheterna i staplarna blir 1.
$$\frac{1}{6}+\frac{1}{6}+\frac{1}{6}+\frac{1}{6}+\frac{1}{6}+\frac{1}{6} = 1$$
Det andra exemplet med nederbörd kan vi visa med denna bild.
Täthetsfunktion är den funktion \(f(x)\) som beskriver sannolikhetsfördelningen och med hjälp av denna integral
$$\int_a^b f(x) \: dx$$
så kan vi svara på hur stor sannolikhet det är att en slumpvariabel x ligger i intervallet \(a \leq x \leq b\). Vi kan skriva detta som
$$P(a \leq x \leq b) = \int_a^b f(x) \: dx$$
Detta är så klart mest användbart när vi har kontinuerliga sannolikhetsfördelningar och det är svårt att beräkna arean under täthetsfunktionen (dvs integralen av \(f(x)\)) på något annat sätt. I tidigare exemplet med nederbörd skulle täthetsfunktionen bli den räta linjen \(f(x) = -0,000078125x+0,0125.\)
Normalfördelningen känner vi igen från Matte 2. Vi påminner oss om kurvan som normalfördelningen utgör ser ut så här:
Normalfördelningens täthetsfunktion är
$$f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{\frac{-1}{2}{\left(\frac{x-\mu}{\sigma}\right)}^2}$$
där \(\mu\) (grekisk bokstav som heter my) är medelvärdet och \(\sigma\) (grekisk bokstav som heter sigma) är standardavvikelsen. Alltså kan vi beräkna sannolikheten att en slumpvariabel ligger inom ett intervall.
Vi tittar på ett exempel där vi kan bekräfta att det är 68,2% chans att ett värde ligger plus/minus en standardavvikelse från medelvärdet i en normalfördelning.
Exempel 3: Längden på personer i land är normalfördelad och har medelvärde 175 cm och standardavvikelsen är 5 cm. Beräkna hur stor sannolikheten att en slumpvis vald person i landet är mellan 170 och 180 cm lång.
Detta intervall utgör medelvärde \(\pm\) 1 standardavvikelse och från våra tidigare kunskaper från Matte 2 och bilden ovan kan vi direkt veta att sannolikheten utgör blocken \(34,1%+34,1%=68,2%\), men vi vill bekräfta detta med hjälp av täthetsfunktionen, som vi för denna normalfördelning sätter in \(\mu = 175\) och \(\sigma = 5\)
$$f(x) = \frac{1}{5 \sqrt{2\pi}} e^{\frac{-1}{2}{\left(\frac{x-175}{5}\right)}^2}$$
Vi kan nu beräkna sannolikheten \(P(170 \leq x \leq 180)\) med integralen
$$ P(170 \leq x \leq 180) = \int_{170}^{180} \frac{1}{5 \sqrt{2\pi}} e^{\frac{-1}{2}{\left(\frac{x-175}{5}\right)}^2} \: dx \approx 0,682$$
Integralen löser vi med hjälp av digitala verktyg och bekräftar att sannolikheten var 0,682 = 68,2%.
Nästa exempel kan vi demonstrera hur täthetsfunktionen kan hjälpa oss beräkna sannolikheten för andra intervall än de som utgörs av en eller flera standardavvikelser.
Exempel 4: I en trädgård växer äppelträd och deras höjd är normalfördelad med medellängd \(\mu = 169\) cm och standardavvikelsen \(\sigma = 13\) cm. Beräkna sannolikheten att ett slumpmässigt valt träd, x har en höjd som ligger på intervallet \(180 \leq x \leq 200\).
Eftersom intervallet \(180 \leq x \leq 200\) inte utgörs av olika multiplar av 13 från 169 måste vi använda täthetsfunktionen. Täthetsfunktionen för de normalfördelade äppelträden blir
$$f(x) = \frac{1}{13 \sqrt{2\pi}} e^{\frac{-1}{2}{\left(\frac{x-169}{13}\right)}^2}$$
och vi kan sätta upp integralen för att beräkna sannolikheten
$$ P(180\leq x \leq 200) = \int_{180}^{200} \frac{1}{13 \sqrt{2\pi}} e^{\frac{-1}{2}{\left(\frac{x-169}{13}\right)}^2} \: dx$$
Hur beräknar vi denna funktion med hjälp av digitala hjälpmedel? Vi visar med GeoGebra. Vi börjar med att skriva in täthetsfunktionen och byter ut \(\mu = 169\) och \(\sigma = 13\).
Om du inte ser den typiska normalfördelade kurvan kan det bero på värdena på axlarna, notera att för att se kurvan visar vi x-axeln mellan \(100 \leq x\leq 240\) och y-axelns värden är \(-0,1 \leq y \leq 0,175\) för att kurvan ska synas.
Nu ställer vi upp integralen, det går antingen att börja skriva integral så kommer alternativen upp eller så klickar vi på "+" pluset och väljer ”Uttryck” och vi väljer det markerade nedan, Integral(Funktion, Från x-värde, Till x-värde)
Så väljer vi ”f” täthetsfunktionen vi skrivit in som "Funktion" och gränserna från 180 till 200 som nedan.
Vi får resultatet både i siffror och markerad som area under täthetsfunktionen.
Sannolikheten blir alltså
$$P(180\leq x \leq 200) = \int_{180}^{200} f(x) \: dx = \\ = 0,19018… \approx 19\%$$
Sammanfattning
Arean mellan en täthetsfunktionen \(y = f(x)\) och x-axeln är 1 och med hjälp av täthetsfunktionen kan vi beräkna en kontinuerlig slumpvariabel x antar ett värde mellan a och b med integralen
$$P(a \leq x \leq b) = \int_a^b f(x) \: dx$$
- Slumpförsök: en händelse som har ett utfall vi inte kan förutse
- Slumpvariabel: vilka resultat våra slumpförsök kan få
- Sannolikhetsfördelning: beskriver utfallen i form av en funktion, detta kan vara både kontinuerligt och diskreta funktioner.
- Täthetsfunktion:den funktion \(f(x)\) som beskriver sannolikhetsfördelningen
- Sannolikhet för en slumpvariabel i intervall: hur stor sannolikhet det är att en slumpvariabel x ligger i intervallet \(a \leq x \leq b\). Vi kan beräkna detta med integralen
$$P(a \leq x \leq b) = \int_a^b f(x) \: dx$$
där \(f(x)\) är täthetsfunktionen - Normalfördelnings täthetsfunktion: täthetsfunktionen \(f(x)\) för normalfördelade slumpariabler är
$$f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{\frac{-1}{2}{\left(\frac{x-\mu}{\sigma}\right)}^2}$$
där \(\sigma \) är standardavvikelsen och \(\mu\) är medelvärdet