Mattequiz for viderekomne

NRKbeta trenger hjelp av noen som er skarpe i matematikk / sansynlighetsberegning til å knekke en nøtt

Problemstillingen

Før jul bidro nesten 5000 NRKbeta-lesere med svar til artikkelen DUGNAD: Hva slags telefon har du og de rundt deg? Nå skal vi snart presentere svarene, men jeg sliter med å gjøre en sannsynlighetsberegning, og det gjorde endel kolleger jeg trodde var oppegående også. Å vite hvordan den skal løses krever mer skillz enn vi kunne skrape opp på en onsdag.

Men leserkretsen vår skjuler noen skarpinger, så vi kaster den ut til dere.

Knekk denne:

Hva er sannsynligheten for at minst 7 av 10 tilfeldige mennesker
har samme telefon-operativsystem, dersom vi sier at:
45 % i befolkningen har Android,
35 % iPhone og
20 % diverse andre typer?

Oppgi sannsynlighet pr telefontype.

Premien

Premien for å bidra til løsningen er å bli kreditert som mattegeni i NRKbeta-artikkelen når den publiseres.

Diskutér gjerne løsningen i kommentarfeltet! Om flere skulle bidra til å finne løsningen, har vi plass til flere genier i rulleteksten 🙂

30 kommentarer

Simen Fure Jørgensen

5. februar 2014 at 19:20

Jeg er ikke et mattegeni, men jeg har Coursera-kurs i R 🙂

Om jeg ikke tenker feil, burde det være summen av sannsynlighetene for at 7, 8, 9 og 10 mennesker med de gitte sannsynlighetene trekker «riktig»:

> dbinom(7, 10, 0.45) + dbinom(8, 10, 0.45) + dbinom(9, 10, 0.45) + dbinom(10, 10, 0.45)
[1] 0.1019949

> dbinom(7, 10, 0.35) + dbinom(8, 10, 0.35) + dbinom(9, 10, 0.35) + dbinom(10, 10, 0.35)
[1] 0.02602428

> dbinom(7, 10, 0.2) + dbinom(8, 10, 0.2) + dbinom(9, 10, 0.2) + dbinom(10, 10, 0.2)
[1] 0.0008643584

Altså 10,2% for Android, 2,6% iPhone og 0.09% for andre.

Noen andre får bekrefte 🙂

Svar på denne kommentaren

Tore Lund (svar til Simen Fure Jørgensen)
5. februar 2014 at 19:39

Jeg er enig i denne løsningen!
moe (svar til Simen Fure Jørgensen)
6. februar 2014 at 08:48

Ikke helt enig. Jeg tolker spørsmålet som at det er 7 av 10 uavhengig av det spesifikke operativsystemet.

Det spørres jo om «7 av 10 har samme operativsystem» Dette gjør oppgaven mer komplisert.

Det er ikke spurt etter hvor stor sannsynligheten er for at 7 av 10 har Android, 7 av 10 har iPhone eller 7 av 10 har annet…
Anders Hofseth (NRK) (svar til moe)
6. februar 2014 at 08:56

Det jeg lurer på er sannsynligheten for Android osv, så med mindre det er en tilleggsspissfindighet ved dette jeg ikke har forstått ennå, så får vi skylde på upresis spørsmålsformulering 😉
Børge N (svar til moe)
6. februar 2014 at 13:52

Siden hendelsene er gjensidige utelukkende (det kan ikke være minst 7 som har Android samtidig som minst 7 har iPhone) så er svaret på det overordnede spørsmålet 10,2% + 2,6% + 0,1% = 12,9%.

Hadde det vært spurt om «minst halvparten», så hadde det blitt mer kronglete. Se en.wikipedia.org/wiki/Multinomial_distribution

Anders Gjermshus

5. februar 2014 at 19:38

Kommer frem til samme svar.
Sannsynligheten for å få minst 7, er det samme som 1 – sannsynligheten for å få 1 til 6.
I Excel:
=1-BINOM.DIST(6;10;0.45;TRUE)=0.101995=10.2% for Android
=1-BINOM.DIST(6;10;0.35;TRUE)=0.026024=2.6% for IPhone
=1-BINOM.DIST(6;10;0.2;TRUE)=0.000864 = 0.09% for Andre

Svar på denne kommentaren

Anders Hofseth (NRK)

5. februar 2014 at 20:00

Dere, altså! 😀

Skulle spurt NRKbetaleserne med en gang. Fascinerende at de 10 prosentpoengene mellom android og iphone gir et såpass stort utslag i sannsynlighet.

Da trekker vi en foreløpig strek for genierklæringer, med mindre noen bestrider resultatene og har andre metoder.

Takk, takk, takk!

Svar på denne kommentaren

Haakon (svar til Anders Hofseth)
6. februar 2014 at 20:23

Jeg ser et fundamentalt problem i utregningen. Hvordan vet man at disse ti personene er representative for befolkningen? Det gjør man ikke, det er mulig at ingen av de ti har Android, kanskje alle har et annet operativ system.

Først må man regne ut de mulige distribusjonene for de 10 personene og sannsynligheten for de distribusjonene. Så kan man regne ut sannsynligheten for at de syv har samme system. Derfor har Bernt så langt gitt det beste svaret siden han trekker ut tilfeldige personer og sjekker hva de har, men det er ikke perfekt.

Så for å regne det ut eksakt må vi få antall personer i befolkningen.
Anders Hofseth (NRK) (svar til Haakon)
6. februar 2014 at 20:34

Vi snakker om Norge 15 år+, la oss for enkelhets skyld si feks 4 500 000
Haakon (svar til Anders Hofseth)
6. februar 2014 at 22:37

Nå beveger vi oss over til et nytt problem. De tallene og de metoden som har blitt antatt her antyder at dere har spurt en gitt mengde personer og så vil du finne sannsynligheten for at hvis du trekker 10 av de personene tilfeldig så har syv samme OS.

Så når du sier all over 15 så antar du at de spurte er at representativt utvalg for hele befolkningen, noe som er greit nok. Men! For å regne ut sannsynligheten dere ønsker må vi vite antall spurte og helst antall som svarte A, B og C. Ja dette er oppgitt i sannsynlighets prosenten, men er bedre med de eksakte tallene. På den måten veit jeg at alt går opp i opp.

Hvis du ikke vil gjøre det sånn så må du anta en viss fordeling i befolkningen, er en stund siden jeg har hatt behov for å regne på sånt, men det er ikke umulig. Tar bare litt tid å friske opp,

Børge N

5. februar 2014 at 21:32

Jeg vil slå et slag for WolframAlpha: f.eks. wolframalpha.com/input/?i=at+least+7+successes+in+10+trials+with+p%3D+.45

Svar på denne kommentaren

Tobias Laundal (NRK)

5. februar 2014 at 22:46

Må innrømme at jeg er litt skuffet nå. Dette er en bionomisk sannsynlighetsmodell, pensum i teoretisk førsteklassematte.

En bionomisk sannsynlighetsmodell er når man har et kriterie, som enten kan være sukess eller fiasko, som oppstår flere ganger. Bionomisk sansynlighetsmodell brukes til å regne sansynligheten for at x antall forsøk er vellykkede. I oppgaven har vi 10 forsøk, og det skal være sukess 7, 8, 9 eller 10 ganger. Den bionomiske sansynlighetsmodellen ser slik ut:
(n nCr r)*p^r*(1-p)^(n-r)
Da er n antall forsøk(10), r antall som må være oppfylt({7,8,9,10}) og p sannsynligheten for sukess.

Sannsynligheten for at minst 7 av 10 personer bruker en telefon med android som opperativsystem:
(10nCr7) * 0.45^7 * (1-0.45)^(10-7) + (10nCr8) * 0.45^8 * (1-0.45)^(10-8) + (10nCr9) * 0.45^9 * (1-0.45)^(10-9) + (10nCr10) * 0.45^10 * (1-0.45)^(10-10)

ca 10.2%

Sannsyligheten for at minst 7 av 10 personer bruker en iPhone:
(10nCr7) * 0.35^7 * (1-0.35)^(10-7) + (10nCr8) * 0.35^8 * (1-0.35)^(10-8) + (10nCr9) * 0.35^9 * (1-0.35)^(10-9) + (10nCr10) * 0.35^10 * (1-0.35)^(10-10)

ca 2.6%

Sannsynligheten for at minst 7 av 10 personer bruker en telefon med et annet operativsystem:
(10nCr7) * 0.20^7 * (1-0.20)^(10-7) + (10nCr8) * 0.20^8 * (1-0.20)^(10-8) + (10nCr9) * 0.20^9 * (1-0.20)^(10-9) + (10nCr10) * 0.20^10 * (1-0.20)^(10-10)

ca 0.09%

PS: Dette er samme svar som de andre, men med direkte, og full, utregning. Det kan regnes enklere på wolfram alpha, som Børge N viser.

Svar på denne kommentaren

Anders Hofseth (NRK) (svar til Tobias Laundal)
5. februar 2014 at 23:59

Hehe. Du må huske at du allerede nå i ung alder (og antagelig også da du hadde praksis i NRKbeta) løper ringer rundt meg i matematikk. Det er ikke blant mine sterkeste fag. Og mange av dem jeg har spurt i NRK (som ER gode i matte) har lagt noen tiår mellom seg selv og 1. gym. Det er endel som blir borte underveis.

Men takk for grundig oppsett; skal se om vi ikke klarer å klinke deg inn med en geni-medalje i saken. Børge N også, som først minnet oss på W.A.
Tobias Laundal (NRK) (svar til Anders Hofseth)
6. februar 2014 at 12:34

Tenkte meg nok at det var lenge siden =)

Men jeg lurer litt på hvordan denne statistikken skal brukes. Det vi har funnet ut er at dersom du velger 100 tillfeldige personer og lager 10er grupper av dem, skal det statistisk sett være en gruppe med 7 eller fler som bruker android. En mer naturlig fremstilling ville kanskje være at i gjennomsnitt 4 av 10(45 av 100 mer nøyaktig, 45%) bruker Android. Hva var tanken bak oppgaven?
John Embretsen (svar til Tobias Laundal)
6. februar 2014 at 09:53

For ordens skyld, for de av oss som har glemt mye av statistikken fra skolen, bør vi vel legge til at

(n nCr r) er binomialkoeffisienten, som er definert som n!/(k!*(n-k)!) hvis n>=k>=0.
Tobias Laundal (NRK) (svar til John Embretsen)
6. februar 2014 at 12:43

Godt poeng! Enkelt sagt er det hvor mange måter du kan velge r elementer ut av en mengde på n.

Regnestykket er jo egentlig
sannsynligheten for p, r ganger(p^r) * antall måter man kan velge r ut av n(n nCr r) * sannsynligheten for ikke p i resten((1-p)^(n-r))

Anders Brenna

6. februar 2014 at 11:15

Det finnes tre typer journalister:
De som lærte matte på skolen.
Og de som aldri skjønte det.

🙂

Svar på denne kommentaren

Bernt

6. februar 2014 at 15:49

Jeg er (svært) langt fra å være noe matte eller statistikk-geni men jeg har laget en simulering (koden er i Python):

import random


# Befolkningen (100 stk) med telefoner

telefoner = ["android"] * 45 + ["iphone"] * 35 + ["diverse"] * 20
simuleringer = 1000000

minst_7_av_10 = {"android": 0, "iphone": 0, "diverse": 0}

for _ in range(simuleringer):

    # Trekk ut ti tilfeldige telefoner

    tilfeldige = random.sample(telefoner, 10)

    for telefon in ["android", "iphone", "diverse"]:

        # Sjekk om det er minst sju av en telefontype

        if tilfeldige.count(telefon) >= 7:

            minst_7_av_10[telefon] += 1

for telefon in ["android", "iphone", "diverse"]: print("{:.3%} sjanse for at minst 7 av 10 har {}".format(minst_7_av_10[telefon] / simuleringer, telefon))

Her er resultatet av noen kjøringer:
8.992% sjanse for at minst 7 av 10 har android 1.995% sjanse for at minst 7 av 10 har iphone 0.041% sjanse for at minst 7 av 10 har diverse

9.014% sjanse for at minst 7 av 10 har android 2.023% sjanse for at minst 7 av 10 har iphone 0.038% sjanse for at minst 7 av 10 har diverse

9.012% sjanse for at minst 7 av 10 har android 2.031% sjanse for at minst 7 av 10 har iphone 0.037% sjanse for at minst 7 av 10 har diverse

8.995% sjanse for at minst 7 av 10 har android 2.005% sjanse for at minst 7 av 10 har iphone 0.040% sjanse for at minst 7 av 10 har diverse

Svar på denne kommentaren

Bernt (svar til Bernt)
6. februar 2014 at 15:52

Koden ble formattert på en sørgelig måte i kommentaren over (og det er litt trist i og med at whitespace er temmelig viktig i Python).

Se heller her: gist.github.com/codeape2/8844558
Bernt (svar til Bernt)
6. februar 2014 at 16:08

Gjorde et nytt forsøk med numpy. Det virker som om random-generatoren i numpy er bedre? I hvert fall blir resultatene litt annerledes, og passer med det som er regnet ut.

Her er numpy-koden: gist.github.com/codeape2/8844774

Og resultatet av noen kjøringer:
10.241% sjanse for at minst 7 av 10 har android 2.564% sjanse for at minst 7 av 10 har iphone 0.085% sjanse for at minst 7 av 10 har diverse
10.208% sjanse for at minst 7 av 10 har android 2.588% sjanse for at minst 7 av 10 har iphone 0.085% sjanse for at minst 7 av 10 har diverse
10.171% sjanse for at minst 7 av 10 har android 2.597% sjanse for at minst 7 av 10 har iphone 0.088% sjanse for at minst 7 av 10 har diverse

Jørn Bjerkmo

6. februar 2014 at 18:29

kan denne her stemme?

10 av 10:
Android: 0,45^10 = 0,0340%
Iphone: 0,35^10 = 0,00275%
Div.: 0,2^10 = 0,000010%

9 av 10:
her er det 10 forskjellige kombo.
Android: 10*(0,45^9)*(0,55^1) = 0,4161%
Iphone: 10*(0,35^9)*(0,65^1) = 0,0512%
Div.: 10*(0,2^9)*(0,8^1) = 0,0004096%

8 av 10:
Her er det vel 45 forskjellige kombo (?)
Android: 45*(0,45^8)*(0,55^2) = 2,289%
Iphone: 45* (0,35^8)*(0,65^2) = 1,317%
Div.: 45*(0,2^8)*(0,8^2) = 0,00737%

7 av 10:
Her er det vel 120 forskjellige kombo (?)
Android: 120*(0,45^7)*(0,55^3) = 7,46%
Iphone: 120*(0,35^7)*(0,65^3) = 2,12%
Div.: 120*(0,2^7)*(0,8^3) = 0,0786%

Siden det ble spurt om MINST 7 av de 10 må sanns for 7,8,9 og 10 for de ulike operativsystene summeres, og man får:

Android: Ca.10,20%
Iphone: Ca 3,49%
Div.: 0,086%

Kan ikke dette bli korrekt?

Svar på denne kommentaren

Jørn Bjerkmo (svar til Jørn Bjerkmo)
6. februar 2014 at 18:38

Ser det ble en feil under 8 av 10, på Iphone.
Formelen skal være rett, men summen til hæyre for likhetstegner blir ikke 1,317%, men 0,4281%.

DEtte gir da en endring i minst 7 av 10 på Iphone fra ca 3,49% til ca. 2,60%

Oppsummert blir da vel svarene:

Android: 10,20%
Iphone: 2,60%
Div.: 0,086%

Eller er jeg helt ute å kjøre? 😉
Tobias Laundal (NRK) (svar til Jørn Bjerkmo)
6. februar 2014 at 22:46

Det matcher de aller fleste andre svarene ser det ut til. Du bruker samme utregning også, men du regner helt manuelt. Kombinasjonene kan regnes med en funksjon som heter nCr. For eksempel 10 nCr 9 som blir 10, det er ti måter å velge ni personer ut av ti på.
Jørn Bjerkmo (svar til Tobias Laundal)
7. februar 2014 at 00:08

Husker nCr fra videregående for altfor lenge siden, men hadde ikke tenkt over at det var den som skulle brukes her. I tillegg hadde jeg ikke noen kalkulator som «handler» slikt.
Dermed måtte jeg bare tenke ut alle komboene…

F.eks med 8 av 10 er f.eks iphone (= 2 av 10 ikke er Iphone): så kan man lage 9 forskjellige komboer med «ikke-ønskede-utfall», hvor 1 er den første. (1og2, 1og3, 1og4………..1og9)
+ 8 forskjellige med 2 som første ( 2og3, 2og4…..2og9), Ikke 2og1, da det er det samme som 1og2 i dette tilfellet der rekkefølge ikke betyr noenting
til slutt ender man opp med antall komboer som er = 9+8+7+6+5+4+3+2+1 = 45

På samme måte finner man at 7 av 10 er f.eks iphone (= 3 av 10 ikker er iphone) gir:
(8+7+6+5+4+3+2+1)+(7+6+5+4+3+2+1)+(6+5+4+3+2+1)+(5+4+3+2+1)+(4+3+2+1)+(3+2+1)+(2+1)+(1) = 120 komboer.

Harald Korneliussen

6. februar 2014 at 19:49

Først ble jeg overrasket over at NRKBeta ikke fant svaret med en av de utallige måtene datakyndige folk har til sin disposisjon (som vi ser i kommentarfeltet: Wolfram Alpha, en rask simulering i python, excel osv.). Om de så ikke husker sin matte fra VG1, så er det da ingen tvil om at de er datakyndige?

Så slo det meg: Hei, VI er en av måtene de har til sin disposisjon!!

Dette var en litt vel billig løsning, NRKBeta 😉

Svar på denne kommentaren

Anders Hofseth (NRK) (svar til Harald Korneliussen)
6. februar 2014 at 20:04

Hehe
Jeg mener det finnes en saying som går noe i retning «den viktigste kunnskapen er å vite hvem du skal spørre». NRKbeta-leserne er klart en av de mest anvendelige knivene i skuffen.

Frode

6. februar 2014 at 21:19

De som har andre operativsystem (som Sailfish, Windows, Maemo, Symbian, etc.) har ikke nødvendigvis det samme.
Må vel da anta de ikke har likt der 7 eller flere har annet.

Svar på denne kommentaren

Tobias Laundal (NRK) (svar til Frode)
6. februar 2014 at 22:44

Det stemmer for så vidt, men man kan si at det er ca 0.9% sannsynlighet for at minst 7 av 10 bruker et annet operativsystem. Da har det ikke noe å si hva de andre har. Når minst 7 av 10 har android, er det værre å vite sannsynligheten for at resten bruker det samme system, men det har ikke noe å si. Derfor har det egentlig ikke noe å si for utregningen.
Frode (svar til Tobias Laundal)
7. februar 2014 at 20:34

Enig.
Men poenget er man ikke bør ta med 0.9% sansynlighet for disse har likt.

Steinar H. Gunderson

9. februar 2014 at 13:18

(Jeg har med vilje ikke lest de andre svarene etter at jeg innså at folk diskuterte løsninger i kommentarfeltet.)

Jeg gjør først antagelsen at siden 20% er «diverse andre typer», ville det ikke telt om 7/10 eller flere hadde en «annen»-telefon, for det ville ikke vært gitt at de hadde samme type (dette er spørsmål om tolkningen av oppgaven, ikke utregning). Så det vi vil ha er sannsynligheten for minst sju Android-telefoner, eller sju overprisede murstein med eplelogo.

Da er det snakk om en ganske grei binomisk fordeling; du deler opp i “one-versus-all” to ganger. Så det vi vil ha er

P(n, p) = binomial(10, n) p^n (1-p)^(10-n)
p(android) = 0.45, p(iphone) = 0.35

P(android >= 7) = p(7, 0.45) + p(8, 0.45) + p(9, 0.45) + p(10, 0.45) = 0.1019949456
P(iphone >= 7) = p(7, 0.35) + p(8, 0.35) + p(9, 0.35) + p(10, 0.35) = 0.02602428050

Så, p = 0.1280192261, avrundet til to gjeldende siffer blir det 13%.

Du kan si det er lite elegant å summere opp masse binomer sånn, men det er faktisk ingen annen måte å få det eksakt på, skjønt idet n begynner å nærme seg 30 kan du begynne med (gode) tilnærminger basert på normalfordeling. Se f.eks. en.wikipedia.org/wiki/Binomial_proportion_confidence_interval#Wilson_score_interval_with_continuity_…

/* Steinar */

Svar på denne kommentaren

Legg igjen en kommentar Avbryt svar

Simen Fure Jørgensen
5. februar 2014 at 19:20

Jeg er ikke et mattegeni, men jeg har Coursera-kurs i R 🙂

Om jeg ikke tenker feil, burde det være summen av sannsynlighetene for at 7, 8, 9 og 10 mennesker med de gitte sannsynlighetene trekker «riktig»:

> dbinom(7, 10, 0.45) + dbinom(8, 10, 0.45) + dbinom(9, 10, 0.45) + dbinom(10, 10, 0.45)
[1] 0.1019949

> dbinom(7, 10, 0.35) + dbinom(8, 10, 0.35) + dbinom(9, 10, 0.35) + dbinom(10, 10, 0.35)
[1] 0.02602428

> dbinom(7, 10, 0.2) + dbinom(8, 10, 0.2) + dbinom(9, 10, 0.2) + dbinom(10, 10, 0.2)
[1] 0.0008643584

Altså 10,2% for Android, 2,6% iPhone og 0.09% for andre.

Noen andre får bekrefte 🙂

Svar på denne kommentaren

Anders Gjermshus
5. februar 2014 at 19:38

Kommer frem til samme svar.
Sannsynligheten for å få minst 7, er det samme som 1 – sannsynligheten for å få 1 til 6.
I Excel:
=1-BINOM.DIST(6;10;0.45;TRUE)=0.101995=10.2% for Android
=1-BINOM.DIST(6;10;0.35;TRUE)=0.026024=2.6% for IPhone
=1-BINOM.DIST(6;10;0.2;TRUE)=0.000864 = 0.09% for Andre

Svar på denne kommentaren
Anders Hofseth (NRK)
5. februar 2014 at 20:00

Dere, altså! 😀

Skulle spurt NRKbetaleserne med en gang. Fascinerende at de 10 prosentpoengene mellom android og iphone gir et såpass stort utslag i sannsynlighet.

Da trekker vi en foreløpig strek for genierklæringer, med mindre noen bestrider resultatene og har andre metoder.

Takk, takk, takk!

Svar på denne kommentaren

Børge N
5. februar 2014 at 21:32

Jeg vil slå et slag for WolframAlpha: f.eks. wolframalpha.com/input/?i=at+least+7+successes+in+10+trials+with+p%3D+.45

Svar på denne kommentaren
Tobias Laundal (NRK)
5. februar 2014 at 22:46

Må innrømme at jeg er litt skuffet nå. Dette er en bionomisk sannsynlighetsmodell, pensum i teoretisk førsteklassematte.

En bionomisk sannsynlighetsmodell er når man har et kriterie, som enten kan være sukess eller fiasko, som oppstår flere ganger. Bionomisk sansynlighetsmodell brukes til å regne sansynligheten for at x antall forsøk er vellykkede. I oppgaven har vi 10 forsøk, og det skal være sukess 7, 8, 9 eller 10 ganger. Den bionomiske sansynlighetsmodellen ser slik ut:
(n nCr r)*p^r*(1-p)^(n-r)
Da er n antall forsøk(10), r antall som må være oppfylt({7,8,9,10}) og p sannsynligheten for sukess.

Sannsynligheten for at minst 7 av 10 personer bruker en telefon med android som opperativsystem:
(10nCr7) * 0.45^7 * (1-0.45)^(10-7) + (10nCr8) * 0.45^8 * (1-0.45)^(10-8) + (10nCr9) * 0.45^9 * (1-0.45)^(10-9) + (10nCr10) * 0.45^10 * (1-0.45)^(10-10)

ca 10.2%

Sannsyligheten for at minst 7 av 10 personer bruker en iPhone:
(10nCr7) * 0.35^7 * (1-0.35)^(10-7) + (10nCr8) * 0.35^8 * (1-0.35)^(10-8) + (10nCr9) * 0.35^9 * (1-0.35)^(10-9) + (10nCr10) * 0.35^10 * (1-0.35)^(10-10)

ca 2.6%

Sannsynligheten for at minst 7 av 10 personer bruker en telefon med et annet operativsystem:
(10nCr7) * 0.20^7 * (1-0.20)^(10-7) + (10nCr8) * 0.20^8 * (1-0.20)^(10-8) + (10nCr9) * 0.20^9 * (1-0.20)^(10-9) + (10nCr10) * 0.20^10 * (1-0.20)^(10-10)

ca 0.09%

PS: Dette er samme svar som de andre, men med direkte, og full, utregning. Det kan regnes enklere på wolfram alpha, som Børge N viser.

Svar på denne kommentaren

Anders Brenna
6. februar 2014 at 11:15

Det finnes tre typer journalister:
De som lærte matte på skolen.
Og de som aldri skjønte det.

🙂

Svar på denne kommentaren
Bernt
6. februar 2014 at 15:49

Jeg er (svært) langt fra å være noe matte eller statistikk-geni men jeg har laget en simulering (koden er i Python):

import random
# Befolkningen (100 stk) med telefoner telefoner = ["android"] * 45 + ["iphone"] * 35 + ["diverse"] * 20 simuleringer = 1000000 minst_7_av_10 = {"android": 0, "iphone": 0, "diverse": 0} for _ in range(simuleringer): # Trekk ut ti tilfeldige telefoner tilfeldige = random.sample(telefoner, 10) for telefon in ["android", "iphone", "diverse"]: # Sjekk om det er minst sju av en telefontype if tilfeldige.count(telefon) >= 7: minst_7_av_10[telefon] += 1
for telefon in ["android", "iphone", "diverse"]: print("{:.3%} sjanse for at minst 7 av 10 har {}".format(minst_7_av_10[telefon] / simuleringer, telefon))

Her er resultatet av noen kjøringer:
8.992% sjanse for at minst 7 av 10 har android 1.995% sjanse for at minst 7 av 10 har iphone 0.041% sjanse for at minst 7 av 10 har diverse

9.014% sjanse for at minst 7 av 10 har android 2.023% sjanse for at minst 7 av 10 har iphone 0.038% sjanse for at minst 7 av 10 har diverse

9.012% sjanse for at minst 7 av 10 har android 2.031% sjanse for at minst 7 av 10 har iphone 0.037% sjanse for at minst 7 av 10 har diverse

8.995% sjanse for at minst 7 av 10 har android 2.005% sjanse for at minst 7 av 10 har iphone 0.040% sjanse for at minst 7 av 10 har diverse

Svar på denne kommentaren

Jørn Bjerkmo
6. februar 2014 at 18:29

kan denne her stemme?

10 av 10:
Android: 0,45^10 = 0,0340%
Iphone: 0,35^10 = 0,00275%
Div.: 0,2^10 = 0,000010%

9 av 10:
her er det 10 forskjellige kombo.
Android: 10*(0,45^9)*(0,55^1) = 0,4161%
Iphone: 10*(0,35^9)*(0,65^1) = 0,0512%
Div.: 10*(0,2^9)*(0,8^1) = 0,0004096%

8 av 10:
Her er det vel 45 forskjellige kombo (?)
Android: 45*(0,45^8)*(0,55^2) = 2,289%
Iphone: 45* (0,35^8)*(0,65^2) = 1,317%
Div.: 45*(0,2^8)*(0,8^2) = 0,00737%

7 av 10:
Her er det vel 120 forskjellige kombo (?)
Android: 120*(0,45^7)*(0,55^3) = 7,46%
Iphone: 120*(0,35^7)*(0,65^3) = 2,12%
Div.: 120*(0,2^7)*(0,8^3) = 0,0786%

Siden det ble spurt om MINST 7 av de 10 må sanns for 7,8,9 og 10 for de ulike operativsystene summeres, og man får:

Android: Ca.10,20%
Iphone: Ca 3,49%
Div.: 0,086%

Kan ikke dette bli korrekt?

Svar på denne kommentaren

Harald Korneliussen
6. februar 2014 at 19:49

Først ble jeg overrasket over at NRKBeta ikke fant svaret med en av de utallige måtene datakyndige folk har til sin disposisjon (som vi ser i kommentarfeltet: Wolfram Alpha, en rask simulering i python, excel osv.). Om de så ikke husker sin matte fra VG1, så er det da ingen tvil om at de er datakyndige?

Så slo det meg: Hei, VI er en av måtene de har til sin disposisjon!!

Dette var en litt vel billig løsning, NRKBeta 😉

Svar på denne kommentaren

Frode
6. februar 2014 at 21:19

De som har andre operativsystem (som Sailfish, Windows, Maemo, Symbian, etc.) har ikke nødvendigvis det samme.
Må vel da anta de ikke har likt der 7 eller flere har annet.

Svar på denne kommentaren

Steinar H. Gunderson
9. februar 2014 at 13:18

(Jeg har med vilje ikke lest de andre svarene etter at jeg innså at folk diskuterte løsninger i kommentarfeltet.)

Jeg gjør først antagelsen at siden 20% er «diverse andre typer», ville det ikke telt om 7/10 eller flere hadde en «annen»-telefon, for det ville ikke vært gitt at de hadde samme type (dette er spørsmål om tolkningen av oppgaven, ikke utregning). Så det vi vil ha er sannsynligheten for minst sju Android-telefoner, eller sju overprisede murstein med eplelogo.

Da er det snakk om en ganske grei binomisk fordeling; du deler opp i “one-versus-all” to ganger. Så det vi vil ha er

P(n, p) = binomial(10, n) p^n (1-p)^(10-n)
p(android) = 0.45, p(iphone) = 0.35

P(android >= 7) = p(7, 0.45) + p(8, 0.45) + p(9, 0.45) + p(10, 0.45) = 0.1019949456
P(iphone >= 7) = p(7, 0.35) + p(8, 0.35) + p(9, 0.35) + p(10, 0.35) = 0.02602428050

Så, p = 0.1280192261, avrundet til to gjeldende siffer blir det 13%.

Du kan si det er lite elegant å summere opp masse binomer sånn, men det er faktisk ingen annen måte å få det eksakt på, skjønt idet n begynner å nærme seg 30 kan du begynne med (gode) tilnærminger basert på normalfordeling. Se f.eks. en.wikipedia.org/wiki/Binomial_proportion_confidence_interval#Wilson_score_interval_with_continuity_…

/* Steinar */

Svar på denne kommentaren

Vis 30 kommentarer

Problemstillingen

Knekk denne:

Premien

30 kommentarer

Simen Fure Jørgensen

Tore Lund (svar til Simen Fure Jørgensen)

moe (svar til Simen Fure Jørgensen)

Anders Hofseth (NRK) (svar til moe)

Børge N (svar til moe)

Anders Gjermshus

Anders Hofseth (NRK)

Haakon (svar til Anders Hofseth)

Anders Hofseth (NRK) (svar til Haakon)

Haakon (svar til Anders Hofseth)

Børge N

Tobias Laundal (NRK)

Anders Hofseth (NRK) (svar til Tobias Laundal)

Tobias Laundal (NRK) (svar til Anders Hofseth)

John Embretsen (svar til Tobias Laundal)

Tobias Laundal (NRK) (svar til John Embretsen)

Anders Brenna

Bernt

Bernt (svar til Bernt)

Bernt (svar til Bernt)

Jørn Bjerkmo

Jørn Bjerkmo (svar til Jørn Bjerkmo)

Tobias Laundal (NRK) (svar til Jørn Bjerkmo)

Jørn Bjerkmo (svar til Tobias Laundal)

Harald Korneliussen

Anders Hofseth (NRK) (svar til Harald Korneliussen)

Frode

Tobias Laundal (NRK) (svar til Frode)

Frode (svar til Tobias Laundal)

Steinar H. Gunderson

Legg igjen en kommentar Avbryt svar