nrk.no

Mattequiz for viderekomne

Kategori: Forskning


NRKbeta trenger hjelp av noen som er skarpe i matematikk / sansynlighetsberegning til å knekke en nøtt

Problemstillingen

Før jul bidro nesten 5000 NRKbeta-lesere med svar til artikkelen DUGNAD: Hva slags telefon har du og de rundt deg? Nå skal vi snart presentere svarene, men jeg sliter med å gjøre en sannsynlighetsberegning, og det gjorde endel kolleger jeg trodde var oppegående også. Å vite hvordan den skal løses krever mer skillz enn vi kunne skrape opp på en onsdag.

Men leserkretsen vår skjuler noen skarpinger, så vi kaster den ut til dere.

Knekk denne:

Hva er sannsynligheten for at minst 7 av 10 tilfeldige mennesker
har samme telefon-operativsystem, dersom vi sier at:
45 % i befolkningen har Android,
35 % iPhone og
20 % diverse andre typer?

Oppgi sannsynlighet pr telefontype.

Premien

Premien for å bidra til løsningen er å bli kreditert som mattegeni i NRKbeta-artikkelen når den publiseres.

Diskutér gjerne løsningen i kommentarfeltet! Om flere skulle bidra til å finne løsningen, har vi plass til flere genier i rulleteksten 🙂

30 kommentarer

  1. Simen Fure Jørgensen

    Jeg er ikke et mattegeni, men jeg har Coursera-kurs i R 🙂

    Om jeg ikke tenker feil, burde det være summen av sannsynlighetene for at 7, 8, 9 og 10 mennesker med de gitte sannsynlighetene trekker «riktig»:

    > dbinom(7, 10, 0.45) + dbinom(8, 10, 0.45) + dbinom(9, 10, 0.45) + dbinom(10, 10, 0.45)
    [1] 0.1019949

    > dbinom(7, 10, 0.35) + dbinom(8, 10, 0.35) + dbinom(9, 10, 0.35) + dbinom(10, 10, 0.35)
    [1] 0.02602428

    > dbinom(7, 10, 0.2) + dbinom(8, 10, 0.2) + dbinom(9, 10, 0.2) + dbinom(10, 10, 0.2)
    [1] 0.0008643584

    Altså 10,2% for Android, 2,6% iPhone og 0.09% for andre.

    Noen andre får bekrefte 🙂

    Svar på denne kommentaren

    • Ikke helt enig. Jeg tolker spørsmålet som at det er 7 av 10 uavhengig av det spesifikke operativsystemet.

      Det spørres jo om «7 av 10 har samme operativsystem» Dette gjør oppgaven mer komplisert.

      Det er ikke spurt etter hvor stor sannsynligheten er for at 7 av 10 har Android, 7 av 10 har iPhone eller 7 av 10 har annet…

    • Anders Hofseth (NRK) (svar til moe)

      Det jeg lurer på er sannsynligheten for Android osv, så med mindre det er en tilleggsspissfindighet ved dette jeg ikke har forstått ennå, så får vi skylde på upresis spørsmålsformulering 😉

    • Børge N (svar til moe)

      Siden hendelsene er gjensidige utelukkende (det kan ikke være minst 7 som har Android samtidig som minst 7 har iPhone) så er svaret på det overordnede spørsmålet 10,2% + 2,6% + 0,1% = 12,9%.

      Hadde det vært spurt om «minst halvparten», så hadde det blitt mer kronglete. Se en.wikipedia.org/wiki/Multinomial_distribution

  2. Anders Gjermshus

    Kommer frem til samme svar.
    Sannsynligheten for å få minst 7, er det samme som 1 – sannsynligheten for å få 1 til 6.
    I Excel:
    =1-BINOM.DIST(6;10;0.45;TRUE)=0.101995=10.2% for Android
    =1-BINOM.DIST(6;10;0.35;TRUE)=0.026024=2.6% for IPhone
    =1-BINOM.DIST(6;10;0.2;TRUE)=0.000864 = 0.09% for Andre

    Svar på denne kommentaren

  3. Anders Hofseth (NRK)

    Dere, altså! 😀

    Skulle spurt NRKbetaleserne med en gang. Fascinerende at de 10 prosentpoengene mellom android og iphone gir et såpass stort utslag i sannsynlighet.

    Da trekker vi en foreløpig strek for genierklæringer, med mindre noen bestrider resultatene og har andre metoder.

    Takk, takk, takk!

    Svar på denne kommentaren

    • Jeg ser et fundamentalt problem i utregningen. Hvordan vet man at disse ti personene er representative for befolkningen? Det gjør man ikke, det er mulig at ingen av de ti har Android, kanskje alle har et annet operativ system.

      Først må man regne ut de mulige distribusjonene for de 10 personene og sannsynligheten for de distribusjonene. Så kan man regne ut sannsynligheten for at de syv har samme system. Derfor har Bernt så langt gitt det beste svaret siden han trekker ut tilfeldige personer og sjekker hva de har, men det er ikke perfekt.

      Så for å regne det ut eksakt må vi få antall personer i befolkningen.

    • Nå beveger vi oss over til et nytt problem. De tallene og de metoden som har blitt antatt her antyder at dere har spurt en gitt mengde personer og så vil du finne sannsynligheten for at hvis du trekker 10 av de personene tilfeldig så har syv samme OS.

      Så når du sier all over 15 så antar du at de spurte er at representativt utvalg for hele befolkningen, noe som er greit nok. Men! For å regne ut sannsynligheten dere ønsker må vi vite antall spurte og helst antall som svarte A, B og C. Ja dette er oppgitt i sannsynlighets prosenten, men er bedre med de eksakte tallene. På den måten veit jeg at alt går opp i opp.

      Hvis du ikke vil gjøre det sånn så må du anta en viss fordeling i befolkningen, er en stund siden jeg har hatt behov for å regne på sånt, men det er ikke umulig. Tar bare litt tid å friske opp,

  4. Tobias Laundal (NRK)

    Må innrømme at jeg er litt skuffet nå. Dette er en bionomisk sannsynlighetsmodell, pensum i teoretisk førsteklassematte.

    En bionomisk sannsynlighetsmodell er når man har et kriterie, som enten kan være sukess eller fiasko, som oppstår flere ganger. Bionomisk sansynlighetsmodell brukes til å regne sansynligheten for at x antall forsøk er vellykkede. I oppgaven har vi 10 forsøk, og det skal være sukess 7, 8, 9 eller 10 ganger. Den bionomiske sansynlighetsmodellen ser slik ut:
    (n nCr r)*p^r*(1-p)^(n-r)
    Da er n antall forsøk(10), r antall som må være oppfylt({7,8,9,10}) og p sannsynligheten for sukess.

    Sannsynligheten for at minst 7 av 10 personer bruker en telefon med android som opperativsystem:
    (10nCr7) * 0.45^7 * (1-0.45)^(10-7) + (10nCr8) * 0.45^8 * (1-0.45)^(10-8) + (10nCr9) * 0.45^9 * (1-0.45)^(10-9) + (10nCr10) * 0.45^10 * (1-0.45)^(10-10)

    ca 10.2%

    Sannsyligheten for at minst 7 av 10 personer bruker en iPhone:
    (10nCr7) * 0.35^7 * (1-0.35)^(10-7) + (10nCr8) * 0.35^8 * (1-0.35)^(10-8) + (10nCr9) * 0.35^9 * (1-0.35)^(10-9) + (10nCr10) * 0.35^10 * (1-0.35)^(10-10)

    ca 2.6%

    Sannsynligheten for at minst 7 av 10 personer bruker en telefon med et annet operativsystem:
    (10nCr7) * 0.20^7 * (1-0.20)^(10-7) + (10nCr8) * 0.20^8 * (1-0.20)^(10-8) + (10nCr9) * 0.20^9 * (1-0.20)^(10-9) + (10nCr10) * 0.20^10 * (1-0.20)^(10-10)

    ca 0.09%

    PS: Dette er samme svar som de andre, men med direkte, og full, utregning. Det kan regnes enklere på wolfram alpha, som Børge N viser.

    Svar på denne kommentaren

    • Anders Hofseth (NRK) (svar til Tobias Laundal)

      Hehe. Du må huske at du allerede nå i ung alder (og antagelig også da du hadde praksis i NRKbeta) løper ringer rundt meg i matematikk. Det er ikke blant mine sterkeste fag. Og mange av dem jeg har spurt i NRK (som ER gode i matte) har lagt noen tiår mellom seg selv og 1. gym. Det er endel som blir borte underveis.

      Men takk for grundig oppsett; skal se om vi ikke klarer å klinke deg inn med en geni-medalje i saken. Børge N også, som først minnet oss på W.A.

    • Tobias Laundal (NRK) (svar til Anders Hofseth)

      Tenkte meg nok at det var lenge siden =)

      Men jeg lurer litt på hvordan denne statistikken skal brukes. Det vi har funnet ut er at dersom du velger 100 tillfeldige personer og lager 10er grupper av dem, skal det statistisk sett være en gruppe med 7 eller fler som bruker android. En mer naturlig fremstilling ville kanskje være at i gjennomsnitt 4 av 10(45 av 100 mer nøyaktig, 45%) bruker Android. Hva var tanken bak oppgaven?

    • Tobias Laundal (NRK) (svar til John Embretsen)

      Godt poeng! Enkelt sagt er det hvor mange måter du kan velge r elementer ut av en mengde på n.

      Regnestykket er jo egentlig
      sannsynligheten for p, r ganger(p^r) * antall måter man kan velge r ut av n(n nCr r) * sannsynligheten for ikke p i resten((1-p)^(n-r))

  5. Jeg er (svært) langt fra å være noe matte eller statistikk-geni men jeg har laget en simulering (koden er i Python):


    import random

    # Befolkningen (100 stk) med telefoner
    telefoner = ["android"] * 45 + ["iphone"] * 35 + ["diverse"] * 20

    simuleringer = 1000000
    minst_7_av_10 = {"android": 0, "iphone": 0, "diverse": 0}
    for _ in range(simuleringer):
    # Trekk ut ti tilfeldige telefoner
    tilfeldige = random.sample(telefoner, 10)
    for telefon in ["android", "iphone", "diverse"]:
    # Sjekk om det er minst sju av en telefontype
    if tilfeldige.count(telefon) >= 7:
    minst_7_av_10[telefon] += 1

    for telefon in ["android", "iphone", "diverse"]:
    print("{:.3%} sjanse for at minst 7 av 10 har {}".format(minst_7_av_10[telefon] / simuleringer, telefon))

    Her er resultatet av noen kjøringer:

    8.992% sjanse for at minst 7 av 10 har android
    1.995% sjanse for at minst 7 av 10 har iphone
    0.041% sjanse for at minst 7 av 10 har diverse


    9.014% sjanse for at minst 7 av 10 har android
    2.023% sjanse for at minst 7 av 10 har iphone
    0.038% sjanse for at minst 7 av 10 har diverse


    9.012% sjanse for at minst 7 av 10 har android
    2.031% sjanse for at minst 7 av 10 har iphone
    0.037% sjanse for at minst 7 av 10 har diverse


    8.995% sjanse for at minst 7 av 10 har android
    2.005% sjanse for at minst 7 av 10 har iphone
    0.040% sjanse for at minst 7 av 10 har diverse

    Svar på denne kommentaren

    • Bernt (svar til Bernt)

      Gjorde et nytt forsøk med numpy. Det virker som om random-generatoren i numpy er bedre? I hvert fall blir resultatene litt annerledes, og passer med det som er regnet ut.

      Her er numpy-koden: gist.github.com/codeape2/8844774

      Og resultatet av noen kjøringer:

      10.241% sjanse for at minst 7 av 10 har android
      2.564% sjanse for at minst 7 av 10 har iphone
      0.085% sjanse for at minst 7 av 10 har diverse

      10.208% sjanse for at minst 7 av 10 har android
      2.588% sjanse for at minst 7 av 10 har iphone
      0.085% sjanse for at minst 7 av 10 har diverse

      10.171% sjanse for at minst 7 av 10 har android
      2.597% sjanse for at minst 7 av 10 har iphone
      0.088% sjanse for at minst 7 av 10 har diverse

  6. Jørn Bjerkmo

    kan denne her stemme?

    10 av 10:
    Android: 0,45^10 = 0,0340%
    Iphone: 0,35^10 = 0,00275%
    Div.: 0,2^10 = 0,000010%

    9 av 10:
    her er det 10 forskjellige kombo.
    Android: 10*(0,45^9)*(0,55^1) = 0,4161%
    Iphone: 10*(0,35^9)*(0,65^1) = 0,0512%
    Div.: 10*(0,2^9)*(0,8^1) = 0,0004096%

    8 av 10:
    Her er det vel 45 forskjellige kombo (?)
    Android: 45*(0,45^8)*(0,55^2) = 2,289%
    Iphone: 45* (0,35^8)*(0,65^2) = 1,317%
    Div.: 45*(0,2^8)*(0,8^2) = 0,00737%

    7 av 10:
    Her er det vel 120 forskjellige kombo (?)
    Android: 120*(0,45^7)*(0,55^3) = 7,46%
    Iphone: 120*(0,35^7)*(0,65^3) = 2,12%
    Div.: 120*(0,2^7)*(0,8^3) = 0,0786%

    Siden det ble spurt om MINST 7 av de 10 må sanns for 7,8,9 og 10 for de ulike operativsystene summeres, og man får:

    Android: Ca.10,20%
    Iphone: Ca 3,49%
    Div.: 0,086%

    Kan ikke dette bli korrekt?

    Svar på denne kommentaren

    • Jørn Bjerkmo (svar til Jørn Bjerkmo)

      Ser det ble en feil under 8 av 10, på Iphone.
      Formelen skal være rett, men summen til hæyre for likhetstegner blir ikke 1,317%, men 0,4281%.

      DEtte gir da en endring i minst 7 av 10 på Iphone fra ca 3,49% til ca. 2,60%

      Oppsummert blir da vel svarene:

      Android: 10,20%
      Iphone: 2,60%
      Div.: 0,086%

      Eller er jeg helt ute å kjøre? 😉

    • Tobias Laundal (NRK) (svar til Jørn Bjerkmo)

      Det matcher de aller fleste andre svarene ser det ut til. Du bruker samme utregning også, men du regner helt manuelt. Kombinasjonene kan regnes med en funksjon som heter nCr. For eksempel 10 nCr 9 som blir 10, det er ti måter å velge ni personer ut av ti på.

    • Jørn Bjerkmo (svar til Tobias Laundal)

      Husker nCr fra videregående for altfor lenge siden, men hadde ikke tenkt over at det var den som skulle brukes her. I tillegg hadde jeg ikke noen kalkulator som «handler» slikt.
      Dermed måtte jeg bare tenke ut alle komboene…

      F.eks med 8 av 10 er f.eks iphone (= 2 av 10 ikke er Iphone): så kan man lage 9 forskjellige komboer med «ikke-ønskede-utfall», hvor 1 er den første. (1og2, 1og3, 1og4………..1og9)
      + 8 forskjellige med 2 som første ( 2og3, 2og4…..2og9), Ikke 2og1, da det er det samme som 1og2 i dette tilfellet der rekkefølge ikke betyr noenting
      til slutt ender man opp med antall komboer som er = 9+8+7+6+5+4+3+2+1 = 45

      På samme måte finner man at 7 av 10 er f.eks iphone (= 3 av 10 ikker er iphone) gir:
      (8+7+6+5+4+3+2+1)+(7+6+5+4+3+2+1)+(6+5+4+3+2+1)+(5+4+3+2+1)+(4+3+2+1)+(3+2+1)+(2+1)+(1) = 120 komboer.

  7. Harald Korneliussen

    Først ble jeg overrasket over at NRKBeta ikke fant svaret med en av de utallige måtene datakyndige folk har til sin disposisjon (som vi ser i kommentarfeltet: Wolfram Alpha, en rask simulering i python, excel osv.). Om de så ikke husker sin matte fra VG1, så er det da ingen tvil om at de er datakyndige?

    Så slo det meg: Hei, VI er en av måtene de har til sin disposisjon!!

    Dette var en litt vel billig løsning, NRKBeta 😉

    Svar på denne kommentaren

    • Anders Hofseth (NRK) (svar til Harald Korneliussen)

      Hehe
      Jeg mener det finnes en saying som går noe i retning «den viktigste kunnskapen er å vite hvem du skal spørre». NRKbeta-leserne er klart en av de mest anvendelige knivene i skuffen.

    • Tobias Laundal (NRK) (svar til Frode)

      Det stemmer for så vidt, men man kan si at det er ca 0.9% sannsynlighet for at minst 7 av 10 bruker et annet operativsystem. Da har det ikke noe å si hva de andre har. Når minst 7 av 10 har android, er det værre å vite sannsynligheten for at resten bruker det samme system, men det har ikke noe å si. Derfor har det egentlig ikke noe å si for utregningen.

  8. Steinar H. Gunderson

    (Jeg har med vilje ikke lest de andre svarene etter at jeg innså at folk diskuterte løsninger i kommentarfeltet.)

    Jeg gjør først antagelsen at siden 20% er «diverse andre typer», ville det ikke telt om 7/10 eller flere hadde en «annen»-telefon, for det ville ikke vært gitt at de hadde samme type (dette er spørsmål om tolkningen av oppgaven, ikke utregning). Så det vi vil ha er sannsynligheten for minst sju Android-telefoner, eller sju overprisede murstein med eplelogo.

    Da er det snakk om en ganske grei binomisk fordeling; du deler opp i “one-versus-all” to ganger. Så det vi vil ha er

    P(n, p) = binomial(10, n) p^n (1-p)^(10-n)
    p(android) = 0.45, p(iphone) = 0.35

    P(android >= 7) = p(7, 0.45) + p(8, 0.45) + p(9, 0.45) + p(10, 0.45) = 0.1019949456
    P(iphone >= 7) = p(7, 0.35) + p(8, 0.35) + p(9, 0.35) + p(10, 0.35) = 0.02602428050

    Så, p = 0.1280192261, avrundet til to gjeldende siffer blir det 13%.

    Du kan si det er lite elegant å summere opp masse binomer sånn, men det er faktisk ingen annen måte å få det eksakt på, skjønt idet n begynner å nærme seg 30 kan du begynne med (gode) tilnærminger basert på normalfordeling. Se f.eks. en.wikipedia.org/wiki/Binomial_proportion_confidence_interval#Wilson_score_interval_with_continuity_…

    /* Steinar */

    Svar på denne kommentaren

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *. Les vår personvernserklæring for informasjon om hvilke data vi lagrer om deg som kommenterer.