nrk.no

Hvordan virker Shazam?

Kategorier: Apps,Musikk og lyd & Snacks

Et diagram som viser sammenfall i hash-punkter for frekvens og tid
Scatterplot fra Shazam – Avery Li-Chun Wang,Shazam Entertainment, Ltd.

Hvordan – rent teknisk – klarer en app å kjenne igjen musikk?

Et diagram som viser sammenfall i hash-punkter for frekvens og tid
Scatterplot fra Shazam - Avery Li-Chun Wang,Shazam Entertainment, Ltd.

Musikkgjenkjennings-appen Shazam har ligget på telefonen min siden 2009. Da den var ny, var den ganske wow. Etterhvert som jeg har blitt vant til den og appen SoundHound, som likner, har jeg blitt mer blasert, og tenkt at det er litt imponerende å få til. Men jeg har kanskje også tenkt oftere på hva den ikke får til.

Jeg har også hatt (eller trodd jeg har hatt) en slags idé om hvordan den virker. Men da jeg ble nødt til å sjekke det litt grundigere for å ha litt grunnlag for å snakke om den i et radioinnslag i Vitenselskapet på RadioNova, ble den ganske wow igjen.

Dersom du er ca. så geeky som oss i NRKbeta, kan det hende du vil ha moro av å skumme gjennom paper’et An Industrial-Strength Audio Search Algorithm (pdf), der en bakmann forklarer hvordan dette faktisk fungerer. Selv skjønner jeg fortsatt ikke alle detaljene her, men jeg forstår prinsippene, og synes det er utrolig vakkert at det går an å tenke ut noe slikt. 🙂

5 kommentarer

    • A blogpost describing an algorithm can never be infrigement of intellectual property. The whole idea of a patent is to preserve an idea, to write down what it does and how it works for future generations. A patent has to be publicly available for this sole reason. This isn’t protecting their intellectual property, this is plain censorship. redcode.nl/blog/2010/11/patent-infrigement-part-2/

      Ganske ironisk. Eit patent er eit tidsbegrensa monopol på ei oppfinning; for at samfunnet og det frie markedet skal godta eit monopol må dei få noko tilbake: ein utførleg oppskrift på oppfinninga. Men når det gjeld programvare, så er den einaste nyttige oppskrifta så spesifikk at ho er ekvivalent med sjølve programmet. Difor skriv folk patentsøknadene så vage og uspesifikke som mogleg, sånn at dei er unyttige, og samfunnet og det frie markedet kjøper katta i sekken ved å gi bort monopolrettar utan å få noko tilbake.

    • Anders Hofseth (NRK) (svar til k)

      Men når det gjelder paper’et til Avery Li-Chun Wang fra Shazam-teamet vil jeg si det er ganske informativt.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *. Les vår personvernserklæring for informasjon om hvilke data vi lagrer om deg som kommenterer.