Hvordan – rent teknisk – klarer en app å kjenne igjen musikk?
Musikkgjenkjennings-appen Shazam har ligget på telefonen min siden 2009. Da den var ny, var den ganske wow. Etterhvert som jeg har blitt vant til den og appen SoundHound, som likner, har jeg blitt mer blasert, og tenkt at det er litt imponerende å få til. Men jeg har kanskje også tenkt oftere på hva den ikke får til.
Jeg har også hatt (eller trodd jeg har hatt) en slags idé om hvordan den virker. Men da jeg ble nødt til å sjekke det litt grundigere for å ha litt grunnlag for å snakke om den i et radioinnslag i Vitenselskapet på RadioNova, ble den ganske wow igjen.
Dersom du er ca. så geeky som oss i NRKbeta, kan det hende du vil ha moro av å skumme gjennom paper’et An Industrial-Strength Audio Search Algorithm (pdf), der en bakmann forklarer hvordan dette faktisk fungerer. Selv skjønner jeg fortsatt ikke alle detaljene her, men jeg forstår prinsippene, og synes det er utrolig vakkert at det går an å tenke ut noe slikt. 🙂
Ketil Nordstad
Spørs det om dette er avtalt med Shazams advokater da.
redcode.nl/blog/2010/07/patent-infringement/
redcode.nl/blog/2010/06/creating-shazam-in-java/
k
Ganske ironisk. Eit patent er eit tidsbegrensa monopol på ei oppfinning; for at samfunnet og det frie markedet skal godta eit monopol må dei få noko tilbake: ein utførleg oppskrift på oppfinninga. Men når det gjeld programvare, så er den einaste nyttige oppskrifta så spesifikk at ho er ekvivalent med sjølve programmet. Difor skriv folk patentsøknadene så vage og uspesifikke som mogleg, sånn at dei er unyttige, og samfunnet og det frie markedet kjøper katta i sekken ved å gi bort monopolrettar utan å få noko tilbake.
Anders Hofseth (NRK)
Men når det gjelder paper’et til Avery Li-Chun Wang fra Shazam-teamet vil jeg si det er ganske informativt.
k
Oj, der var det sanneleg eit videoføredrag frå same fyren òg: parleys.com/#st=5&id=2869&sl=0
k
Fetteren min og tri andre laga eit sånt system (som eit eksternt finansiert bachelorprosjekt) i 2002, så eg tenkte «gammal teknologi» når eg høyrte om shazam 🙂