Kuidas Google'i funktsioon Hum to Search töötab

Sisukord:

Kuidas Google'i funktsioon Hum to Search töötab
Kuidas Google'i funktsioon Hum to Search töötab
Anonim

Võtmed kaasavõtmiseks

  • Google tõi turule uue tööriista, mis võimaldab kasutajatel otsida laule ümisemise, laulmise või vilistamise teel.
  • Uus tööriist kasutab masinõpet, et sobitada ümisev lugu enam kui poole miljoni loo andmebaasiga, mida pidev alt uuendatakse.
  • Google'i kasutajad küsivad, millist lugu esitatakse peaaegu 100 korda kuus.
Image
Image

Google on käivitanud uue funktsiooni nimega "Hum to Search", et lahendada masendav probleem: teil on lugu pähe jäänud ja te ei saa aru, mis selle nimi on.

Mõte ümiseda laulu leidmiseks tundub uskumatult lihtne, miks siis toob Google selle funktsiooni välja alles 2020. aastal? Selgub, et lugude tuvastamine sel viisil on tegelikult üsna keeruline, osaliselt seetõttu, et meie ümisetud versioonid kipuvad algloost üsna erinevad. Google selgitab oma tehisintellekti ajaveebi hiljutises postituses, kuidas ta kasutas masinõpet selle probleemi lahendamiseks ja aitab inimestel leida laulu ümisemise, vilistamise või meloodia laulmise teel isegi siis, kui selle esitus on ebatäpne.

"Meie Hum to Search keskendub sellele, et aidata inimestel pähe jäänud muusikat tuvastada ja leida," ütles Google'i pressiesindaja Lifewire'ile e-kirjas.

Hakka lihts alt ümisema

Google'i kasutajad küsivad, millist lugu esitatakse peaaegu 100 miljonit korda kuus, ütles Google'i asepresident ja tarbijaostude peadirektor Aparna Chennapragada videos, mis tutvustab mitmeid uusi otsingufunktsioone. Nüüd on võimalus seda teada saada.

Funktsioon "Hum to Search" on sisse ehitatud Google'i mobiilirakendusse, Google'i otsingu vidinasse ja Google'i assistendisse. Rakenduse kaudu sellele juurde pääsemiseks puudutage mikrofoniikooni ja öelge "What’s this song?" Nupu "Otsi laulu" valimine toimib ka.

Õige töötamiseks nõuab funktsioon vähem alt 10–15 sekundit ümisemist. Androidi kasutajad saavad ümisedes leida laule enam kui 20 keeles, samas kui iPhone'is töötavad ainult ingliskeelsed lood. Tööriist ei suuda alati laulu kohe tuvastada, kuid kui see tuvastatakse, on tulemused päris head.

"Enam kui pooled paljude muutujate (toon, helikõrgus, helitugevus jne) lugudest tunnevad ära meie algoritmide poolt, kuid loomulikult sõltub täpsus ümisemise kvaliteedist, heli tüübist. lugu ja palju muud," ütles Google'i pressiesindaja Lifewire'ile e-kirjas. "Kuid kui see on äratuntud, on umbes neli vastust viiest õiged."

See pole aga esimene kord, kui muusika tuvastamise rakenduses ümisemist kasutatakse. SoundHound pakub sarnast funktsiooni, nagu märkis CNN Business, ning see on saadaval ka Androidis ja iOS-is. Google'i pressiesindaja sõnul ei tekita uus funktsioon privaatsusprobleeme ega muuda seda, kuidas Google helipõhist suhtlust käsitleb, ütlesid nad Lifewire'ile e-kirjas.

Masinõpe

Hoolimata kontseptsiooni lihtsusest on stuudiosalvestuse leidmiseks viisi ümisemine tehniliselt üsna keeruline. Sellel on mitu põhjust, selgitab Google Researchi Christian Frank 12. novembri blogipostituses. Esiteks võib laulu ümisetud versioon tegelikust salvestusest oluliselt erineda, muutes nende kahe sobitamise keeruliseks. Ehkki Shazam ja hulk muid rakendusi on restoranis või muus avalikus kohas kuuldud laulu tuvastamiseks juba olemas, võib ümiseva meloodia kasutamine selle otsingu aluseks olla keerulisem.

"Lõunasõnade, taustavokaalide ja instrumentidega võib muusikali või stuudiosalvestise heli olla ümisevast viisist üsna erinev," kirjutab Frank."Kui keegi loo tõlgenduse kogemata ümiseb, võib helikõrgus, klahv, tempo või rütm sageli veidi või isegi oluliselt erineda."

Image
Image

Kuna laulude ümisetud versioonid võivad originaalidest nii palju erineda, märgib Frank, et paljud varasemad meetodid on nõudnud inimese ümisemise sobitamist laulu versiooniga, millel on ainult meloodia, või ümisemist sisaldava palaga. See on muutnud tegelikud kasutusjuhtumid keeruliseks, kuna nende lugude andmebaasid võivad olla piiratud ja neid tuleb käsitsi värskendada.

Google selgitab, et funktsiooni Hum to Search jaoks kasutab ta masinõppemudeleid, et muuta heli "numbripõhiseks jadaks", mis esindab laulu meloodiat – selles öeldut võib pidada "sõrmejäljeks"

Kasutajasõbralikum

Masinõppe kasutamine Google'i funktsioonis Hum to Search muudab tööriista reaalses maailmas kasutamise palju lihtsamaks. Kuna Hum to Search sobitab otsija ümiseva loo tegeliku looga, saab tööriist töötada uute lugudega, kui need avaldatakse, mitte andmebaasi, mida tuleb pidev alt värskendada iga loo ümisevate versioonidega. Lisaks ei pea te selle kasutamiseks täiuslikku helikõrgust.

"Praegune süsteem saavutab kõrge täpsustaseme laulude andmebaasis, mis sisaldab üle poole miljoni loo, mida me pidev alt värskendame," ütles Google oma Hum to Searchi teates. "Sellel laulukorpusel on veel ruumi areneda, et hõlmata rohkem maailma paljudest meloodiatest."

Soovitan: