Cómo identificar una canción tarareando o silbando la melodía con Google Assistant

Cuando Shazam se hizo popular, parecía algo mágico. La aplicación permite reconocer una canción que se encuentre en su base de datos por medio de un sistema que «escucha» las frecuencias. Había mucho de ingeniería detrás. Ahora, Google ha introducido en su asistente digital Assistant una interesante función que permite reconocer un tema con solo silbar o tararear un fragmento.

Esta opción no es perfecto y depende del sonido ambiente y la capacidad artística del usuario. Pero es bastante preciso sobre todo con los éxitos más conocidos. Es una función bastante útil dado que muchas veces tenemos clavada en la cabeza una canción pero desconocemos el título o, directamente, el artista.

Para utilizar este sistema hay que pasar por Assistant, el asistente de voz de Google, integrado por defecto en los teléfonos móviles Android y «cerebro» de los altavoces inteligentes. Tan solo hay que invocar al software por medio de las palabras mágicas «OK, Google» o puslar sobre el icono de micrófono si se encuentra en un «smartphone» para empezar a recitar la melodía escogida.

Entonces, hay que preparar al sistema pidiéndole «¿Qué canción es esta?». En ese instante, y durante 10-15 segundos, el servicio empieza a escuchar el tarareo o canción silbada, aunque esto último puede afectar la calidad del micrófono del dispositivo o la capacidad de entonar del usuario. En cuestión de pocos segundos, devuelve varios resultados que se acercan a la frecuencia y la probabilidad de acierto. Durante las pruebas realizadas, el software ha estado preciso al intentar entonar temas como «Living on a prayer» de Bon Jovi o «We are the champions» de Queen.

«Una vez que haya terminado de tararear, nuestro algoritmo de aprendizaje automático ayuda a identificar posibles coincidencias de canciones. Y no se preocupe, no necesita un tono perfecto para usar esta función. Le mostraremos las opciones más probables según la melodía», explica en un comunicado
Krishna Kumar, gerente de productos de Búsqueda de Google.

El secreto está, según indica la multinacional estadoundiense, en la «huella digital» asociada a cada entidad musical. «La melodía de una canción es como su huella digital: cada uno tiene su propia identidad única. Hemos creado modelos de aprendizaje automático que pueden hacer coincidir su tarareo, silbido o canto con la identidad correcta», explica Kumar.

Cuando el usuario tararea una melodía en el motor de búsqueda, los modelos de aprendizaje automático transforman el audio en una secuencia numérica que representa la melodía de la canción. «Están capacitados para identificar canciones basadas en una variedad de fuentes, incluidos cantos, silbidos o taraeos, así como grabaciones de estudio. Los algoritmos también eliminan todos los demás detalles, como los instrumentos de acompañamiento y el timbre y el tono de la voz. Lo que nos queda es la secuencia numérica de la canción o la huella digital», añade.