Ya he respondido a una pregunta relacionada. Puede que no sepa la respuesta más definitiva, pero he leído que iTunes Match utiliza el programa MusicID de Gracenote. Parece que MusicID utiliza las siguientes técnicas para identificar las canciones.
Tecnologías de identificación con MusicID:
Identificación del CD: Utilizando la tabla de contenido (TOC) única del CD, MusicID puede identificar los CD publicados en todo el mundo. Incluso con múltiples presiones y fechas de lanzamiento, la coincidencia difusa patentada permite un reconocimiento preciso.
Identificación de arroyos: Gracias a la tecnología de huellas dactilares de la forma de onda de audio, MusicID puede identificar la música con muestras cortas de audio en cualquier parte de la canción.
Identificación de archivos digitales: MusicID puede identificar canciones o álbumes individuales en la colección de un usuario, independientemente de la fuente, el formato o la información de la etiqueta. Utilizando un proceso de varios pasos que combina la identificación de flujos con el análisis de información textual de las etiquetas incrustadas en el archivo, el nombre del archivo, la ruta del directorio y otros archivos relacionados en la colección del usuario, se pueden emparejar canciones individuales o grupos de canciones con álbumes.
Más aquí .
Para responder a tu pregunta, realizan algún algoritmo de coincidencia de texto difuso para mapear los metadatos y también realizan un análisis de la forma de onda de audio.