Entouré de haut-parleurs géants diffusant en boucle le même morceau de musique classique, j'ai fini par me sentir comme Alex dans « Orange mécanique », forcé d'écouter « la Neuvième de Ludwig Van ».
Pourtant, l'objectif du test à l'aveugle organisé par MusiClassics jeudi dans un studio parisien n'était pas de lobotomiser le cerveau des cobayes invités. Au contraire, il s'agissait de l'entrainer à percevoir les différences de qualité de formats de compression utilisés par les sites de téléchargement de musique.
Pour chacun des quatre extraits de musique classique choisis, six versions étaient diffusées aléatoirement : cinq technologies différentes et le « master », le fichier son originel. (Voir la vidéo)
Mais pour donner une note sur 10 à chacune de ces versions, il faut être capable de déceler une différence entre elles ! Et dès le premier morceau, un extrait de la 3e étude symphonique op. 13 de Robert Schumann, je sens que ce sera une gageure.
En fait, je suis vite complètement perdu. Avec moi, des blogueurs spécialistes de musique, dont Romain Sulpice (MyGoodZik), Laurent Belando (Rocktrotteur.com) et Frédéric Neff (Viva Musica). Ils semblent avoir l'oreille plus fine et commencent à griffonner les notes (sur 10) attribuées à chaque morceau.
On dirait que ça criaille un peu dans les aigus, non ?
En fermant les yeux, ce n'est pas mieux : mon esprit divague, je peine à me concentrer sur le son. Petit espoir au deuxième extrait (un passage de l'opéra « Didon et Enée », de Purcell) : on dirait que dans certaines versions, ça criaille un peu dans les aigus, ou que les basses manquent parfois de profondeur.
Autopersuasion ? A force d'entendre et de ré-entendre chacune des six variantes de la symphonie n°8 de Mahler, la troisième oeuvre testée, j'arrive à dégager un classement qui me semble cohérent.
Mais sur le dernier morceau, le concerto pour violon et cordes n°1 de Mendelssohn, mes esgourdes saturent, je me rends compte que je ne suis plus capable de distinguer un stradivarius sorti du studio d'un crincrin enregistré sur un dictaphone.
Le MP3 classé bon dernier… juste après la version non compressée !
Une fois le test terminé, je donne mes quatre séries de notes. Et le verdict tombe : globalement, j'ai préféré la musique compressée plutôt que la « source », la version non altérée.
Je ne suis pas le seul : sur l'ensemble des douze testeurs (dont la claveciniste Claude Nadeau et le fondateur du label Saphir productions Pierre Dyens), le « master » arrive en moyenne en avant-dernière position du classement. Soit juste avant le MP3, format qui a sonné un peu creux à la plupart des oreilles ce soir-là, même en version 320 kbps :
- WMA 320
- AAC 320 (ces deux technologies obtenant des notes très proches)
- AAC 192
- WMA 192
- Source
- MP3 320 (loin derrière)
Pour les non technophiles : l'AAC est le format utilisé par Apple pour son service de téléchargement de musique iTunes, le WMA est promu par Microsoft, et le MP3 un mode de compression plus ancien mais encore très utilisé (Rue89 s'en sert par exemple pour les sons intégrés aux articles).
Jean-Hugues Allard, cofondateur de MusiClassics, explique que parmi les sujets testés, même les plus exigeants, prêts à se payer un équipement dernier cri pour écouter leurs oeuvres préférées, se sont fait prendre, et n'ont pas donné la meilleure note au son sorti direct du studio.
Chaque format de compression donne au son une tonalité différente
Samer Roumieh, l'autre cofondateur, a une explication convaincante : chaque technique de compression donne une « tonalité », une « couleur » propre à la musique.
Par exemple, ceux qui aiment un son « plus brillant », « plus mat », « plus chaud » ou « plus froid » seront attirés par l'une des compressions en lice, la privilégiant aux autres… et à la source, trop neutre pour être douce à leurs oreilles.
Reste que les différences sont de toute façon très difficiles à déceler, ce que reconnaissaient les participants à l'expérience, habitués aux débats entre initiés sur la perte de qualité de la musique depuis l'avènement du téléchargement : « Avec ces résultats, on va faire pleurer du troll », s'amusait un blogueur.
MusiClassics propose aux internautes de se livrer au même exercice, cette fois en téléchargeant les extraits et les diffusant sur leur propre équipement : surprises en perspective pour les amoureux du bon son.
► Mis à jour le 16/9 à 15h30. Lien vers le jeu-test de MusiClassics.




















10
De Liger
liger.amsud.net | 12H24 | 14/09/2009 |
Il en est de la musique comme de la bouffe :
Un peu de sucre, de sel, de piment, et vous donnez à votre escalope de dinde un goût différent de son emballage. Voire meilleur.
Les masters sont le fruit de l'équipe qui les a produit, en monitorant le son sans compression. C'est donc la référence.
En préférer une version modifiée, fût-elle apparemment plus naturelle, c'est renoncer à l'œuvre originale.
Dans le genre, on peut citer :
- préférer une reproduction agrandie d'un Van Gogh. On y voit mieux les détails,
- lire le Reader's digest au détriment des éditions intégrales
- entendre un prélude de Chopin « simplifié », ou orné d'arpèges supplémentaires par Clayderman
- etc.
Dans un tel système de valeurs, comment Hendrix aurait-il pu percer ?
On en arriverait à remasteriser les versions originales de Beatles, celles qui ont eu un succès planétaire. Euh… c'est déjà le cas ?
De Les Grands Champs
Retraité, le doigt là où ça fait m... | 13H11 | 14/09/2009 |
ça me fait penser à un test qui a été fait à il y a déjà quelques temps à l'entré d'un concert de musique classique.
Une personne faisait écouter (avec un casque) un air dirigé par Rieu, et bien beaucoup trouvait ça bien jusqu'au moment où ils leurs étaient dit qui dirigeait, là ça devenait presque de la merde.
Il y en a même eu un qui a arraché le casque et est parti en colère, mais avant c'était bien.
Comme quoi …
De youpilpleut
13H13 | 14/09/2009 |
Que la source arrive avant derrière en moyenne c'est une information très pauvre car même en ayant des résultats completement aléatoires on pourrait quand meme calculer des moyennes et arriver à des conclusions un peu hatives.
Il faut également rajouter que la source est la plus fidèle à la source selon toute vraisemblance c'est à dire à l'enregistrement originel. Dès lors toute différence avec la source se base sur des notions d'agrément à l'oreille et non de fidélité. On peut imaginer un algorithme de compression qui ait pour seul but l'agrément auditif, en laissant de coté la fidélité. Celui ci aurait certainement eu les meilleures notes !
On pourrait donc renverser complêtement les résultats de ce test en considérant que le mp3 ayant eu des notes proches de la source il est le format le plus proche de celle ci et donc la meilleure compression.
C'est pourquoi il il existe le test ABX qui est la référence en matière d'évaluation de différences auditives. On ne cherche pas à classer des algorithmes mais on cherche à déceler des différences par rapport à la référence (la source) : on fait écouter le format compressé (A), puis la source (B), puis enfin l'un des deux sans que l'auditeur ne sache lequel (X). S'il arrive à déterminer qui est X de façon probante, alors il existe une différence significative entre les deux et la compression est donc sensible.
De shillom
13H24 | 14/09/2009 |
Merci Yann.

J'évoquais juste la loudness war dans l'optique de mettre en valeur le formatage qui est réalisé sur nos petites oreilles, pas par rapport à la compression. La puissance du signal utilisée par l'industrie musicale est de plus en plus similaire quelle que soit la fréquence, regardez (merci wikipedia) :
C'est ce qu'on appelle la masterisation si je ne m'abuse.
La compression, elle, opère sur des bandes de fréquences plus ou moins ciblées suivant les formats, et peut donc altérer la dynamique sonore de l'original pour la faire plus ou moins correspondre à ce que nos oreilles sont habituées à entendre, d'où peut-être les piètres résultats des originaux non compressés.
Si je parlais d'ingés sons, c'est parce que j'ai eu la chance de me voir expliquer tout ça par un membre de cette confrérie, et qu'entendre le même morceau prémix, postmix et masterisé change la vision qu'on peut avoir de la musique.
De Gotch 15306
ancien ouvrier de la banque | 13H23 | 14/09/2009 |
Pour avoir dans ma jeunesse beaucoup écouté de musique chez des revendeurs spécialisés, je sais que les hauts-parleurs jouent énormément sur le résultat. Il se peut fort bien que ceux utilisés dans le test compensaient des défauts liés aux formats présentés, et désavantageaient le son d'origine.
Un exemple : il y a 20 à 30 ans, les enceintes de chez Cabasse, matériel français connu, avaient tendance à exagérer certains contrastes, face à des baffles de chez JM Lab beaucoup plus neutres. Je parle de matériels anciens, les productions actuelles n'ont certainement pas les mêmes équilibres.
Autre facteur de différence importante (si, si) : les platines de reproductions, et en particulier les cellules de lecture avec les tailles de diamants qui différaient. Je peux vous assurer que les différences n'étaient pas négligeables. Dans le numérique, la reconversion en analogique pour l'attaque des hauts-parleurs a aussi beaucoup d'importance.
Voilà pourquoi, selon moi, il serait sans doute indiqué de ré-étalonner les oreilles avec le son direct (le vrai, celui de quelqu'un jouant d'un instrument devant vous) avant de procéder à ces essais somme toute très subjectifs. Et vous verrez que si l'on procède ainsi, les résultats seront complètement différents. C'est incroyable comme ce fameux son direct, s'il est auditionné après des morceaux enregistrés, paraîtra terne, et de toute façon très différent.
De grosluc
branleur de manchots | 13H30 | 14/09/2009 |
ben non justement le bruit n'améliore pas : la compression, quand elle est bien faite élimine justement l'information non pertinente, donc idéalement le bruit, pour ne laisser que le son. Et au passage le débit diminue car on n'a pas à encoder le bruit.
Toute la difficulté est d'inventer un algorithme suffisamment sioux pour éliminer le bruit et seulement le bruit.
en tout cas effectivement « on va faire pleurer du troll ». Ca me fait penser aux snobs de l'ampli qui préfèrent les tubes à un bon gros ampli mosfet des familles… ou un vinyl à un CD…
De jck
13H36 | 14/09/2009 |
Il aurait du vous faire écouter 5 fois l'original ; )
Je suis sûr qu'il y'aurait eu autant de débats enflammés sur des différences supposées.
De Lictor
informaticien | 13H44 | 14/09/2009 |
C'est pas choquant, c'est déjà le cas en photographie… Par exemple, un (léger) bruit/grain dans une image augmente l'impression de netteté. C'est un artefact du système de perception humain qui confond détail et micro-contraste - et le bruit crée un pseudo micro-contraste.
Et l'objectif de la compression/décompression est plus complexe. Il s'agit surtout de supprimer de la source les sons qui ne « servent à rien » - soit parce qu'ils ne sont pas audibles, soit parce qu'ils sont masqués par d'autres sons. La plupart reposent sur un modèle psycho-acoustique, qui tente de simuler l'oreille humaine pour mieux déterminer le superflu.
Un algorithme de compression ne rajoute pas vraiment de bruit : la ratio signal/bruit n'est pas vraiment dégradé par la compression. Voire, il peut être amélioré : le bruit à la limite de l'audible a des chances d'être supprimé.
Un algorithme de compression introduit plutôt des artefacts et supprime des fréquences. Par exemple, il va introduire des distortions. Exactement comme un ampli à tube ou des enceintes colonnes, qui colorent le son.
Et là, on retombe sur nos pieds : la plupart des audiophiles n'aiment pas les restitutions hyper-analytiques. Beaucoup préfèrent les sons colorés. D'où l'engouement en haut de gamme pour les amplis à tube, les enceintes colonne…
De Greg94100
étudiant | 14H28 | 14/09/2009 |
Comme dirait le poète Jacques C. « je crois qu'on est en train d'enculer une mouche qui ne nous a rien demandé »
De Lictor
informaticien | 14H45 | 14/09/2009 |
C'est du WMA@320 kbit/s… A ces taux là, même le WMA est bon…
La supériorité d'un format de compression sur un autre s'exprimer surtout quand on leur demande de faire des choix drastiques - et donc qu'on pousse leurs modélisation psycho-acoustique dans ses retranchements pour décider quoi jeter et quoi garder. C'est là que certains formats produisent de la distortion, que d'autres écrêtent les aigus, que d'autres produisent des artefacts (ringing, harmoniques…).
A 320 kbit/s, tous se valent : on jette le minimum syndical de trucs qui fait relativement consensus (pas la peine de garder les harmoniques à -80dB pendant le passage de grosse caisse), on joue sur l'image stéréo (joint-stéréo, pas la peine de conserver de la stéréo dans les graves…) et on applique des astuces du lossless…
Même chose en VBR (étonnament pas testé alors que c'est de loin la meilleure option). Dès lors qu'on lui laisse un débit moyen suffisant pour s'exprimer (type 256 kbit/s), les différences se gomment…