Supports Haute Définition (3)

Le point en 2016 et impressions d’écoute
mercredi 12 octobre 2016
par  Claude Ollivier

Le sujet des supports d’enregistrement des fichiers audio en haute définition a fait l’objet de deux articles parus dans le N°103 du bulletin AFDERS Confidences. En janvier 2016, lors d’un atelier animé par l’AFDERS dans le cadre de la Semaine du Son à la Médiathèque Musicale de Paris, ainsi qu’au cours de séances au studio privé de Claude Ollivier, nous avons tenté d’évaluer l’apport de la haute définition sur la qualité de restitution sonore.
Nous en avons profité, dans le cadre de l’Atelier organisé lors de la Semaine du Son, pour évaluer l’audibilité de l’apport de la Haute Définition "Hi-Res" par rapport au standard CD, ainsi que celle des pertes induites par les procédés de compression de type MP3.

IMPRESSIONS D’ÉCOUTE DE FICHIERS "HI-RES" EN STUDIO PRIVÉ

Le système d’écoute était constitué d’un ordinateur (processeur Intel Core2 Duo 3GHz, 3.25 Go RAM, Windows XPpro 32bits), d’une carte son RME reliée à cinq moniteurs bi-amplifiés de marque EAA et à un caisson de grave actif AESD 8". L’écoute est très précise, les moniteurs étant répartis selon la recommandation ITU sur un cercle d’environ 1,1 m de rayon. Le nombre d’auditeurs susceptibles d’effectuer une écoute simultanée est donc réduite à sa plus simple expression.
Les fichiers en présence étaient les suivants :

- Fichier d’origine PCM en 24 bits / 96 kHz,
- Fichiers WMA, la conversion étant obtenue avec deux logiciels différents, Awave et Switch,
- Fichier FLAC.

C’est foobar2000 qui assure la lecture des fichiers.

L’écoute commence par une écoute en multicanal d’un enregistrement de musique de chambre comportant notamment violon et piano. L’impression à l’écoute du fichier PCM est celle d’une grande transparence et d’un grave léger et aéré. Par comparaison, le fichier WMA semble un peu plus ample, mais moins précis, et le FLAC est très proche du WMA avec, semble-t-il, un sentiment de compression supplémentaire. J’ai noté que cet écart entre PCM et WMA ou FLAC était un peu de même nature que celui obtenu sur mon système personnel entre, respectivement, un préampli YBA ligne 1 et un préampli ligne 2, ce qui n’est pas négligeable.

Une rapide écoute d’un enregistrement multicanal des sœurs Labèque au piano démontre que ce qui est parfois mis sur le marché en matière de multicanal est du grand n’importe quoi. Rien de sérieux ne peut être tiré d’une telle écoute.

Retour à des enregistrements effectués en multicanal par Claude Ollivier dans des conditions "écologiques" et sans tripatouillages. L’écoute d’un enregistrement de Big Band débute par le fichier WMA, qui semble parfaitement satisfaisant. Par contraste, le fichier PCM apparaît plus naturel, avec moins de réverbération et de traînage. Une deuxième écoute d’un fichier WMA obtenu avec un autre logiciel apparaît plus "poncée", le fichier FLAC présentant la même tendance, en plus marqué. Le retour au PCM apporte plus de dynamique, de variété et de transparence. La musique "coule" mieux et est plus agréable.

L’écoute d’un enregistrement de chœur et soliste plus orchestre réalisé à St Louis en l’Ile confirme ces tendances générale : le fichier PCM est très clair, avec une réverbération naturelle, le fichier WMA apporte un léger voile au niveau du chœur, les toux du public sont moins nettes. Le fichier FLAC présente la même tendance, un peu plus marquée, avec des timbres moins purs. Ecoutés seuls, les fichiers FLAC et WMA sont tout à fait satisfaisants, ce n’est que par comparaison immédiate que le fichier PCM d’origine apparaît plus clair, avec une plus grande impression de naturel, même sur les passages plus "fondus".

POURQUOI DE TELLES DIFFÉRENCES ?

Ces différences ne peuvent être imputées à des différences de niveaux, bien contrôlés avant écoute. Elles pourraient, en ce qui concerne une des conversions WMA, être imputées à la définition réelle des fichiers qui est, à la mesure, de 24 bits pour les fichiers WAV, et l’une des conversions WMA, et est réduit à 16 bits pour la conversion WMA obtenue avec Switch.

De même, les petits niveaux sont mesurés à -65 dB en moyenne RMS dans tous les cas pour un des fichiers sélectionnés, avec une petite différence pour la conversion WMA réduite à 16 bits, qui n’est donc pas une compression totalement "loss-less" (voir figures ci-dessous).
En ce qui concerne la compression FLAC, nous n’avons pu procéder aux mêmes mesures, le logiciel Adobe Audition utilisé pour ces mesures ne reconnaissant pas ces fichiers.

Remarques (octobre 2016)
Des mesures faites ultérieurement avec des fichiers FLAC donnent les même résultats c’est à dire aucune différence entre WAV et WMA ou FLAC, nous avons bien des encodeurs sans perte (Lossless)

vue d’ensemble du fichier
WMA encod par Awave
original WAVE
WMA encod avec Switch
WAVE - WMA encodé par awave
WAVE - WMA encodé par switch

Certaines différences peuvent donc être imputées à la résolution réelle des fichiers, qui peut ne pas être la même. Mais ceci n’explique pas les différences affectant des fichiers qui, à la mesure, sont identiques, c’est à dire qui conduisent à une information constituée de zéros lorsque l’on soustrait l’un de ces fichiers de l’autre selon la démarche discutée dans la deuxième livraison de cette série d’articles.

Processus de mesure : le fichier encodé est "décompressé" pour le retransformer en fichier WAVE, puis en inversant la phase de se fichier nous le rajoutons sans changer les niveaux au fichier d’origine ce qui équivaut à le soustraire, si les fichiers sont identiques, il ne reste plus rien.

Notre hypothèse est donc que l’opération de décompression "à la volée" n’est pas totalement transparente. Elle est confirmée par des écoutes comparatives entre fichier WAVE d’origine et fichier WAVE reconstitué à partir d’un fichier FLAC obtenu après compression sans perte, qui ne font pas apparaître de différences significatives.
 [1]

APPORTS DE LA HAUTE DÉFINITION PAR RAPPORT AU STANDARD CD ET AUDIBILITÉ DES PERTES DUES À LA COMPRESSION MP3

Dans le cadre d’un Atelier public organisé à la Médiathèque Musicale de Paris le 30 janvier 2016, à la suite d’un exposé introductif, diverses prises de son naturelles effectuées au standard 96kHz / 24 bits dans le cadre des activités de l’AFDERS ont été écoutées dans leur format originel, au standard CD 44,1kHz / 16 bits, puis en MP3 avec différents niveaux de compression, comme indiqué dans le tableau ci-contre.

Si de petites différences avaient été mises en évidence entre le fichier WAV d’origine haute définition et une conversion WMA effectuée sur 16 bits, la différence entre fichier d’origine et compression MP3 avec perte est beaucoup plus significative, ainsi que ceci est illustré par la figure ci-dessous.

Ce qui apparaît lorsque l’on soustrait le signal compressé du signal original correspond à ce qui est "jeté" lors de l’opération de compression, car sensé ne pas être audible, compte tenu des caractéristiques de l’audition humaine.

Les avis exprimés lors de cette écoute publique effectuée sur un système stéréophonique constitué d’un ordinateur, d’une carte son RME, d’un amplifica-teur Onkyo alimentant deux enceintes Dynaudio BM5 et d’un caisson de grave montrent que les études psycho-acoustiques ont conduit à des processus de compression performants. Ce qui reste après avoir jeté plus de 90% de l’information d’origine conserve l’essentiel de cette information. Les commentaires effectués peuvent être résumés comme suit :

- Les différences entre fichiers Hi-Res d’origine et compression sans perte ne sont pas significatives dans les conditions d’écoute proposées,
- Les différences entre originaux Hi-Res et format CD ne sont pas vraiment flagrantes sur des enregistrements de chorales ; elles sont plus significatives sur des enregistrements de jazz. Les écarts concernent le sentiment de présence, d’ampleur et de relief, ainsi que la dynamique, particulièrement sur les claquettes du morceau de Jazz où le CD est jugé "insuffisant" par comparaison,
- Le MP3 se traduit par une perte de dynamique, de finesse et d’aération. C’est plus "plat". Les montées en puissance perdent de leur relief. Le nettoyage effectué, en lissant certaines aspérités, peut dans certains cas être jugé positivement. Il faut alors revenir à l’original pour apprécier ce qui a été perdu. Certaines subtilités qui font tout l’intérêt de certaines interprétations ont tendance à être "gommées", ce qui constitue un appauvrissement indéniable de la qualité musicale. Il demeure qu’au vu de ce qui a été "jeté" quantitativement, la qualité de ce qui reste est presque miraculeuse.

La différence entre versions compressées et non compressées est significativement inférieure à celle qui est expérimentée lorsque l’on passe du multicanal à la stéréo à deux canaux, puis à la mono. Dans le premier cas, les études psycho-acoustiques ont en effet veillé à éliminer les informations peu audibles ou masquées, dans le second, on perd un élément essentiel, à savoir l’appréciation de la localisation des signaux, et donc des dangers pour la survie de l’espèce. On en déduira que la mise en œuvre d’une compression effectuée dans l’objectif de permettre un accroissement du nombre de canaux est tout à fait légitime.

LA HAUTE DÉFINITION ET LE SON DE NATURE

Traditionnellement, les ateliers organisés par l’AFDERS dans le cadre de la Semaine du Son sont complétés par l’intervention de l’association SONATURA.
Les exemples présentés au cours de ce deuxième volet sont encore plus illustratifs de l’intérêt du standard Hi-Res. Une seule illustration suffira à en convaincre le lecteur. Il s’agit de l’enregistrement du contenu ultrasonore des signaux émis par des chiroptères. Sur de tels signaux, les enregistrements effectuées au format CD – et à plus forte raison en MP3 –perdent tout leur intérêt documentaire. Ces enregistrements sont, bien entendu, relus à vitesse réduite, compte tenu des limitations de l’audition humaine.

CONCLUSIONS ET REMARQUES

Nous constatons une évolution rapide des supports et du matériel, permettant de plus en plus des débits important, et l’on peut légitimement se poser la question de l’utilité de réduire le débit. A contrario on peut aussi se poser la question de l’utilité d’un débit important quand on obtient une qualité "quasi" identique avec un débit réduit.

Au cours des écoutes comparatives présentées, nous avons bien perçu un "petit quelque chose" ressemblant à un surcroît d’aération dans la version sans réduction de débit, mais le résultat obtenu avec les fichiers FLAC, ou WMA (convertisseur SWITCH ou AWAVE) est significativement supérieur à celui obtenu avec un fichier de résolution 44,1 kHz / 16 bits et encore plus pour le dts 5.1 (que nous avions apprécié en son temps, l’apport du multicanal étant supérieur à la perte due à la compression destructive), sans parler des compressions destructives de type MP3.
Alors encodage ou pas ? C’est un choix qui dépend aussi de l’usage que l’on veut en faire. À titre d’exemple un concert tenant tout juste sur un seul CD (79’ 27") en 44,1kHz / 16 bits tient sans aucun problème sur un DVD en FLAC 5.1 96kHz / 24 bits (3,06 Go) alors qu’il en faut deux en Wave (3,69 + 3,99 Go).

A la question posée au début de cette réflexion (voir article 1), nous avons donc un choix de réponses malheureusement pas tout à fait universelles, mais qui permettent d’une manière assez commode d’échanger des enregistrements (privés et avec autorisation des interprètes il va sans dire), sans être obligés de déménager une partie du matériel d’enregistrement (Ah la belle époque où il fallait se déplacer avec son REVOX !).

L’importance des pertes introduites lors des processus de compression et décompression sont à apprécier en regard de leur intérêt, qui dépend des modalités de ces échanges (pièces jointes à des e-mails, possibilité d’insérer un enregistrement multicanal sur un seul DVD, etc.). L’intérêt des standards Hi-Res est essentiellement d’aller plus loin en matière de subtilités et de se rapprocher de l’original "analogique". Dans le cas des sons de nature, certaines informations ne peuvent être mises en évidence qu’en faisant appel à des techniques d’enregistrement plus résolvantes que le standard CD.

Jean-Marie Grandemange et Claude Ollivier.


un lien bien utile pour utiliser Foobar2000 : Le mode d’emploi en français : http://michel.jaumes.free.fr/doc/multimedia/foobar/


[1On peut se poser la question sur l’importance du microprocesseur (32 ou 64bits, du nombre de "core" et de sa vitesse ?


Commentaires