La configuration correcte d'un système surround n'est pas aussi simple qu'il n'y parait même en 5.1. L'aspect psycho-sensoriel de notre système auditif est complexe. En Atmos, c'est irréalisable sans un logiciel spécifique. Quand je lis les posts de certains qui s'imaginent qu'on peut passer d'un format sonore à un autre (Atmos-Auro-DTS) en appuyant sur un bouton, ou pire: faire du re-mapping, je me demande quelle bouillie ils espèrent...
A ceux qui veulent en découvrir plus, je dédie ce post qui relate une expérience menée par le département de recherche de la BBC, visant à évaluer nos capacités à localiser les sons dans l’espace dans le contexte d’une écoute multicanal.
Nous savons que la couleur et la direction d’une source change en fonction de sa direction de manière prévisible. Mais que se passe-t-il lorsque deux sources écartées diffusent le même signal ?
La localisation d’une image sonore virtuelle produite par plusieurs sources s’appuie sur le principe simple de la stéréophonie. Dans un premier temps, il fut décidé d’effectuer les mesures dans une pièce sourde pour s’affranchir des perturbations liées à l’environnement acoustique. Les premiers essais n’ont pas permis d’obtenir des résultats suffisamment précis car pour construire une image sonore virtuelle, notre cerveau a besoin d’autres repères que les deux sources. Pour porter un jugement valide sur 360°, il fallait un espace semi-réverbérant homogène et uniforme. On a donc ajouté un plancher réfléchissant la pièce.
Quatre enceintes identiques furent posées à hauteur d’oreille, à 45° des quatre points cardinaux sur un cercle gradué de 2,7m de rayon, tracé autour du point d’écoute centré au milieu de la pièce. Cette disposition permettait d’avoir quatre sources en phase avec un taux de réflexions uniforme autour de l’auditeur quel que soit l’angle d’incidence. L’auditeur, visuellement isolé par un voile circulaire en tissu léger, devait se tenir assis, la tête en appui sur un reposoir étroit et fixer un repère face à lui.
Les enceintes, de type monitor professionnel, étaient appairées en niveau et en fréquence, pour produire la même intensité. L’équilibre du signal monophonique appliqué successivement à chaque paire d’enceintes pouvait être modifié à volonté (tout en maintenant la somme constante) pour suivre l’évolution de la localisation en fonction du rapport d’intensité inter-enceinte. Deux stimuli de 30 secondes chacun et répétés à intervalles réguliers furent employés : une musique percussive assez aigüe et la voix d’un orateur masculin. Sept auditeurs entrainés (des ingénieurs du son) se sont succédé pour évaluer les variations subjectives et dresser une moyenne.
Huit points remarquables nommés comme suit, ont été établis sur une échelle polaire : FC façade-centre, FD façade-droite, CD centre-droite, AD arrière-droite, AC arrière-centre, AG arrière-gauche, CG centre-gauche et FG façade-gauche.
L’expérience commença par un test préliminaire qui consistait à localiser individuellement chaque enceinte. Les résultats ont montré une précision de ±2,5° pour les enceintes de façade FG et FD et une déviation moyenne de ±11° pour les enceintes arrières AG et AD.
Les résultats des tests de localisation sont regroupés sur la figure ci-dessous. Il faut bien comprendre que l’étude fait abstraction du rayonnement individuel de chaque enceinte et porte uniquement sur la stéréophonie entre les enceintes. Le graphe décrit pour chaque paire stéréophonique, la position de l’image virtuelle et le niveau apparent. Les cercles concentriques donnent l’échelle des écarts. Par exemple, quand le niveau des enceintes de façade est identique en FG et FD, l’écart est nul et l’image virtuelle résultante apparait au centre (FC). Si l’enceinte FG est plus faible que l’enceinte FD de 10 décibels, l’image virtuelle dérive 20° vers la droite (point 1). Pour un écart de 20dB la dérive est de 40° (2) et au-delà de 30dB FG disparait, ne laissant que FD à 45°.
Le contour bleu montre le niveau de pression constante mesuré. Le contour rouge montre le niveau de pression ressenti.
Par contre, la localisation latérale ne suit pas les mêmes règles. Pour un niveau de pression identique en FD et AD, l’image apparente sera localisée vers 60° (3), soit une erreur d’environ 30°. Pour placer l’image en CD, à mi-distance entre les deux enceintes, il faudrait élever AD de 12dB par rapport à FD. Dans cette plage angulaire, la localisation est très instable. Elle peut basculer vers l’avant ou l’arrière pour un faible écart de niveau ou un léger mouvement de la tête. L’effet stéréophonique est difficilement identifiable. L’auditeur perçoit deux images distinctes avec des spectres différents. Notez le contraste avec la précision du quadrant arrière AC presque symétrique avec l’avant (FC). Ceci s’explique par le fait que nous avons seulement deux oreilles d’où la symétrie sur un seul axe.
Les segments bleus représentent la variabilité des réponses entre les 7 auditeurs participants, la ligne rouge du graphe étant une moyenne. Les abréviations qui notent la qualité sonore des images virtuelle ont aussi leur importance. Par exemple, entre F et CD le son résultant sera diffus et très instable.
Mais la localisation d’une source virtuelle ne se limite pas à son azimut. Il a donc paru intéressant de mesurer la hauteur apparente. En façade, la somme des FG+FD élève l’image au centre de 40 degrés au-dessus des enceintes, puis retombe à une hauteur normale dans l’axe de ces dernières. Ce phénomène n’apparait pas ou très peu avec une écoute stéréo conventionnelle où les enceintes sont écartées de 60°. Sur les côtés, les images virtuelles descendent jusqu’à 30° en dessous des enceintes et le son semble venir du plancher. Dans l’axe des enceintes arrière, le signal apparent est encore bas, 15° en dessous de la hauteur normale pour remonter à +10° à l’arrière-centre.
L’image de gauche représente la vision idéaliste que chacun peut avoir sur la localisation de quatre images stéréophoniques entendues séparément dans un même plan horizontal. A droite, la réalité est toute autre. La localisation apparente varie considérablement en azimut et en zénith en fonction des caractéristiques biologiques de notre appareil auditif.
Remarque : les valeurs relevées les schémas ci-dessus ont été observés dans les conditions décrites avec un point d’écoute à égale distance de chaque enceinte. Les paramètres qui définissent la position apparente d’une image sonore sont largement dépendants des propriétés physiques de la pièce et par conséquent variables à l’infini.
Certains diront : Chez moi, il n’y a pas ce phénomène. Vous ne l’avez peut-être pas perçu pour de multiples raisons. L’image stéréophonique est peut-être brouillée par des éléments différents dans chaque canal. Rappelons que la stéréo est le placement dans l’espace d’un signal unique (mono) reproduit par plusieurs sources. Vous n’êtes pas positionné à égale distance de vos enceintes. Dans une pièce occupée par plusieurs personnes, la localisation varie dans des proportions considérables d’un fauteuil à l’autre. Les réflexions sur les surfaces environnantes pourront fournir des repères utiles à l’auditeur mais la source la plus proche sera toujours prépondérante notamment à cause de l’effet de précédence. L’image sonore résultante sera déviée et déséquilibrée. Le but de cette expérience n’est pas de décrire exactement ce qui se passe chez vous mais de montrer que placement des enceintes ne résume pas à suivre quelques règles géométriques simples. La façon dont nous entendons les sons a aussi son importance.
______________________________________
Une autre expérience menée cette fois-ci dans la régie d’un studio d’enregistrement, compare le niveau apparent de l’image virtuelle produite par une paire d’enceinte avec le niveau réel d’une troisième enceinte située au centre dans l’axe qui les sépare. Les trois enceintes sont posées sur un arc de cercle de 1,7m de rayon, au centre duquel se tient l’auditeur. Deux bruits, rose et blanc sont utilisés. Le niveau sonore de l’enceinte centrale est réglé à 65dBA et on a demandé aux 6 auditeurs successifs d’ajuster le niveau des enceintes gauche et droite pour trouver le même niveau apparent.
Avec les enceintes G&D écartés de 90° les auditeurs ont atténué le bruit blanc de 5,2dB (±1,3dB) et le bruit rose de 4,5dB (±1dB) pour obtenir le même niveau apparent que celui de l’enceinte centrale. En resserrant l’angle d’écoute à 60° (stéréo conventionnelle) l’atténuation du bruit blanc a été ramenée à 4,1dB (±1,3dB) tandis que celle du bruit rose est restée à 4,5dB. Dans tous les cas, on a observé un niveau 5dB plus élevé au point d’écoute malgré une puissance apparente identique pour la paire G+D et pour l’enceinte centrale.