Groupe de travail "Tests d'écoute en aveugle"

» 18 Fév 2005 21:30

Bonne nouvelle, pour la salle c'est OK, on a un auditorium dispo le dimanche gratuitement. Je vous communiquerai les infos en privé.

ogobert a écrit:Ton cas "il ne démontre rien du tout" est mon cas 1) ou tu pensais à une autre configuration ?

Non, je pensais au cas 2. C'est d'ailleurs un cas courant dans les tests en aveugle. Comme les auditeurs ont entendu la différence en dehors du test et pas dans le test, ce sont les conditions du test qui masquent les différences. Raisonnement imparable. Le rédacteur en chef de Stereophile (c'est bien lui ?) est un ardent défenseur de cette théorie.

ogobert a écrit:Le principe de laisser "carte blanche" aux paticipants me géne.
Ca fait un peu, "on va jouer à un jeu et on va inventer les règles au fur et à mesure".
En général, on fixe un protocole à l'avance, celui ci est connu, et accepter de participer à l'expérience implique l'acceptation du dit protocole.

Oui, il est temps que j'écrive le protocole.

ogobert a écrit:J'ai l'impression que ce dont tu as peur, c'est que des participants qu'on a "collé" parce qu'ils n'ont pas fait de différence viennent ensuite contester les résultats, me trompe-je ?
Pour moi, il faut raisonner sur l'ensemble. On aura pas non plus 100%. S'il y en a 9 qui entendent en double aveugle en 1 qui ne fait pas la différence, on peut en déduire qu'il y a bien une différence et qu'un des membre du panel était sourd

En fait nos divergences de point de vue viennent tout simplement du principe que tu t'attends à environ 90 % de réussite, alors que je m'attends à 0 à 1 %.

Je propose donc de commencer par un test simple aveugle en blanc (pour de faux). Les résultats ne seront pas pris en compte, quels qu'ils soient, mais serviront à préparer le test double aveugle. Ainsi on saura s'il faut porter nos efforts sur une démonstration du placebo ou une démonstration de l'effet audible.
En aucun cas les conclusions ne seront biaisées par le choix de la méthode. C'est la présence ou l'absence de conclusions que l'on pourra moduler.

Je m'explique : démonrtrer que "c'est tout du flan" prendrait au moins un an. Faisons le test en simple aveugle. S'il réussit, on boucle le double aveugle en vitesse, et en une ou deux demi-journées, c'est reglé. Si le simple aveugle rate et que les auditeurs pensent pouvoir faire mieux, arguments à l'appui, pas la peine de garder le même protocole pour le double aveugle, il ratera aussi, et ce ne sera a priori pas à cause du placebo (voir arguments en question). Il faudra repenser le double aveugle en tenant compte des remarques des auditeurs (extraits trop courts, trop longs, fatigue au bout de 20 écoutes, etc)

ogobert a écrit:
Et pour que le test soit pertinent, il faut au préalable que ces 7 personnes soient supposées entendre parfaitement une différence si elle existe, quelle qu'elle soit.

C'est là que je ne comprends pas pourquoi...
On a un "fait" : techniquement, les cables testés sont différents.
Et on a une "hypothèse" qu'on veut démontrer : cette différence technique induit une différence audible.

A partir de là, si on a comme résultat "une écoute en double aveugle démontre qu'il y a une différence", on est bon.
Et si le résultat est "une écoute en double aveugle démontre qu'il y n'a pas de différence", l'hypothèse est rejettée.
Je ne vois ce qu'apporte de + de dire "quand on leur dit qu'on change, les testeurs entendent une différence mais quand en double aveugle ils n'en entendent plus". L'hypothèse est à rejetter pareil, non ?

une écoute en double aveugle démontre qu'il y a une différence", on est bon.

D'accord.

Et si le résultat est "une écoute en double aveugle démontre qu'il y n'a pas de différence", l'hypothèse est rejettée.

Là c'est beaucoup plus complexe. S'il y en a qui ont plus d'éxpérience que moi en études statistiques, ils peuvent nous aider. Déjà, l'hypothèse n'est rejetée que si on a un échantillon représentatif de la population, ce qui n'est pas notre cas. 6 auditeurs, c'est trop peu. Il faudrait être au minimum 20. Ensuite, l'hypothèse ne peut pas être rejetée si les conditions du test diffèrent des conditions d'écoute domestiques. C'est l'argument principal contre les tests en aveugle. On dit qu'ils échouent parce qu'un câble ne s'écoute pas sur 20 secondes d'audio passées en boucle.
C'est pourquoi je considère important que les auditeurs puissent dire "on entend une différence si on est prévenus du changement", on rejette ainsi l'hypothèse qu'un câble n'exprime pas son son dans les conditions du test.
Restera à pouvoir rejeter aussi l'hypothèse comme quoi l'écoute en aveugle trouble l'auditeur. Pour cela il faut laisser s'entraîner les auditeurs qui ont du mal. Le problème, c'est que cela rentre en conflit avec l'analyse statistique : si on répète le test indéfiniment "jusqu'à ce que ça marche", on n'a rien prouvé du tout. Un test finira toujours par marcher au bout d'un nombre N de tentatives. De même qu'en jouant au loto pendant des millions d'années, on finira toujours par gagner. On perd donc la démonstration que l'hypothèse de départ (différence audible) est positive.

La solution est de faire des faux tests d'entraînement. S'ils échouent, les auditeurs ont tout le temps de réessayer jusqu'à ce qu'ils avouent ne pas entendre la moindre différence. S'ils réussissent, on passe au double aveugle pour de vrai, et on ne peux pas dire que l'aveugle trouble l'auditeur.

Maintenant, je dois voir avec Alesk pour faire les "règles du jeu". Je posterai un premier jet, une vue d'ensemble, pour avoir l'avis de tout le monde, et à partir de là on pourra rédiger un "règlement" complet.

» 19 Fév 2005 11:08

Pio2001 a écrit:Oui, il est temps que j'écrive le protocole.

OK, je te laisse "bosser" ;-)

» 19 Fév 2005 16:48

Je commence par une brève présentation, pour avoir des commentaires, et éventuellement des corrections d'Alesk ou Phill ou des autres.
Ce texte et ceux qui suivront à propos du protocole seront ensuite regroupés.
_____________________________

1-Pourquoi des tests en aveugle ?

Quand quelqu'un dit qu'un câble a un meilleur son qu'un autre, d'où cela peut-il venir ? Il y a trois possibilités.
1-Le câble améliore le son de la chaîne, et l'auditeur l'entend. C'est intéressant, car ce câble pourra aussi améliorer le son d'autres chaînes.
2-L'auditeur a certaines idées sur les câble, et par auto-persuation, s'imagine que le câble a le son auquel il s'attend. Cet effet couramment appelé "effet placebo" a été observé en haute fidélité sur de nombreux auditeurs. C'est un mécanisme inconscient auquel tout le monde est exposé.
3-L'avis dépend de l'humeur de l'auditeur. L'audition humaine n'est pas un mécanisme calibré en laboratoire. De même que lorsqu'on porte des lunettes colorées, notre vue s'y habitue, et nous voyons la couleur complémentaire lorsque nous les retirons, l'oreille s'habitue à certaines sonorités.
Les effets 2 et 3 sont étroitement liés. De sorte qu'un auditeur sans idée préconçue peut très bien se trouver un jour dans des conditions personnelles qui lui font apprécier le son d'un câble qui se trouve là par hasard. Fort de cette expérience, il se persuade ensuite par le mécanisme 2 que ce câble a un bon son.
Les cas 2 et 3 ne nous intéressent pas. Ce qui compte c'est de savoir si un câble peut agir sur le son d'une chaîne de façon objective, pas sur la façon découter de quelqu'un en particulier.

En réalisant le test en double aveugle, on élimine la cause 2. L'auditeur ne sait pas ce qu'il écoute, donc, il ne peut pas s'auto-persuader qu'il va enendre quelque chose en particulier.
Ensuite on répète le test plusieurs fois afin de voir si toutes les réponses sont en accord avec le changement de câble. Si les réponses varient indépendamment du changement de câble, on est dans le cas 3 : l'auditeur donne son jugement selon son humeur. Si les réponses correspondent toutes au changement de câble, on est dans le cas 1 : c'est le son du câble qui conditionne la réponse de l'auditeur.

L'essentiel est de répéter le test un nombre de fois suffisament grand pour être sur que la corrélation entre le changement de câble et les réponses n'est pas due au hasard. C'est le but de l'analyse statistique réalisée sur les résultats du test.

» 19 Fév 2005 18:22

Pio2001 a écrit:Ce qui compte c'est de savoir si un câble peut améliorer le son de nôtre chaîne

Heu, je comprends plus rien là... Il me semble qu'on s'était bien mis d'accord qu'on testait une "différence" sans donner aucun jugement de valeur...

» 19 Fév 2005 18:52

Bonne remarque. Texte édité.

» 20 Fév 2005 1:50

En attendant la suite du protocole, on peut choisir le câble.

On a donc Kéron, Marsupulami, Patrice, Ogobert, Sonark, JC07, et Pio2001.

La salle est dispo les dimanche et lundi. Moi je ne suis pas dispo lundi. Dimanche, c'est un peu compliqué de faire la journée entière en raison de la fatigue (tester pendant des heures, c'est épuisant), et de la difficulté à trouver où manger à midi un dimanche dans ce quartier. Ce serait donc plutôt l'après midi. Sauf pour Ogobert.
Les autres, quelles sont vos dispos sur les dimanches ?

Comme câbles on a
JC07 : HCC Neith, VDH Ultimate the First, Link Monitor
Ogobert : DIY

Les miens sont tout à fait cochonnés, et personne ne les a trouvés bons. Pour une comparaison avec un cordon ordinaire, quel serait le modèle à tester d'après vous ?

Je demanderai aussi s'il y a un graveur de CD sur place. Il faut en effet vérifier que le câble ne comporte pas une électronique destinée à filtrer le son pour le rendre plus doux, par exemple.
L'idéal serait de faire une copie de CD sur place avec les deux câbles, depuis la sortie tape out de l'ampli. Ensuite on peut analyser les copies sur PC pour voir s'il y a des différences mesurables, et surtout, s'il y a des défauts dans la courbe de réponse.
Le procédé est fiable. Voici pour exemple une comparaison de deux copies faites avec deux câbles différents : le MI330 (en vert), et un câble de marque inconnue (en blanc) : http://perso.numericable.fr/laguill2/te ... arison.htm
Les courbes de réponses sont complètement confondues. Si un câble cher filtre le son avec un truc genre self ou condo, ça se verra tout de suite.
Sinon, je peux tester le câble chez moi, mais c'est moins rigoureux, parce qu'on peut supposer que le câble réagit différament à certaines charges.

Ensuite, faudra trouver un système de double aveugle.
Simple aveugle, ce serait bien d'avoir un lecteur de CD ou un convertisseur avec deux sorties identiques. Comme ça, plutôt que de manipuler le câble, on branche les deux cables, et on change d'entrée sur l'ampli. Je vais voir le matos qu'il y a sur place.
Le double aveugle, ça va être coton. Il y a une porte qui mène à l'atelier juste à côté du meuble avec les sources. Au pire on pourrait mettre les sources dans l'atelier, et faire passer les câbles d'enceinte par la porte, s'ils sont assez longs.
Le problème, ensuite, c'est la communication entre les auditeurs et le manipulateur. A priori, on sera obligés de fixer la durée des extraits et la succession (AB ou ABX) des samples, de façon à ce que le manipulateur n'ait pas à communiquer.
En revanche on cherche 100 % de réussite a priori pour les auditeurs. Je pense donc que les auditeurs ne noteront que les essais où ils pensent avoir entendu clairement la différence. S'il en manque à la fin du test, on relance quelques essais, et on continue jusqu'à ce que chaque auditeur ait le nombre de réponses requises.

Par exemple, dans un système X (sans références), en 8 essais, le manipulateur lance les essais suivants :
1 : X=A
2 : X=B
3 : X=A
4 : X=A
5 : X=B
6 : X=A
7 : X=A
8 : X=B

L'auditeur note

1 : X=A
2 : X=A
3 : Ne sait pas
4 : Ne sait pas
5 : X=B, mais pas sûr à 100%
6 : X=A
7 : X=A
8 : X=B

L'auditeur déclare alors au manipulateur qu'il lui manque trois réponses. Le manipulateur retourne derrière sa porte et relance 5 essais.

1 : X=A
2 : X=B
3 : X=A
4 : X=A
5 : X=B

L'auditeur note :

1 : X=A
2 : X=B
3 : Ne sait pas
4 : X=A
5 : X=B

L'auditeur a alors 9 réponses. C'est suffisant. Dans la mesure ou l'auditeur n'a pas connaissance de son score après les 8 premiers essais, les 9 résultats peuvent être pris en compte. Si par contre l'auditeur connaît son score intermédiaire, il est nécessaire de garder les 8 premiers résultats, et pas un de plus (sinon, influence du résultat par le choix de poursuivre le test en fonction du score intermédiaire, statistiques faussées). Dans tous les cas, l'auditeur décide s'il est sûr à 100 % ou pas AVANT de consulter son score réel, evidemment.

C'est un exemple simplifié, en réalité, il y aura plusieurs auditeurs, une vingtaine d'essais, et un protocole AB, ou ABX, ou ABA.

» 20 Fév 2005 16:28

J'ai une autre idée pour le double aveugle : si on trouve trois sources identiques, et deux câbles de chaque, on peut faire un montage ABX.
L'expérimentateur est laissé seul dans la pièce. Il branche le câble audiophile sur la première source, le câble ordinaire sur la seconde, et un câble mystère sur la troisième, en tirant au sort parmi les deux qu'il lui reste (un audiophile et un ordinaire).
Il quitte la pièce et les auditeurs y rentrent. A eux de dire si X est A ou B.

Inconvénients :
Trouver deux cables audiophiles identiques. Peut-être Ogobert en dispose-t-il.
Trouver trois sources identiques. J'ai deux platines CD Yamaha CDX-860, disposant chacune de deux sorties : une fixe, une variable, égale à la fixe si le volume est au maximum (potentiomètre analogique). Toutefois on peut objecter que le câblage interne vers le potentiomètre va altérer le son par rapport à la sortie fixe.
On peut également objecter que les sources peuvent avoir un son différent, même s'il s'agit du même modèle.

Avantages : liberté totale pour les auditeurs. Ils ne sont pas soumis à une durée limitée. Ils ont le choix entre ABX et AB (en ne comparant que A et X, par exemple). Pas besoin de tirer des câbles derrière une porte ou un paravent. Et on est en double aveugle absolu.

Pour pallier aux inconvénients, on peut rester en AB avec seulement deux sources. On peut alors utiliser les deux platines avec la sortie fixe, il n'y aura pas de différence de câblage interne.
Reste le problème de trouver deux câbles identiques, mais surtout de savoir si cette vieille platine bas de gamme conviendra aux auditeurs (1991, 3000 FF, les deux rafistolées de manière identique alors que leur lecture commençait à sauter).

» 20 Fév 2005 20:31

c'est devenu ultra rigoureux la!!!

exxellent
reste plus qu'a faire ça pour les amplis , les lecteur cd, dvd, les ensceintes, les projos, toutes les sources ......., :lol:

on a le droit de réver...

» 20 Fév 2005 20:33

pour compiller toutes les données que vous alez receuillir quel modele statiqtique alez vous employer??
car la ça risque d'etre tres complexe!!!

» 20 Fév 2005 22:25

On fera une analyse Friedman / Anova. (Dans la mesure où on n'a que deux réponses possible : audiophile ou ordinaire, Anova doit se ramener à Friedman, je crois).
On cherche à savoir si une personne peut entendre une différence, mais il ne faut surtout pas prendre les résultats de chacun séparément. En effet imaginons qu'on cherche une certitude à 99 %. Si 100 sujets passaient le test, statistiquement, l'un d'eux trouverait les bonnes réponses par pur hasard, parmi les 100 fiches remplies par les auditeurs. Ce succès serait donc un échec statistique.
L'analyse Friedman prend en compte cette probabilité. On l'utilise pour faire le classement de plusieurs échantillons dans un certain ordre. On n'a qu'à définir le câble audiophile comme le câble de rang 1 et l'ordinaire comme le câble de rang 2. On demandera alors, si on est en ABX, aux auditeurs de trouver si X est A ou B, c'est à dire de donner le rang du câble (1 ou 2).

On doit pouvoir démontrer facilement que l'analyse reste pertinente pour un test A/B où les auditeurs doitvent choisir entre "A et B identiques" et "A et B différents". On a là aussi le choix entre deux possibilités de probabilité 1/2, et l'analyse nous dit avec quelle certitude le groupe a correctement discerné les deux possibilités.

» 20 Fév 2005 22:40

J'ai un doute, sur cette page, il est indiqué que l'analyse Friedman est destinée à comprer trois échantillons ou plus, or on n'en a que deux : http://www.graphpad.com/articles/interp ... edmans.htm

Il n'y a pas l'air d'avoir de restrictions sur Anova : http://www.psychstat.smsu.edu/introbook/sbk27.htm

Quelqu'un a plus d'infos ?

» 21 Fév 2005 14:21

Je crois que je me rappelle du problème avec l'analyse Friedman, si on ne remplit que deux colonnes, cela provoque une division par zéro, ou un truc comme ça. On peut rajouter une colonne bidon (un faux câble), mais cela augmente la selectivité du test.
Par exemple si on exige 99% de certitude, avec une colonne en plus l'analyse pourra n'être déclarée positive qu'à partir de 99.9 % de certitude réelle, à cause de la probabilité d'avoir une comparaison réussie par chance parmi toutes les paires de colonnes analysables.
Je poserai la question sur Hydrogenaudio, il y a des experts en statistique là bas.

Sinon, est-ce qu'on ne pourrait pas utiliser les sorties analogiques d'un lecteur de DVD-A ou de SACD multicanal ?
Est-ce qu'on peut dupliquer une source stéréo (un CD) sur l'ensemble des sorties ? Est-ce que cela est fait par commutation numérique, analogique par puce ou analogique par relais ?

Dans le cas d'une commutation numérique, il faudra savoir si les convertisseurs des voies arrières sont aussi bons que ceux des voies avant.
Dans le cas d'une commutation analogique par relais, il faudra regarder si le chemin du signal emprunte des câbles en plus sur une sortie donnée.
Une commutation analogique par puce serait idéale : le même signal serait envoyé aux deux sorties (avant stéréo, arrière stéréo) par le même chemin.

» 21 Fév 2005 14:27

Arg ! Non, une commutation analogique serait à écarter ! Je viens de penser que si un câble capte des parasites ou provoque des ondes stationnaires, elles seront transmises à l'autre câble si les deux sorties sont reliées au même convertisseur. Même les capacités des câbles s'ajouteraient.
Ce serait une commutation numérique avec des convertisseurs identiques qu'il faudrait.
Ceux qui ont un patch numérique et un convertisseur multicanal, levez la main

!

» 21 Fév 2005 14:34

Arg ! Cela ne suffira pas, pour brancher deux sources dans un convertisseur multicanal, il faudrait une master clock.

» 21 Fév 2005 14:58

j'ai accès à du cable HP pro. 2x2,5mm² tout ce qui a de plus simple (marque KI Audi, Proel, Klotz ou Senn). Cela pourrait servir de base pour une référence de câble standard puisque qu'en pro, on sen fout du câble utilisé...

sinon je suis dispo dimanche toute la journée. no problémo pour moi