Para valorar la música, mejor quita el sonido

por Juan Ignacio Pérez Iglesias 11 noviembre, 2013 Mente y cerebro 12 comentarios

Suponga por un momento que participa en una prueba en la que debe adivinar quién ha ganado una competición musical y, para ello, le dan a elegir entre oír una grabación sonora, ver un vídeo sin sonido, o ver un vídeo con sonido. ¿Cuál de esas opciones elegiría?

En responder a esa pregunta consistió, precisamente, el primer experimento que hizo un investigador a quien interesaba evaluar la importancia de la vista y el oído a la hora de valorar información de carácter eminentemente auditiva. Un 59% escogió la grabación sonora, un 27% se inclinó por el vídeo con sonido, y un 14% optó por el vídeo sin sonido. En conjunto, un 86% prefirió un método que incluía sonido. Así pues, parece claro que, mayoritariamente, la gente tiene la idea de que para evaluar información auditiva, lo mejor es recurrir a una grabación sonora. [Lo sorprendente es que haya quien optase por un vídeo sin sonido, ¿no es cierto?].

En tres experimentos que siguieron a éste, a los participantes se les presentaron grabaciones de los tres últimos finalistas de diez prestigiosas competiciones internacionales de música. Dado que entre los finalistas suele haber diferencias pequeñas, hemos de asumir que para los no entendidos en música la probabilidad de acertar se aproxima a un 33%; incluso para los expertos no resulta fácil: el acuerdo entre evaluaciones de especialistas ronda el 67%.

En el primer experimento de esta segunda ronda, se les presentaron a personas no entendidas en música las grabaciones citadas (3 finalistas de 10 competiciones, 30 en total), y se les presentaron en dos soportes, sólo sonido y solo imagen. Antes de la prueba, el 83% de ellos afirmó preferir la grabación sonora para juzgar las interpretaciones. Pero los resultados de la prueba contradijeron radicalmente esa percepción: mediante el video sin sonido, el nivel de acierto llegó al 53%, mientras que mediante la grabación sonora, el acierto quedó en el 25%, por encima y por debajo, respectivamente, del porcentaje correspondiente a respuestas al azar (33%); las diferencias con respecto a ese 33% fueron significativas. En el segundo experimento de esta segunda tanda, a los participantes se les volvieron a presentar las grabaciones anteriores (sólo imagen y sólo sonido) y se añadió una tercera posibilidad: imagen y sonido. Con la grabación sonora, el acierto fue de un 29%, de un 35% con la grabación que incluía ambas, sonora y visual, y de un 46% con la grabación silenciosa. El acierto al ver y oír la grabación de imagen y sonido no fue significativamente diferente del 33% (azar); en los otros dos casos, sí lo fue.

En la tercera ronda de experimentos se reprodujeron los dos anteriores, pero con músicos expertos, miembros habituales de jurados de premios musicales de prestigio. Antes de empezar, el 96% afirmó que preferían la información sonora para evaluar las grabaciones. Sin embargo, en el primer experimento de esta ronda (cuarto de todo el conjunto) sólo el 21% identificó a los ganadores a partir de las grabaciones únicamente sonoras. Pero el acierto llegó a ser del 47% a partir de la información visual silenciosa; las diferencias fueron, de nuevo, estadísticamente significativas. En el segundo experimento (quinto del conjunto), el 82% dijeron fiarse más del sonido a la hora de juzgar la calidad de las interpretaciones. Sin embargo, el porcentaje de acierto a partir de las grabaciones sonoras fue de sólo el 26% (significativamente inferior al 33%). El acierto fue del 47% con la grabación visual en silencio (significativamente superior al 33%), y del 30% cuando el vídeo incluyó sonido (la diferencia con el 33% no era significativa). Y para rematar el cuadro, resulta que los porcentajes de acierto obtenidos por los especialistas no fueron significativamente diferentes de los de las personas no entendidas en cada una de las modalidades.

Dado que, a partir de esos resultados, parecen ser visuales las claves que proporcionan la información más útil a la hora de identificar a los ganadores, el investigador se propuso entonces analizar en qué medida incide el movimiento corporal en el juicio profesional de la ejecución musical. Para ello, redujo a la expresión más básica los vídeos que mostró a los participantes. Lo que hizo fue mostrarles fragmentos de seis segundos de duración de las grabaciones visuales, pero en los que se destacan los contornos en movimiento (tal y como se aprecian en la siguiente figura). Y los participantes acertaron en un 49% de los casos el ganador, significativamente por encima del 33% que hubiera resultado respondiendo al azar.

Figura del contorno (muestra) tomada de uno de los vídeos utilizados en el sexto experimento, en el que se aisló el movimiento básico. Los contornos son las regiones de la figura cuyo movimiento es detectado.

Figura del contorno (muestra) tomada de uno de los vídeos utilizados en el experimento en que se aisló el movimiento básico. Los contornos son las regiones de la figura cuyo movimiento es detectado.

Parece, por lo tanto, que la información visual es muy poderosa y ello es debido, seguramente, a que refleja especialmente bien el comportamiento expresivo y, por ello, su impacto emocional. Los jurados suelen valorar la novedad, la implicación, la motivación y la pasión de los intérpretes, por considerarlos elementos esenciales del hecho creativo. Y resulta que esos atributos se transmiten en mayor medida mediante la imagen que mediante el sonido. Además, de esa forma se puede contagiar más fácilmente la emoción, aunque en la música se suele asumir que es el sonido el principal medio por el que se transmiten las emociones.

Partiendo de esas consideraciones, en el séptimo y último experimento, a los participantes se les presentaron grabaciones de 6 s en dos variantes: solo vídeo (sin música) o solo sonido (sin imagen). Y se les pidió que eligieran, de cada grupo de tres finalistas en cada competición, al intérprete más creativo, al más implicado, al más motivado, al más apasionado y al más singular. Y resultó que al seleccionar al más apasionado viendo el vídeo, acertaron con el ganador en un 60% de los casos (por solo el 39% de los que oyeron el audio). La implicación (53%), la motivación (53%), la creatividad (45%) y la singularidad (44%) percibidas también contribuyeron a la información visual que reflejaba la calidad de la interpretación, pero no a la información sonora. Así pues, el movimiento corporal, la motivación, la creatividad y la pasión son rasgos percibidos como señales o indicadores de la calidad interpretativa. Y todos ellos se perciben a través de la vista, por lo que son accesibles para todo el mundo, con independencia de lo entendido que se sea. Hay que destacar, además, la importancia que tiene el movimiento en esas señales.

El conjunto de experimentos sugiere que el juicio de los legos refleja con bastante fidelidad el de los expertos; ambos juzgan la calidad de la interpretación musical, de forma rápida y automática, a partir de información visual básica. Hay, por lo tanto, un sesgo muy marcado hacia la visión como elemento de juicio en los procesos selectivos. Resulta particularmente intrigante el hecho de que la presencia simultánea de información visual y sonora dé lugar a porcentajes de acierto inferiores que la sola información visual, algo que parecería indicar que la información sonora modifica la percepción que se obtiene a partir de la información visual.

Evidentemente, estos resultados contradicen la noción general de que la información auditiva es central en el dominio de la música, y conceden la primacía a la información visual. Debo reconocer que estos datos me han resultado muy sorprendentes, pero de confirmarse, parece que nos encontraríamos, una vez más, ante una consecuencia de la gran importancia que la vista ha tenido en nuestro pasado evolutivo.

Por último, no debiéramos perder de vista que el sesgo a favor de la información visual puede tener inesperadas consecuencias en nuestras decisiones cotidianas: al entrevistar a un candidato para un puesto, votar a un líder político, confiar en un médico, o premiar el trabajo de una persona, damos, seguramente, una gran importancia a claves visuales de las que no somos conscientes, pero lo cierto es que esas claves pueden muy bien conducirnos a adoptar la decisión equivocada.

Fuente: Chia-Jung Tsay (2013): “Sight over sound in the judgment of music performance” PNAS 110 (36): 14580-14585

Información metodológica adicional, aquí.

Etiquetado en:claves auditivas, claves visuales, información sonora, información visual, oído, vista

12 pensamientos sobre “Para valorar la música, mejor quita el sonido”

Iñaki el 11 noviembre, 2013 a las 23:56

Conocíamos el estudio y la verdad es que no me (nos) resultan nada extraños los resultados, sino más bien al contrario: muy lógicos. Hay que tener en cuenta que estamos hablando de finalistas de prestigiosas competiciones en un mundillo extremadamente competitivo. Con esto quiero decir que, en lo sonoro, las diferencias serán muy pequeñas. Tan pequeñas que todas las interpretaciones estarán realmente muy bien musicalmente (estilísticamente, etc., etc.) y, por tanto, a la hora de valorar, entra en juego un componente altamente subjetivo. Por tanto, llegados a estos extremos (y sin posibilidad de escuchar a fondo a cada intérprete, sino que hay que hacerse a la idea “de pasada”), priman otros detalles —los visuales— a la hora de desequilibrar la balanza.

Responder ↓
Almudena el 12 noviembre, 2013 a las 8:36

Mi comentario va un poco en la línea del de Iñaki, para variar. Creo que fue César Tomé quien nos pasó el estudio…
Me consta que un pianista en un escenario es un “showman” y como tal, ha de cuidar también los aspectos visuales de su representación. Sé de alguno que ensayaba con un espejo bien cerca… pero también sé que ninguno lo reconocería. Precisamente, porque esta “parte visual” de la actuación está mal vista, se niega académicamente: lo importante, lo único importante debe ser el sonido.
Y esto puede explicar parte de los resultados del estudio: por un lado, que tanto expertos como legos (pero muy especialmente expertos), dijesen preferir el audio al vídeo para juzgar la actuación. Pero también explica, imagino, que las actuaciones fuesen más dispares a nivel visual que musical: probablemente, todos los concursantes eran músicos excelentes. Todos compartirían criterios musicales semejantes, corrección estilística e histórica, un alto nivel de virtuosismo arduamente trabajado… porque todos estos aspectos forman una parte fundamental de su aprendizaje. Probablemente, imagino, a nivel musical serían indistinguibles. Es posible, en cambio, que como “actores” sobre a un escenario no hubiesen trabajado tanto y no fuesen tan equiparables. Al final el criterio de los jueces se basa en el hecho diferencial… incluso sin quererlo o saberlo.
Sería divertido conocer “porcentualmente” cuál es el peso de esta parte visual. Hacer una liguilla de pianistas que pasasen a la siguiente fase en base a una nota global y después puntuar separadamente sus vídeos sin audio y sus audios sin vídeos. Pero incluiyendo niveles musicales un poco más dispares. Probablemente hay faranduleros, sobrevalorados como músicos gracias a sus dotes de interpretación dramática. Y con esta frase retrato mi propio sesgo valorativo en contra de lo visual y dejo como ejemplo a Lang Lang, jeje.

Responder ↓
Juan Ignacio Pérez Iglesias Autorel 12 noviembre, 2013 a las 9:12

Yo también atribuí estos resultados al hecho de que las diferencias musicales entre tres finalistas han de ser muy difícilmente evaluables. Si la prueba hubiese consistido en evaluar a músicos de muy diferente nivel, la imagen sola no hubiese funcionado, supongo. Pero a pesar de eso, lo cierto es que la gran mayoría prefiere recurrir al sonido (solo o con imagen) antes de hacer la prueba y, desde ese punto de vista, los resultados son contraintutivos, muy contraintuitivos. Vosotros, Iñaki y Almudena, ¿habríais estado en ese pequeño porcentaje que prefirió la imagen sola? ¿O hubieseis optado por sonido aunque los resultados, una vez vistos, no os hayan extrañado?

Por último, me sigue pareciendo que el aspecto más importante de este y otros estudios es la gran influencia que ejerce en nosotros lo que vemos.

Gracias a los dos por vuestros comentarios.

Responder ↓
Iñaki el 12 noviembre, 2013 a las 9:39

Si estamos evaluando una interpretación musical, lo lógico y de sentido común es regirse por el sonido. Eso lo entiende cualquiera y no creo que haya nadie en desacuerdo con este punto. Ahora bien, hay gente que considera muy importante que la interpretación vaya acompañada de unas buenas habilidades escénicas, de ahí que se opte por la opción audio+imagen. Ahora bien, no creo que nadie en su sano juicio considere que lo óptimo para juzgar a un músico sea únicamente la imagen. Achaco el porcentaje que hizo esta elección en el estudio a la sorpresa, a la extrañeza de que ofreciesen siquiera esta posibilidad.

Yo considero que la parte escénica tiene su importancia hasta cierto punto, por lo que habría optado por audio+imagen, aunque probablemente sobrestimo mi capacidad para no dejarme llevar por lo que veo. Es bien conocida esta influencia: véase la ilusión en la que se muestra a una persona pronunciando una sílaba mientras se oye otra. Así que este estudio viene a sentar una base mayor en nuestro conocimiento de este efecto.

Responder ↓
Almudena el 12 noviembre, 2013 a las 10:46

Sin duda, es contraintuitivo. Y lo es aún más que los expertos no acierten más que los aficionados en base al audio. Pero lo más significativo desde mi punto de vista no es el hecho de que la imagen influya en el criterio de los jueces: sino que, de entrada, se crea que no debería ser así, que un porcentaje tan alto de los expertos prefiera el audio solo, al audio con vídeo (un formato que en cualquier caso contiene más información, nunca menos). Esto indica que muchos estiman que la información visual no solo no es valiosa, sino que además, “nubla” el juicio. Es esta percepción, probablemente basada en el propio concepto que se tiene del “buen músico” (un creador de sonidos, un intelectual: nunca un “showman”) la que me intriga más.
Yo no sé qué hubiese elegido, si el audio o el vídeo. Probablemente el vídeo. Pero porque me encanta ver las manos de los pianistas. Vaya, por puro ocio, jeje. Además, reconozco que nunca he sabido distinguir entre la calidad de los pianistas de élite: los sutiles matices de la excelencia caen dentro del margen de error de mi “pobre” oído. Pero creía que ese era el problema: “mi” oído. Confiaba en que los Expertos de verdad tuviesen criterios auditivos más refinados para poder discernir. Ahora veo que quizás no tanto… quizás estén tan sobreestimados como la calidad de los Stradivarius.

Responder ↓
Miguel el 12 noviembre, 2013 a las 11:31

A mí los resultados del estudio me parecen realmente sorprendentes.
Con lo que no estoy de acuerdo es que las diferencias musicales entre los finalistas no sean relevantes (en el caso de valoracioes expertas). Partiendo de la base de que todos sean técnicamente perfectos y fieles al texto, todavía queda un amplio margen en lo concerniente a la interpretación (la información del texto musical es muy limitada y abierta a distintas interpretaciones: ya sean matices, elección y cambios de tempo o articulaciones), aunque esto solo es relevante si son juzgados por expertos. Aquí entran en juego facotres subjetivos, cuestiones de estilo o escuela, que en mi opinión son muy decisivos a la hora de emitir un juicio. (Aunque es cierto que en el mundo globalizado se tiende hacia una uniformidad, todavía se pueden distinguir “estilos nacionales” de interpretación, sobre todo en instumentos de viento. ¿Me pregunto si el estudio solo consideró pianistas?) Con esto quiero decir que la elección de un ganador en un concurso de estos no es completamente objetiva puesto que hay parámetros que no son cuantificables de manera objetiva, al ser cuestiones de estilo. (Supongo que esto está relejado por el dato de 67% de acuerdo entre evaluaciones de especialistas). Aunque claro, estas cuestiones son irrelevantes al evaluar el video solo…
Por otro lado creo que los sesgos que apunta Almudena son mucho más habituales de lo que cabría esperar, también en los músicos profesionales. Personalmente me quedo muy sorprendido con la diversidad en las valoraciones de músicos profesionales de conciertos a los que asisto, y en muchísimos casos, conociendo bien a esas personas me resulta muy fácil asociar sus juicios con sus prejuicios… (Y los prejuicios no solo se refieren a los movimientos, sino a cualquier otro factor relacionado con el intérprete)

Responder ↓
Leopoldo el 12 noviembre, 2013 a las 18:12

Me ha gustado mucho conocer este experimento. Y me ha gustado mucho leer los comentarios, también.
No sabes cuánto me he divertido dándoselo a leer a algunos compañeros que tocan el piano. Leen el título, empiezan a leer lo que ellos quieren, y terminan emitiendo bufidos propios de un rinoceronte. Cuando les digo que se tranquilicen y que hablemos solo de lo que dice el artículo, no de lo que ellos creen que piensan sobre la música, logramos hablar.
Con tu permiso (es un decir) voy a cambiar el título –para valorar la ejecución pianística…– y a poner el último párrafo en primer lugar, como una especie de organizador previo. A ver qué sale.
Gracias por tu blog.

Responder ↓
Eva el 12 noviembre, 2013 a las 21:52

Interesante experimento. Concuerda con conclusiones como las de
“Orchestrating Impartiallity: The impact of Blind Auditions on Female Musicians”, American Economic Review, Goldin and Rouses. 2000. Este estudio muestra como la introducción de audiciones ciegas en los 70 y 80 en las orquestas de USA incrementaron en un 50% la probabilidad de que una mujer pasara a las siguientes rondas. Da que pensar, no?

Responder ↓
Pingback: Para valorar la música, mejor quita el sonido
Pingback: Para valorar la música, mejor quita el sonido | La Naturaleza Humana | klinews.com
Victor el 15 noviembre, 2013 a las 11:17

El impacto emocional que la música tiene en las personas (lo que se puede llamar comunicación entre intérprete y público) depende claramente de más factores que el sonoro. Probablemente este “enlace emocional” se da más veces por ejemplo en conciertos en directo que en grabaciones sonoras, a pesar de que en estas últimas el sonido suele ser mejor.

En mi caso, mi forma preferida de “escuchar” grabaciones musicales es poner un blu ray, para poder ver y oír a la vez en alta calidad. Esto me permite disfrutar mucho más, no sólo en grabaciones donde la información visual es obviamente esencial como en ópera o danza, sino también digamos en un recital de piano o un cuarteto de cuerda. También mi nivel de concentración en la música es superior cuando veo y escucho que cuando sólo escucho.

Almudena comentaba sobre los Stradivarius. Joseph Curtin, un conocido luthier americano, condujo hace pocos años un experimento doble ciego con 21 violinistas profesionales a los que se les pidió que compararan violines históricos cremonenses de Antonio Stradivari y de Guarneri del Gesu, con instrumentos construidos por luthieres contemporáneos. Los resultados (de nuevo sólo basados en información sonora, al eliminarse información visual y hasta olfativa en el experimento) también son sorprendentes:

http://www.pnas.org/content/early/2012/01/02/1114999109.abstract

Responder ↓
1. Juan Ignacio Pérez Iglesias Autorel 15 noviembre, 2013 a las 19:07
  
  Sobre el trabajo acerca del Stradivarius, ya escribí aquí mismo hace tiempo: https://blogs.eitb.eus/cienciayhumanismo/2012/01/23/el-sesgo-del-stradivarius/
  
  Responder ↓

La Naturaleza Humana

Gracias a la ciencia conocemos cada vez mejor la condición humana, los cómos y los porqués de nuestra especie. Ciencia y Humanismo están así entrelazados

Para valorar la música, mejor quita el sonido

12 pensamientos sobre “Para valorar la música, mejor quita el sonido”

Deja un comentario Cancelar respuesta