Características sonoras de las voces
La voz humana cantada tiene una tesitura que oscila entre los 80 y los 1000 Hercios, aunque la mayor parte de la energía se sitúa entre los 200 y los 700 Hz.. Según la ubicación y rango de la tesitura de una voz cantada distinguimos como mínimo entre voces de bajo (82/293 Hz), tenor(146/523 Hz), contralto (174/659 Hz) y soprano (261/1046 Hz). Los armónicos de un cantante pueden llegar a los 12 o 14 KHz en el caso más agudo. En cambio, la tesitura de la voz de un locutor o de un actor no cubre tan amplio espectro, y debemos esperar que se sitúe entre los 100 y los 500 Hz, mientras que sus armónicos probablemente no superen los 10 KHz.
Otra característica importante de la voz es que las vocales presentan zonas en las que se concentra la energía: son lo que denominamos los formantes de la voz. El número de formantes y su ubicación son diferentes para cada vocal y para cada registro de voz, aunque no varían en exceso entre cantantes diferentes de un mismo registro (varía la fundamental, pero no la ubicación de los formantes). El primer formante lo hallamos entre 250 y 700 Hz, mientras que el segundo se sitúa entre 700 y 2500 Hz. Los buenos cantantes de tesitura grave y media presentan el denominado “formante del cantante”, una zona de energía especialmente realzada entre 2.5 y 3 KHz que les sirve para poder sobresalir en medio de una orquesta.
En cuanto a los sonidos que una voz puede generar, en el caso del canto predominan las vocales, que son sonidos estables, armónicos, de altura definida… En cambio en el habla existe una mezcla de sonidos vocálicos con consonantes, que son sonidos inarmónicos, transitorios, sin altura definida la mayoría de las veces. Los sonidos de consonantes tienen un espectro de energía mucho más ancho (puesto que son ruidos) aunque algunas de ellas presentan zonas especialmente intensas: la “s” tiene mucha energía entre los 7 y los 8 KHz; la “j” presenta alta energía por encima de los 4.6 KHz; la “r”, en cambio tiene una distribución mucho más uniforme.
El momento del día que elijamos para grabar una voz puede determinar en gran medida su calidad: siempre hay que preferir la tarde o la noche (si por la mañana no se ha sometido la voz a esfuerzos), aunque eso a menudo no lo podemos controlar nosotros.
En el caso de voces de locutores (y en general, de cualquier voz que no cante -actores, por ejemplo-) hay que valorar en primer lugar la inteligibilidad, ya que un locutor suele decir algo para que sea entendido por los espectadores. La inteligibilidad depende de diversos factores: prominencia de las consonantes, características espectrales de la voz, ritmo, articulación, vocalización… Puesto que las consonantes son básicamente ruidos y de ellas depende en primer lugar la inteligibilidad, cualquier interferencia o ruido que aparezca en una grabación puede afectar gravemente su inteligibilidad debido a un efecto de enmascaramiento.
Las cualidades tonales de una voz suelen determinar su elección o no para determinados roles. Por ejemplo, dado que una voz grave tiende a ser tomada como más creible (existe evidencia empírica al respecto, no se trata de suposiciones), esas voces serán las preferidas en spots comerciales que pretendan ofrecer datos que orienten las decisiones de los consumidores. En este mismo sentido, debemos considerar desacertadas determinadas voces aparentemente infantiles que se utilizan en otros tipos de spots, pues al no ser identificadas como tales producen efectos contrarios a los deseados.
Finalmente, otras características a valorar pueden ser que no tenga un exceso de sibilancia (o sea, que los sonidos de “eses” no sean excesivamente prominentes) y que no tenga unas plosivas explosivas (o sea, que los sonidos de “bes” y “pes” no hagan que saltemos de la silla), aunque estos dos defectos pueden paliarse con ayuda de la tecnología.
Microfonía para voces
El primer factor a controlar en una grabación de voces es la comodidad del cantante o del locutor. Si no se siente bien, confortable, en un ambiente positivo destinado a extraer lo mejor que pueda dar de sí, por muy bueno que sea él o ella, y por muy extraordinario que sea nuestro equipamiento, no conseguiremos un resultado decente. En la comodidad juega un papel importante la comunicación, no sólo la verbal (ayuda mucho que el productor sepa lo que la voz debe hacer y cómo, y que se lo sepa transmitir), sino también la no verbal (él o ella verán a través de una ventana las caras que ponemos en el control); también es importante que reciba una buena mezcla de referencia, con el equilibrio y el nivel que desee, y en unos auriculares cómodos; y que pueda pedirnos en cada momento lo que necesite, tanto en cuestiones sonoras como a otros niveles (descanso, atenuar la refrigeración, beber…). Si todo esto lo hemos cuidado al máximo, tendremos un 30% del éxito garantizado.
Cuando la grabación se realice en un lugar cuyas características acústicas sean beneficiosas para la voz, y nos interese aprovecharlo, será preferible un diagrama polar omnidireccional pues captaremos en mayor medida que con micrófonos direccionales la reverberación y la coloración del recinto. En estos casos, además, puede ser recomendable el realizar una toma estereofónica, que aún preservará más tales características. Si no nos interesa la acústica del recinto, además de utilizar un micro direccional podemos ayudarnos de pantallas aislantes y/o atenuadoras de reflexiones para garantizar una toma con el mínimo de coloración debida al recinto (aunque su uso contribuye a disminuir la comodidad del cantante o locutor).
En el caso de grabar voces en exteriores hay que prestar especial atención a los ruidos de ambiente: podemos reducirlo considerablemente con micrófonos direccionales (especialmente de diagrama polar hipercardiode o supercardioide) y ubicando -siempre que sea posible- la fuente sonora de frente a las fuentes de ruido (para captarla de espaldas a él). También el uso de un filtro de graves (pasa altos ajustado entre 80 y 100 Hz) es una opción útil a considerar para reducir el ruido de tráfico, manipulación del micro, roces de ropa, etc.
La elección de un micrófono u otro es materia bastante personal, e implica un conocimiento profundo del comportamiento de los micros que haya a nuestra disposición. En estudios, especialmente para postproducción de video, se suele trabajar con un micro de condensador de diafragma grande (tipo Neumann U87 o U47) colocado a un palmo de la boca, para cantantes pop y actuaciones en directo se prefieren micros dinámicos como el clásico Shure SM58, y en determinado tipo de rodajes o de programa de TV alguno de tipo lavalier (micro de solapa). Además del micro elegido, y de su ubicación (podemos alejarlo si se trata de grabar locuciones que luego irán en segundo plano), juega un gran papel en el sonido final el pre-amplificador (o previo) utilizado. Siempre que dispongamos de un previo decente externo a la mesa de mezclas es aconsejable utilizarlo. El principal objetivo del previo es amplificar la señal del micro lo necesario para que sea grabada con el nivel óptimo, pero además, el previo introduce coloraciones que en muchos casos son intencionadamente buscadas. Los previos a válvulas “añejos” parecen dar mayor calidez a la voz que los previos digitales más modernos (pero también pueden introducirnos más ruido e interferencias). En el caso de utilizar micros direccionales debe prestarse especial atención al efecto de proximidad: a medida que la fuente sonora se aproxima al micro se realzan más las frecuencias graves.
Los objetivos de la grabación que más debemos cuidar son:
* Obtener una calidad tonal lo más parecida al original, al tiempo que resaltamos aquello que la voz pueda tener de peculiar e interesante (para hacer la comparación es conveniente el ejercicio de escuchar la voz “al natural”, en la propia cabina de control o en la sala de grabación si es tonalmente neutra y “guardarnosla en la memoria” para hacer comparaciones cuando ajustemos el micro, o cuando la ecualicemos).
* Obtener una serie de ellas con suficiente coherencia tonal, estabilidad de niveles, calidad y claridad sonora entre ellas, de manera que aunque la banda sonora contenga fragmentos grabados en momentos diferentes ello no sea aparente.
* Especialmente en el caso de diálogos y locuciones, obtener tomas con el máximo grado de inteligibilidad posible. Podemos mejorar la inteligibilidad amplificando un poco la banda en torno a los 2 KHz (o en general amplificando 3 o 4 dB por encima de esa frecuencia), pero también nos puede ayudar el enlentecimiento artificial del ritmo de pronunciación (cuando ello sea posible). También la elección de una reverb bastante corta, poco prominente, e incluso con un predelay de unos 35 ms (para engrosar el sonido gracias al efecto Haas) puede jugar en favor de una mejor inteligibilidad.
Para paliar la sibilancia pueden utilizarse de-essers, una especie de compresores especializados que se encargan de recortar la banda en torno a 7 u 8 KHz. cuando existe un exceso de energía en ella (de hecho con muchos compresores normales es posible conseguir dicha función aún cuando no se especifique en su panel de control). El problema de las plosivas puede paliarse con ayuda de un filtro anti-pop (no quiere decir que elimine a los cantantes pop) o en su defecto con una pantalla elaborada con ayuda de alambre y una media o panty, que se colocan justo ante el micro, entre él y el/la vocalista. También puede ser útil en este caso descentrar ligeramente el micro, de forma que en lugar de apuntar al centro de la boca apunte a la mejilla o a la barbilla. Las respiraciones exageradas habrá que eliminarlas “a mano” o con ayuda de una puerta de ruido a posteriori (si hemos hecho la grabación sin utilizarla).
Respecto al procesado, casi siempre es preferible aplicarlo “a posteriori” pues al aplicarlo en grabación resultará imposible o muy difícil restaurar el original no procesado si ello es necesario. En todo caso, una puerta de ruido y una ligera compresión (dado el gran margen dinámico de la voz) son los tipos de procesado que sí pueden recomendarse en muchas ocasiones en las que hay que grabar una voz. En caso de usar compresión en la grabación suele preferirse un buen compresor analógico “añejo” o “con solera” (vintage) que añada calidez a la grabación digital, en lugar de uno de calidad media o incorporado en la mesa o en el sistema de grabación. También puede ser util en contadas ocasiones, siempre que no se abuse, el ayudarse de un transpositor para corregir desafinaciones.
Finalmente, si somos los responsables últimos del sonido debemos asumir dicha responsabilidad exigiendo repetir las tomas tantas veces como sea necesario para disponer de al menos una que sea satisfactoria (¿verdad que se hace lo mismo con la imágen y nadie pierde la calma?) siempre que la deficiencia en las tomas no se nos puedan achacar a nosotros mismos y a nuestros aparatos.