UPSAMPLER PARA RETOCAR... VALE O ES PEOR

Este espacio es para aprender y preguntar sobre conceptos totalmente básicos, no tengas pudor en preguntar y preguntar que para eso esta: ¿qué es la frecuencia de resonancia? ¿qué es una octava? ¿qué coño es –3db, +12db que sale cada dos por tres?
Responder
ferusso
Mensajes: 186
Registrado: Sab 19 Feb 2005 , 20:19

UPSAMPLER PARA RETOCAR... VALE O ES PEOR

Mensaje por ferusso »

Hola
He leído a través del tiempo varios post calientes sobre los formatos digitales, sus bit y frec. de muestreo etc. CD vs. Sacd o DVA-a etc.
Como conclusión personal el CD me alcanza y sobra.
He entendido si la necesidad de +bits + frec. para un menor degradación en el entorno digital para la manipulación del audio (mezclas, filtros y dosmil plug-ins, etc)
Tengo idea de pasar algún vinilo, ya lo he hecho antes, a CD. Como no dispongo de grabarlo a mayor calidad que en CD y quiero aplicarle luego en el ordenador algún filtro de clicks y pops. Me pregunto si vale la pena subir up samplear el wav de 44.1Khz 16bit en el ordenador a no sé 96khz xbit, aplicar el filtro, y volver a los 44.1K para quemar el CD.
:?:
o directamente 44.1 +proceso
Dentro de estas dos opciones ¿Cuál les parece que jode menos la señal?
Saludos
Soundmuller

Mensaje por Soundmuller »

Pues hace ya tiempo algún amigo técnico de sonido creo que llegó a decir eso mismo que dices tu. Que el wav original lo captaba a una frecuencia o resolución mayor, hacía todos los cambios y retoques y, una vez arreglado todo, lo convertía a 44.1 Khz y 16 bit.

Yo hice eso que dijo y, sinceramente, lo único que coseguía notar era que tardaba mucho más todo el proceso. Prueba tu mismo y decide en función de tus resultados.

Te hablo de hace ya como un año o más, así que resultados exactos no te puedo dar pero si te digo que lo que hago lo hago directamente en 44.1 Khz y 16 bit.

Un saludín.

José Luis
RR
Mensajes: 370
Registrado: Jue 25 Nov 2004 , 21:55

Mensaje por RR »

Hola:

En mi opinión, más importante que que la frecuencia de muestreo es la profundidad de bits. Si el resultado final va a ser un CD lo ideal sería grabar a 44.1 / 24 bits, hacer los filtrados, y luego pasar a 16 bits con "dither" y "noise shaping".

De ese modo los errores de redondeo en los cálculos de los filtros se quedan por debajo del ruido de 16 bits y quedan "absorbidos" con el dither. El noise-shaping te da la máxima resolución en medios a costa de algo de ruido a muy alta frecuencia, y es lo estándar en muchas grabaciones modernas, que suenan muy bien. Digamos que "reparte" el ruido del dither en frecuencia donde más conviene al oído. Puedes hacerlo en cool edit, por ejemplo.

Solo para paranoicos: Hay un ingeniero de sonido (Tony Faulkner) que graba a múltiplos de 44.1, en previsión de que esa grabación se edite en otro formato, y hace un resampling salvaje por simple promediado. Dice que si hay poca energía en alta frecuencia, como suele ocurrir en grabaciones acústicas, no hay apenas problema de aliasing, y el resultado final le suena más "enérgico" (?). Más información en http://www.audiosignal.co.uk/freeware.html
Y bajarse el archivo en "Faulkner downsampling". El readme explica en qué consiste la cosa y cómo usar el programa.

Un saludo,

R
ferusso
Mensajes: 186
Registrado: Sab 19 Feb 2005 , 20:19

Mensaje por ferusso »

Gracias Soundmuller y RR

Como no puedo digitalizar a más de 44.1K 16bit será cuestión de ser metódico y prepar muestras y compararlas después de una semana :oops: ya que escucho al fan del ordenador esta cuando duermo :cry: Me preocuparé más por el bitaje :shock:
Tengo instalado el cooledit y el SoudForge. Y para hacer el downsampling tengo varías opciones y :x preguntas

SF
Imagen
1) Aquí para bajar la frecuencia supongo que siempre con el antialias prendido. Y la interpolación que no sé que es para no tener compromiso supongo que al máximo.

Aquí las opciones para la conversión de bits NPI cual sería la mejor :?:
Imagen
Imagen

Cooledit

Más opciones todavía
Imagen
Imagen

Para downsampling
Pre/post filter :?:
Dithering: Dither Deph :?:
p.d.f :?:
Noise shaping :?: (mejor en clase a no :wink: )

RR
He probado el ejecutable del link. Así al pasar no noto diferencias (Eso sí hay que teclear.... :x ) Depaso esos link son una caja de Pandora ej, je. Y si me compro un ablandador de cables :roll:
Saludos
RR
Mensajes: 370
Registrado: Jue 25 Nov 2004 , 21:55

Mensaje por RR »

Hola:

Se me había pasado en la respuesta que no podías digitalizar a más de 44/16. Entonces la cosa cambia. Dudo mucho, como decía, que ganes nada haciendo un upsampling para después tener que volver al muestreo original.

En teoría el upsampling podría servir para algo sólo si es el formato final, y sólo si has hecho un proceso intermedio, y sólo si hay una limitación de bits en el formato final: muchas condiciones.

Supon que digitalizas a 44/16, aplicas filtros, y el formato final es 96/16. Entonces estaría bien hacer un upsampling a 96/32, procesar y luego aplicar dither y noise-shaping para pasar a 96/16. ¿Por qué? Porque el noise shaping quita ruido en unas bandas a costa de aumentarlo en otras, y con más ancho de banda puedes "poner más ruido" en alta frecuencia, fuera de la banda audible, y aumentar mucho la resolución efectiva en la banda de audio.

Si el formato final es otra vez 44/16 la cosa no está tan clara. Sí lo está para mí que aumentar la frecuencia de muestreo no tiene mucho sentido. Me explico: Si el filtrado de ruidos generara componentes armónicos entonces sí podría tener sentido, porque sería conveniente evitar el alias de frecuencia, pero no creo que sea el caso (no estoy seguro de cómo funciona un filtro de clicks, pero casi seguro que es un filtro lineal, no genera frecuencias nuevas).

El dither y noise-shaping en cambio sí lo tiene, porque el filtrado sí va a generar ruido de redondeo en las operaciones, y ese ruido sí conviene tenerlo en las frecuencias a que menos moleste. En teoría. Si digo que no está tan claro es porque cuanto peor sea la digitalización, más ruido tenga por la fuente original (LP) o el ruido de la electrónica o limitaciones del convertidor, menos va hacer falta ser tan picajoso: Habrá un "suelo" de ruido que puede estar muy por encima del que introduzcan las operaciones de filtrado y lo enmascare.

Así que creo que el upsampling y posterior downsampling no hace ninguna falta, y sólo introducirá ruido en la señal. Ahorratelo tranquilamente, es mejor.

En cambio sí es buena cosa hacer las operaciones a mayor profundidad de bits (32 float para wavs., por ejemplo) y luego pasar otra vez a 16.

Puestos a probar yo probaría truncando a lo bestia, contra una profundidad de dither pequeña, como mucho un bit, con noise-shaping.

En tus pantallazos:

Antialias: Es un filtro pasabajos para evitar que haya frecuencias por encima de la frecuencia de Nyquist (1/2 de la frecuencia de muestreo). Si las hay ocurriría lo siguente: Supón que queremos pasar a 44100 de muestreo, y hay señal a 25000 hz. La frecuencia de Nyquist es 22050. Si no filtramos con antialias aparecerá la frecuencia simétrica respecto Nyquist, es decir: 22050-(25000-22050)= 22050-1950 = 19100
Este sonido no estaba en la señal original, es el "reflejo" de la alta frecuencia por encima de F_nyquist. Me dirás que no es gran cosa, tan arriba, y que habrá poca señal a esa frecuancia. Pero está.

En cool edit la opción equivalente es pre-post filtering.

Lo que pasa es que tu digitalización original a 44100 ya está filtrada, de modo que, incluso si no me haces caso y haces upsampling, te puedes ahorrar el antialias, no tiene sentido hacerlo dos veces.

Interpolation accuracy: Para cambiar de frecuencia hay que poner nuevos "puntos de muestreo" en el tiempo que no tienen que coincidir con los instantes orignales. Por eso hay que interpolar (deducir el valor de la señal en ese nuevo punto a partir de los valores de puntos cercanos). Por supuesto máxima precisión 8) Pero insisto en que no recomiendo cambiar la frecuancia de muestreo por lo dicho arriba.

Dither: El óptimo es triangular, según la teoría. ¿Qué es esto? El dither es ruido añadido, para enmascarar el ruido de cuantificación (el que se produce al truncar la señal), que está modulado y es potencialmente audible, y hacerlo realmente "ruidoso", es decir, aleatorio, sin relación con la señal. Esto a costa de reducir un poco el margen dinámico. Bien, cuando se dice que el dither es triangular, rectangular, etc., de lo que se habla es de su distribución de probabilidad.

Si el dither es de 1 bit pico a pico, quiere decir que a la señal a 32 bits se le añadirá aleatoriamente un valor cualquiera en el margen que equivalga a [-0.5 bits, +0.5 bits] a 16 bits de resolución, y luego se truncará. Si esto no se entiende bien haré un dibujito.

Si el dither es rectangular, la probabilidad de que el valor añadido sea 0 es igual a la de que sea -0.5, o 0.25, o cualquiera. Si es triangular, la probabilidad de que se añada 0 es doble de que se añada 0.25, por ejemplo. Los matemáticos dicen que es la óptima, la que elimina toda "modulación" de ruido, y por tanto la que menos distorsiona, hagámosles caso.

Noise-shaping: "Dar forma al ruido". Pues eso, distribuirlo en frecuencia. En soundforge veo que da dos opciones: High-pass sólo lo disminuye por debajo de una frecuencia para aumentarlo por encima de ella, y equal-loudness (deduzco) lo disminuye más en medios para aumentarlo en graves y agudos, según, supongo, las curvas de fletcher-munson (oímos más en medios que en graves y agudos). Yo usaría esta última.

p.d.f.: Probability distribution function, lo de arriba.

La duda es: ¿Qué profundidad de dither usar? Sin noise-shaping el óptimo es 1 bit pico a pico. Pero con noise shaping pensaba que se necesitaba algo más, y al leer la ayuda de cool-edit veo que aconsejan lo contrario. :?:
Lo miraré. También influiría el error que supongamos que ha habido en los cálculos, pero esto es afinar mucho. Seguro que la diferencia va a ser mínima, si es que se detecta.

Así que, en resumen, valores cuidadosos y razonables, salvo prueba en contrario :roll: serían:

No cambiar la frecuencia de muestreo.
Aumentar la profundidad de bits a 32.
Filtrar clicks, etc.
Volver a 16 bits aplicando dither triangular (1 bit pico a pico) y noise-shaping equal loudness.

En cool-edit las opciones no están tan claras: La profundidad de dither es ambigua, ¿es de pico a pico o de cero a pico? Y los filtros de noise-shaping supongo que se refieren a curvas de ponderación estándar, como los sonómetros (dBs A, B, etc.). Ante la duda, la curva por defecto de abajo que tienes resaltada.

¿Por qué son una caja de Pandora los links esos? :) Es todo bastante técnico, ¿no?

Un saludo, y perdón por el tochazo,

Roberto
ferusso
Mensajes: 186
Registrado: Sab 19 Feb 2005 , 20:19

Mensaje por ferusso »

Hola RR
Ningún Tochazo. Más que agradecido por los datos. :D :D :D
Lo de Pandora en broma (desde el punto de vista azul: si mejor no habras la caja, je. :wink: )

Saludos
Responder