el DRC (Corrección Digital de Sala)

¿Qué es una bola de graves?, ¿por qué está el tweeter en la mitad superior de una caja?, ¿cómo hacer que nuestro equipo suene de verdad mejor?.
Todo aquello relacionado sobre la segunda cosa más importante de nuestro equipo.
Responder
Avatar de Usuario
wynton
Admin
Mensajes: 3065
Registrado: Vie 26 Nov 2004 , 9:05
Ubicación: Madrid

Mensaje por wynton »

Invitado escribió: Parecen chillonas sin ecualización. El monte a 2.000Hz no presagia nada bueno.
Estooooo.... Me parece que con tanta gráfica y experimento me he explicado mal.

Imagen

Lo que se ve aquí es la curva del ajuste del ecualizador, medida de dos maneras.
Es la unión de mi ajuste del eq. gráfico:

Imagen

y del eq. paramétrico:

Imagen

Es decir, no se ve en ninguna de las dos curvas (verde y roja) nada asociado a la castaña de B&W que tengo.

La curva verde es la medida directa enchufando solamente el ecualizador al PC y dandole caña a los tonos.
La curva roja es el resultado de la medida acústica de sala con el ecualizador, pero corregida empleando como referencia la medida de acustica de sala sin ecualización, en modo normal. Y resulta que el efecto de la ecualización sobre la acústica de mi salón (independientemente de que el ajuste sea bueno o malo) es completamente lineal. No hay efectos secundarios por "inter-relación" con las cajas, o con los rebotes de sonido de las paredes, o con el ampli.

Parece una chorrada, pero tras esto se esconde el fundamento de como DRC calcula el filtro corrector. Veamos:

Si yo quisiera saber cómo (técnicamente) sonaría un "generador de ondas cuadradas" en mi equipo, ya no necesito ponerlo. Mido la señal cuadrada del aparato con un PC y le hago la convolución con la respuesta impulsiva del sistema y...ya está. Tengo la señal tal cual va a sonar.

Es igual que con el ecualizador. Para saber su efecto me basta con medir su respuesta impulsional (es que el ecualizador no genera nada de señal, pero hace transferencia input-output) y hacer la convolución correcta con la medida de la acústica de mi salón.

Si cambio de ampli y le pongo uno de valvulas sin realimentación negatiffa (jejeje), puedo conocer su efecto sobre la acústica del salón "des-convolucionando" la respuesta impulsional de mi Yamaha y "convolucionando" la respuesta impulsional del ampli nuevo.

Es decir, la medida de respuesta a impulso del sistema es igual a las convoluciones de cada una de las medidas de respuesta de cada componente. No hay interacciones (relevantes) entre ellos.

Eso es lo que se llama un sistema LTI (lineal e invariante con el tiempo).

Estamos hablando de equipos de puta madre como el mio y el de cualquiera. Si tenemos distorsiones del 5% al 10% la cosa quizás sea diferente.

Y podemos ir a más conclusiones curiosas:

Por ejemplo, aquí tenemos IR (impulse responses) de salas de concierto.

http://www.acoustics.net/content.asp?id=49

Pues si yo tuviera una sala sorda sorda (de las que le gustan a atcing) y digitalmente hago en tiempo real la convolución de una IR de uno de estos auditorios con la música que quiero oir, tendré algo parecido a la sensación acústica de estar en uno de estos sitios. Un reverb por convolución.

Y por último. Yo tengo una idea de que tipo de sonido quiero tener en mi salón. Por ejemplo, sonido plano-plano-plano, es decir, una IR que sea una auténtica Delta de Dirac. Pues por convoluciones puedo extraer de la medida acústica de mi salón una respuesta a impulso que me genere ese sonido plano-plano que deseo tener. Habrá que hacer inversiones de transformadas de Fouier y un montón de artificios, pero son matemáticas de las de programar en un PC.
Luego lo convoluciono con la música y ya está, tengo sonido plano-plano.



Bienvenidos a DRC.

Lástima que se me olvida un parámetro. ¿Donde está el factor posición del oyente en toda esta película? Mierda, comienzan los problemas. Y hay alguno más.
RR
Mensajes: 370
Registrado: Jue 25 Nov 2004 , 21:55

4. Tiempo y frecuencia (3)

Mensaje por RR »

Bueno, sigo con el ladrillamen. Espero que al menos se digiera poco a poco.

Habíamos visto que la transformada de Fourier, versión FFT, nos permitía tener la respuesta en frecuencia a partir del impulso obtenido por los métodos que ha explicado wynton. Habíamos visto también que podíamos escoger una determinada longitud de impulso (en muestras), siempre que fuera una potencia de 2.

Vamos a ver qué implica escoger una longitud u otra.

En primer lugar, repasamos que la relación entre número de muestras y duración del impulso depende de la frecuencia de muestreo (Fs). Las magnitudes de la frecuencia son 1/T (T es el tiempo), así que nuestro escalón de tiempo es 1/Fs, y la duración de un impulso de n muestras será n/Fs.

Supongamos que nuestra frecuencia de muestreo es Fs=48000, y que tenemos un impulso cortito, de 2^4 muestras. 16 muestras es una birria de impulso (16/48000 son sólo 0.33 milisegundos) pero nos vale para el ejemplo.

Al hacer la FFT obtenemos una nueva función que también tiene 16 elementos, igual que nuestro impulso. Lo que viene ahora es importante, y poco intuitivo, así que atención:

El último elmento (el 16) de nuestra función frecuencia es el valor correspondiente a Fs.
El primer elemento de nuestra lista es el valor correspondiente a Fs/n (48000/16=3000).
El resto de valores de frecuencia los obtenemos sumando sucesivamente 3000.

Por tanto, si hacemos una gráfica de respuesta en frecuencia, tendríamos que poner en el eje de las x (horizontal), los valores 3000, 6000, 9000,... hasta 48000.

Vemos que, al contrario de las gráficas a las que estamos acostumbrados, las frecuencias están espaciadas linealmente, no logarítmicamente (¿se entiende esto?).

Bien, ¿y qué valores ponemos en el eje de las y (vertical)? Los que hemos obtenido del FFT, pero no sin antes manipularlos un poco.

Ahora, ducha de matemáticas, no hay más remedio. La función FFT nos da valores que son números complejos, la liamos. Eso quiere decir que no son valores de magnitud que podamos poner directamente, sino que son una especie de vector de dos componentes, que se puede representar en un plano. Sus componentes se llaman valor real, que dibujaremos en el eje x, y valor imaginario, que dibujaremos en el eje y.

Imagen

Pues bien, al dibujarlo vemos que el número complejo tiene una longitud, llamada módulo, y forma un ángulo con el eje horizontal, al que llamamos argumento. En cristiano: ¡Tenemos la magnitud de la presión sonora y su ángulo de fase de una tacada!

Si queremos expresarlo en dB tendremos el SPL (sound pressure level), entonces: SPL = 20*log10(magnitud). si no entendéis esto no preocuparsus mucho, se aprende como por contagio. Por supuesto, una medida de SPL es relativa si no tenemos una referencia o un medidor calibrado (sonómetro), pero la medición de SPL absoluto no nos interesa de momento.

Ahora volvemos a nuestra gráfica de respuesta en frecuencia y pintamos los valores de SPL recién calculados, contra la frecuencia a la que corresponden, y podría quedarno algo tal que así:

Imagen

Esto es un ejemplo, pero lo que saldrá en todas las gráficas reales que hagamos, si las pintamos con el mismo criterio, es que ¡el espectro es simétrico! Baste sólo decir que toda la mitad derecha no nos sirve a efectos de representar la curva, es un efecto del cálculo, y nos quedamos entonces con una respuesta en frecuencia doblemente birriosa, puesto que en lugar de 16 valores la hemos dejado en 8, que son:

3000, 6000, 9000, 12000, 15000, 18000, 21000, y 24000.

Y ahora las conclusiones. Por favor, grabaros esto a fuego ;-)

1. Cuanto más largo es el impulso, más información de graves tendremos. Si hubiéramos tomado 32 muestras en lugar de 16, podríamos haber llegado a saber el valor a 1500 hz (la mitad de 3000).

2. Cuanto más largo es el impulso, mejor resolución tenemos en el eje de frecuencias. Con 32 muestras nuestra escala habría sido 1500, 3000, 4500, 6000, etc.

3. El valor más alto que podemos conocer, en el extremo agudo, es la mitad de la frecuencia de muestreo.

Y creo que con esto basta para las pesadillas de hoy. Dejamos la convolución para mañana.
Invitado
Mensajes: 492
Registrado: Mar 23 Nov 2004 , 13:07
Ubicación: De baja de éste foro.

Mensaje por Invitado »

Hola win,

comprendido, el gráfico es la comparación entre la función de transferencia del ecualizador y la respuesta "normalizada" del ecualizador en tu sala.
Lo había entendido bastante mal.

La coincidencia es pasmosa, me hubiera esperado más intromisión de la sala al ecualizar. Mejor.

¿Que aspecto tiene un IFFT de la función "normalizada"?

Un abrazo
Miguel mentero
Avatar de Usuario
wynton
Admin
Mensajes: 3065
Registrado: Vie 26 Nov 2004 , 9:05
Ubicación: Madrid

Mensaje por wynton »

Invitado escribió: ¿Que aspecto tiene un IFFT de la función "normalizada"?
Hola Miguel. Aquí te planto los dos impulsos. Arriba sin ecualizar y abajo "ecualizado" (aunque el ajuste es a "los dos canales igual", me queda por hacer). Aún no he podido sacar conclusiones de la comparación. Por supuesto se admiten comentarios.

Imagen

Los niveles son comparables: es decir he "amplificado" en audacity por igual ambas señales. Y las medidas se hicieron sin tocar volumen del ampli.
---------------------------------------------------------------------------------

El resto de propuestas tendrán que esperar. Que no es por falta de ganas.
Avatar de Usuario
wynton
Admin
Mensajes: 3065
Registrado: Vie 26 Nov 2004 , 9:05
Ubicación: Madrid

Mensaje por wynton »

Miguel, he estado estudiando cómo "mirar" esas dos respuestas impulsionales y es curioso, porque si las pongo con la amplitud en escala logarítmica (decibelios) se comprueba donde está la corrección que hace mi Ultracurve.

Imagen

El impulso de arriba es sin ecualizar y el de abajo ecualizando con esas fotos de "display" que he puesto por ahí.

Es curioso porque si lo miras en la gráfica anterior te preguntas, ¿pero que leches estoy corrigiendo con ecualización de sala?. Y cuando lo pasas a escala decibelios (que para nuestros oidos es la buena) ves perfectamente la atenuación de la "portadora" de la señal, que es una onda de graves de la cual se puede calcular la frecuencia echando leches:

Son 20 milisegundos entre crestas: 50 Hz. Y eso la resonancia más visible, que seguro que enmascaradas están frecuencias algo mayores pero perfectamente audibles.

Perdonad el off-topic, porque aunque hay algo de relación en sus objetivos, entre lo que hace DRC y lo que hace un ecualizador convencional, por muy digital que sea, media casi un abismo.

Que nadie se despiste, los mecanismos de DRC son muchos más complejos y más potentes (para lo bueno y sobre todo para lo malo) que 10 paramétricos de un TacT como el de la foto que nos puso Luismax.

Pero quizás haya que parar aquí unos días las prácticas. Hay mucho que comentar y hoy no tengo mucho tiempo. Os animo a comentar temas generales cómo:

- DRC y el tratamiento acústico ¿Excluyentes o complementarios?

- ¿Cuando estamos corrigiendo la acústica de sala y cuando el comportamiento de los altavoces?

Y esta otra pregunta que me tenéis que perdonar los que ya me conoceis:

¿Aonde leches está el "amarfilamiento"? :wink: :wink: :wink:
Invitado
Mensajes: 492
Registrado: Mar 23 Nov 2004 , 13:07
Ubicación: De baja de éste foro.

Mensaje por Invitado »

Hola win,

Curiosa la perspectiva en dB del impulso.

Me sigue llamando la atención la cantidad de rebotes que tienes y sobre todo, que son casi de la misma magnitud que el impulso original. Podrías localizarlos con tiempo, paciencia, la función impulse de smaartlive y un metro cuadrado de panel absorvente.

Los rebotes de suelo y techo son difíciles de corregir con DRC, por que son muy dependientes de la posición del sujeto, y a menudo, se solapan en el tiempo en salas de altura de techo normal.

Sin embargo, los rebotes de la pared de detrás de los altavoces son muy tratables, por lo que el uso de DRC permite pegar literalmente los altavoces a la pared trasera, con la consiguiente mejora en WAF y en imagen estéreo.

Perdón RR si me adelanto.

Tu primer impulso tiene unos picos muy cercanos que son claramente procesables, y que, respondiendo a tu pregunta, son, sin duda, la clave del amarfilamiento.
Pero por caridad, no llevemos éste hilo a ése terreno.


Un abrazo
Miguel mentero
P.D. Impulso en el lugar de escucha de casa. A mí me parece que los altavoces con directividad controlada son buena cosa.

Imagen
Avatar de Usuario
luisggarcia
Mensajes: 802
Registrado: Vie 16 Jul 2004 , 9:28

Mensaje por luisggarcia »

Invitado escribió:No es el signo del pico principal el que define la polaridad.
La polaridad la da el signo positivo o negativo del primer pico, que, con filtros de los habitualmente empleados, no suele ser el más grande.
Cierto
Avatar de Usuario
luisggarcia
Mensajes: 802
Registrado: Vie 16 Jul 2004 , 9:28

Mensaje por luisggarcia »

Me parece muy interesante y me gustaría colaborar a tratar de explicar cosas de forma sencilla aunque no creo que sea capaz de hacerlo tan bien y tan técnico como RR.

Hay una forma “casera” de obtener una respuesta impulsiva de una sala. Consiste en un golpe instantáneo que contenga todas las frecuencias en un instante muy corto de tiempo. Es decir producir una explosión dentro de la habitación.

Es generar una Delta de Dirac “manual”. No vale por ejemplo un petardo porque saturaría el micrófono de medida pero si producir un chasquido golpeando tos tablas de madera entre si o explotar un globo. También se aproxima a una Delta de Dirac un chasquido de un lector de CD por un fallo de grabación.

Hace falta un micrófono y un programa de ordenador que permita ver el impulso grabado y comprobar que el pico de más amplitud no llega al máximo valor de la tarjeta de sonido.

Se notaría porque no sería un pico si no que en el valor máximo sería plano debido a que llega al máximo valor de la tarjeta y recorta el resto del pico con valor superior. Se pueden ir explotando globos para ir ajustado a ganancia del micrófono hasta que no recorte.

De esta manera veríamos la respuesta impulsiva de la habitación. Luego se necesitaría un programa que analizase el espectro de esa explosión. Por ejemplo el Windows Media Player con visualización de Barras y ondas: Barras o brisa marina nos permitiría ver durante un instante esa respuesta en frecuencias de nuestra habitación. Esta forma “casera” de ver la respuesta impulsiva de la habitación a parte de muchas pegas respecto a otras mucho más perfectas como los LogSweep permite ver solo la sala. En cambio los otros métodos miden la mezcla de respuesta de los altavoces y sala juntos. Y la explosión o golpe de tablas solo la de la habitación.

Saludos Luis García.
hiendaudio
Mensajes: 573
Registrado: Mié 23 Jun 2004 , 19:08
Contactar:

Mensaje por hiendaudio »

Buenas:

Luis, asi si me gusta, a la antigua!!!jejeje. También vale un spark-gap. :wink: (sorry no puedo evitarlo, tengo pasión por el Voltio!!!!!)

Luis G, te he mandado un privado, fijate que a mi no me saltan automaticamente, seguro a tí te pasa lo mismo. :evil: :evil: ( a ver webmasters :twisted: :twisted: )

Saludos.
Avatar de Usuario
luegotelodigo
Mensajes: 584
Registrado: Dom 21 Nov 2004 , 13:28
Ubicación: Graná

Mensaje por luegotelodigo »

Yo hice hace tiempo una delta de Dirac que tengo en WAV haciendo zoom en un editor de audio de una pista en silencio hasta el máximo y cogiendo una sola muestra y llevándola al máximo.

Aquí la tienes:

Imagen

Evidentemente la FFT no sirve para nada a -150dB...

La he colgado en mundohifi porque no sé si aquí se puede.
Saludos
Avatar de Usuario
luisggarcia
Mensajes: 802
Registrado: Vie 16 Jul 2004 , 9:28

Mensaje por luisggarcia »

Si en lugar de la explosión reproducimos un chasquido pulso o Delta de Dirac por los altavoces y grabamos con el micrófono podemos ver respuesta impulsiva y en frecuencia conjunta de la habitación y equipo.

Vamos a suponer unos auriculares como sonido perfecto: habitación sin rebotes y altavoz con respuesta plana.

Y el empleo de un ecualizador en el que ponemos la respuesta en frecuencias del impulso o el inverso. Por ejemplo supongamos que escuchamos la explosión y tenemos 100 Hz a 2 db 1kHz a 1 db y 10kHz a 0,5 db.

Ecualizar una música igual a la explosión significa que las frecuencias de 100Hz. Las multiplicamos por 2 las de 1 kz las multiplicamos por 1 (las dejamos como están) y las de 10 kHz las multiplicamos por 0,5 o dividimos por 2 que es lo mismo.

Ecualizar una música con el filtro inverso supone dividir las frecuencias de 100 Hz de esa música por 2 las de 1 kHz las dejamos como están y las de 10 kHz las multiplicamos por dos.

Si escuchamos música por los auriculares ecualizando con la respuesta del pulso (explosión) en la habitación tendremos un sonido “similar al que escucharíamos en la habitación”.

Si escuchamos música en la habitación ecualizada con la inversa del impulso sería perfecto como en los auriculares.
Avatar de Usuario
luisggarcia
Mensajes: 802
Registrado: Vie 16 Jul 2004 , 9:28

Mensaje por luisggarcia »

Veamos como es en PCM o audio digital esa explosión, chasquido o Delta de Dirac. Se trata de valor 0 excepto en un punto que tiene valor 1. El valor analógico que sale por el lector de CD no es un punto, si no un valor continuo en el tiempo y ondulado debido al filtro paso bajo y sería la línea azul.

Imagen

Se emplea este pulso porque en frecuencia contiene todas las frecuencias y todas al mismo nivel, es decir, que si producimos un chasquido o explosión y medimos el espectro, vemos una respuesta en frecuencia plana en nuestro sistema ideal.

Si no es respuesta plana, sabemos que tenemos que ecualizar subiendo o bajando las diferentes frecuencias para que sea plana.

La señal de audio digital además se puede considerar como una serie de Deltas de Dirac o pulsos a una velocidad de 44100 por segundo. Y la salida analógica sería la línea azul que es una línea suavizada por un filtro paso bajo que pasa por todos los puntos o Deltas de Dirac.

Imagen

Por eso, viendo lo que hace con una, podemos averiguar lo que va ha hacer con todas. Es lo mismo para cada una pero en mayor o menor amplitud e instante de tiempo.
Última edición por luisggarcia el Lun 27 Jun 2005 , 14:59, editado 1 vez en total.
Soundmuller

Practicando

Mensaje por Soundmuller »

Hola a todos:

Como leyendo todo parece muy fácil y comprensible me he puesto a practicar para ver todas estas cosillas que nos ha ido poniendo por aquí estos amigos.

Lo primero es fácil, o sea, generar el sweet.pcm, el inverse.pcm y el impulse.pcm y verlos en el Audacity. El hardware empleado es ECM8000, MobilePre, Athlon XP 2200 y equipo activo con el DCX 2496 más o menos bien ajustado. También he usado otro PC con K6 II a 400 Mhz y tuve que desistir por cosillas que contaré.

Bueno, las pegas empiezan cuando uso el K6II. Para practicar reproduje el sweet.pcm en el equipo, para ajustar niveles y tal. Luego se me ocurrió grabar el sweet.pcm con el micro y salió una cosa extraña. Por lo pronto, cada vez que el sistema “asentaba” los datos en el disco duro hacía un ruido de interferencia. A lo largo del sweet fueron 3 veces ese ruido.

Luego, la gráfica resultante, que se me borró con tanto cambilache de archivos, era como un chorizo de cantimpalo, es decir, en vez de una sola morcilla larga como el sweet original, era una sucesión de valles y bolas, principalmente al principio de la gráfica, en los graves. Inmediatamente lo relacioné con los modos de la sala, captada su influencia por el micro en la posición de escucha. Como éste pero mucho más acusado.


Imagen

El impulso salía tal que así.


Imagen

Así que visto lo visto, me fui por el PC grande y empecé de nuevo todo, generando los sweet y demás.

Una vez todo el hardware reinstalado y listo, vuelvo a grabar el sweet con el micrófono y ahora va y sale esto


Imagen

Con su gráfica de espectro siguiente. Esto me descuadra todo, pues la diferencia es clara con la anterior grabación. Pudiera ser achacable a la diferencia de potencia de los PC, que el K6 II no pueda con los datos que le llegan y los pinta como puede. Pero bueno, sigo con las prácticas.


Imagen

Ahora voy y genero el impulso con el sweet grabado y sale esto


Imagen

Con su gráfica de espectro.



Imagen

Si lo reproduzco y la grabo, para ver qué recoge el micro pues esto es lo que graba, la gráfica inferior de las dos, la de arriba es la original.



Imagen

Si le doy a ver la gráfica inferior en formato de onda dB, pues aquí lo tenéis.



Imagen

:shock::shock::shock: Einnnnn, mandeeeeeee, me lo explica alguien. Eso tiene que ser así o hay algo que está mal hecho.

Porque, por ejemplo, se me ocurre pensar que el micro grabará todo lo que suene en la sala y claro, el pc hace ruido y estaba como a 1.5 m del micro. Además el canario que estaba en el patio no paraba de trinar, jejejeje y algo se escucha en la sala (obviamente se llama Pavaroti)

Como habéis obtenido esas gráficas, Wyn y Mentero, sobre los impulsos en la sala con las reflexiones de la sala. Quizás es que hay que ajustar otros parámetros o de otra forma.

Con la función Impulse del Smaart si las obtengo, más o menos similares, pero con este programa, ya veis lo que sale.

Bueno, ahora que estoy viendo ese tema con más interés y profundidad (superficial, todo hay que decirlo) me parece que lo que se pretende conseguir con el DRC es más o menos los mismo que se hace con la Auralización ¿no? Es que el programa CARA tiene esa función, solo que teórica, pues en virtud de cómo se modele la habitación te crea una curva de ecualización que se aplica a un archivo wav y, supuestamente, te corrige el sonido para que suene en función de la acústica de la sala. Lamentablemente, nunca he probado en serio esa función.

Un saludo a todos.

José Luis :shock:
Avatar de Usuario
wynton
Admin
Mensajes: 3065
Registrado: Vie 26 Nov 2004 , 9:05
Ubicación: Madrid

Re: Practicando

Mensaje por wynton »

Hola José Luis,
soundmuller escribió: Como leyendo todo parece muy fácil y comprensible me he puesto a practicar para ver todas estas cosillas que nos ha ido poniendo por aquí estos amigos.
si si si si, que liantes somos, ¡¡¡jejejejeje!!!!

Ahora en serio, el sistema es fácil. Lástima que equivocarse la primera vez sea aún más fácil.
La parte complicada del asunto, aunque suene raro, está en el cableado y ajuste de niveles. Demasiados cables, demasiados potenciometros.. La parte software es mucho más sencilla.

Quizás un K6 o PII sea poca potencia de proceso para una tarjeta de sonido trabajando en duplex (graba y reproduce a la vez), o que, con el paso del tiempo, su hardware asociado (un disco duro "veterano" por ejemplo) nos falla en los mejores momentos, como debe ser.
soundmuller escribió: Imagen

El impulso salía tal que así.


Imagen
Algo así es lo que debe salir. Aunque.... la "morcilla" de arriba la firmaba yo para mi casa. Te pongo cómo se ven la grabación a micrófono (arriba) y la grabación en bucle de la tarjeta de sonido, tal cual le gusta a lsconv.exe (izquierda microfono y derecha tarjeta). En la captura de pantalla se ve que he separado la pista estereo. Pero se grabó a la vez.

Imagen
soundmuller escribió:
Imagen
Por comparación visual me parece que no has capturado el microfono sino el canal del lazo de la tarjeta de sonido. Recuerda que le tienes que indicar a audacity en preferencias (Audio E/S) que quieres grabar estereo.

soundmuller escribió: Ahora voy y genero el impulso con el sweet grabado y sale esto

Imagen
Se ven claramente los picos de la distorsión armónica a la izquierda del pico de la delta de Dirac. Eso, según entiendo yo, es señal inequivoca de que no "has pasado" por el medio acústico. Cuando se recoge la señal del sweep con micrófono, la distancia "ruido de fondo" a "distorsión armónica", que podemos verla cómo lo bien marcados que están los picos de distorsión sobre el fondo de señal, es pequeña.

Te pongo cómo ejemplo la pantalla de la respuesta a impulso del canal izquierdo y del canal derecho de la grabación que te he puesto.

Imagen

Arriba está la grabación con el micrófono. Se pueden ver las distorsiones armónica de orden dos y tres. El resto está desaparecido bajo el ruido de fondo (el canario, ya sabes...)
Abajo vemos que el ruido de fondo es mucho menor en el canal de la tarjeta de sonido (lógico, menos mal) y se pueden contar distorsiones armónica de mayores ordenes.

Luego también vemos que arriba el pico de la delta no es simétrico sino que se "estira" hacia la derecha, hacía el lado donde tenemos la acústica de la sala. Abajo vemos una delta más simétrica, con el pre-ringing y el post-ringing más equilibrados.

Todo esto son signos "visuales" de lo que estamos haciendo.

Así que el diagnóstico es: repasa el cableado y la configuración de audacity.

Ahora sigo....
Avatar de Usuario
wynton
Admin
Mensajes: 3065
Registrado: Vie 26 Nov 2004 , 9:05
Ubicación: Madrid

Re: Practicando

Mensaje por wynton »

Y otro detalle. Cuanto más se parece la respuesta a impulso del sistema que estamos midiendo a una delta de Dirac más marcado es su pico.

Esto es muy interesante (a mi modo de ver) porque si tenemos en cuenta que, realmente, la energía transmitida es la misma en todos los casos, lo que vemos en el pico es la cantidad de energía sobre el total que se transmite o reproduce "en fase".

Es decir, que en la tarjeta de sonido el desfase que provoca en la señal es muy pequeño, frente al sistema cajas/sala, donde la energía se reparte mucho más fuera de fase "perfecta" y el pico se atenua alguna decena de decibelio tranquilamente.
soundmuller escribió: Si lo reproduzco y la grabo, para ver qué recoge el micro pues esto es lo que graba, la gráfica inferior de las dos, la de arriba es la original.



Imagen

Si le doy a ver la gráfica inferior en formato de onda dB, pues aquí lo tenéis.



Imagen

:shock::shock::shock: Einnnnn, mandeeeeeee, me lo explica alguien. Eso tiene que ser así o hay algo que está mal hecho.

Porque, por ejemplo, se me ocurre pensar que el micro grabará todo lo que suene en la sala y claro, el pc hace ruido y estaba como a 1.5 m del micro. Además el canario que estaba en el patio no paraba de trinar, jejejeje y algo se escucha en la sala (obviamente se llama Pavaroti)
Este experimento es muy interesante porque nos da una perspectiva de la potencia del sistema de los sweeps. Como comentaba Luis García, hay muchas formas de producir y grabar un impulso para obtener la respuesta del sistema. Ahora bien, para hacerlo de modo directo, en condiciones de bajo ruido de fondo y con una capacidad de producir resultados repetibles se necesita un equipazo de medida. Ahora si que se necesitaría un sistema de adquisición de señal con una baja latencia (tiempo hardware de respuesta del periférico) alucinante.

Lo que has hecho, José Luis, es de forma cutrilla pero muy didáctica, tratar de medir la respuesta a impulso sin artificios matemáticos de por medio. De "forma natural". Y no sale bien porque el ruido de fondo te pulveriza la grabación.

Aquí es donde se comprueba que la técnica de los sweeps es alucinantemente "listilla". No hace falta reproducir la señal a todo volumen (aunque sea mejor que se emita de forma "limpia"). El ruido de fondo te lo "coloca" a la izquierda de la delta con una operación matemática simple. Al igual que las distorsiones. Aparecen medidas de la distorsión de una limpieza flipante para una guarri-tarjeta de sonido.
Es decir, un uso inteligente de propiedades matemáticas de sobras conocidas, pero poco utilizadas hasta ahora por la necesidad de alta capacidad de cálculo, nos permite tener un sistema guapete de medida con medios domésticos simples. En ámbitos técnicos de hardware de alta calidad debe ser alucinante.
Invitado
Mensajes: 492
Registrado: Mar 23 Nov 2004 , 13:07
Ubicación: De baja de éste foro.

Mensaje por Invitado »

Hola,

Muy bueno Jose Luis, sí señor, no pensé que nadie se animase.

Es probable lo que dice win, que hayas grabado el canal que no es y además saturado de cojones, por que las distorsiones que te aparecen tampoco son normales y la relación señal ruido es mala.

¿Que unidades tienes en el eje y?. Igual ese es todo el problema.

Míra, ésta medida de un altavoz Eminence Alpha6 en el jorno cónico de casa, medido a 100dB y a un metro. Las distorsiones de segundo y tercer armónico y el ruido no se ven si no se hace zoom (y mucho) sobre el eje y.

Imagen

Imagen

Un abrazo
Miguel mentero
Soundmuller

Mensaje por Soundmuller »

Hola:

A ver para qué me meto yo en estos berenjenales.


Bueno, la conexión usada es esta de la foto, que ya conoceréis algunos.

Imagen

Efectivamente, tenía el Audacity para que grabara un canal, pero yo creo que estaba correctamente, pues graba lo que recoge el micro. Me parece que si las conexiones son correctas para el Smaartlive son correctas para el Audacity.

He probado a poner que grabe en estéreo y grabo el sweet. Obviamente solo graba un canal, es decir, un canal con una linea plana y otro con la morcilla.

Si genero ahora el impulse con esa grabacion.... pues lo que sale es como el inverse.pcm en medio de la pista de 45 seg, pero no sale el típico impulse.

O sea, creo que como lo tenía estaba bien, pues aunque las gráficas fueran "raras" al menos eran. Si aclaráis estas cosas mejor.

Lo que más o menos quiero entender es que para grabar el impulse con el micro el sonido tiene que ser "fuertecito" ¿no?. Ayer desde luego estaba bajito, nada de 100 db como dice Mentero. Incluso le puse la capucha al micro porque tenía puesto el ventilador del aire acondicionado y no fuera a grabar la brisa de aire... que seguro grabó.

Si es así ya lo sé para cuando pueda subir otra vez el Pc al ático..... Me pondré el casco de guerra y me liaré a tiros en la sala :lol: :lol:

Por cierto, si se quiere emplear globos para grabar, como se configura para el audacity.... se le da a grabar y punto y mientras graba se explota el globo.

Para disminuir el sonido de fondo qué se hace, ajustar niveles en el previo o software o me llevo el pc a otro sitio y amordazo al canario :roll: .

Miguel, claro que me animo.... si este sistema evita que construya algunos aditamentos acústicos para mi sala nueva.... me interesa.


Edito: Miguel, qué unidades en qué eje Y. No entiendo lo que me preguntas. Veo las gráficas que he puesto y eso es todo lo que sale, no sé donde mirar para decirte qué unidades hay. Probé a poner el límite en vez de 120 dB en menos y ese ruido de fondo desaparecía, pero no sé si eso era correcto hacerlo o no.

Venga, gracias por vuestra ayuda.

José Luis
RR
Mensajes: 370
Registrado: Jue 25 Nov 2004 , 21:55

Mensaje por RR »

Jose Luis, me parece que Miguel se refiere a que en tus gráficas el impulso está en escala de decibelios. Lo habitual es verlos en escala lineal, quizá por eso la confusión (si es que la ha habido)

Salu2,

R
RR
Mensajes: 370
Registrado: Jue 25 Nov 2004 , 21:55

5. IFFT y Convolución

Mensaje por RR »

Ya estamos aquí otra vez. Hoy, magia digital. Nos sacaremos un filtro digital de la chistera y revelaremos el truco.

Ese truco se llama, ni más ni menos, convolución.

Pero antes, terminaremos con la FFT , y una propiedad muy interesante que posee: Es inversible.

Hemos visto que puedo pasar, gracias a la FFT, de una señal en el dominio tiempo, es decir, una serie de valores de presión sonora en nuestro micro, de los que tomamos muestras, a su representación en el dominio de frecuencia, es decir, sus componentes simples senoidales en ese intervalo, y su fase correspondiente (no olvidemos esto).

Pues existe la operación que nos permite ir en sentido contrario, llamada, lógicamente, Transformada inversa de Fourier, o, en la versión discreta y rápida que nos interesa, IFFT, o Inverse Fast Fourier Transform.

Gracias a ella podemos tomar unos valores de respuesta en frecuencia y fase que nos interesen, situarlos en la escala de frecuencia adecuada, como vimos en el cap. 4, y ¡sintetizar la respuesta impulso!.

Mmmm... no noto que compartáis mi emoción... Pensaréis, ¿para qué demonios quiero yo una respuesta impulso que me de una cierta respuesta en frecuencia?

Es que esa respuesta impulso "sintética" ya es, directamente, mi filtro digital. Así de sencillo. Un filtro digital FIR no es más que la IFFT de su respuesta en frecuencia compleja (magnitud y fase). Como véis, el mago digital tiene el truco definitivo, puede hacer filtros con cualquier respuesta en frecuencia y fase, y manipular fase y frecuencia por separado (imposible con filtros analógicos). Sólo hay que diseñar la función objetivo, que corrija las deficiencias de nuestro sistema, representarla en una escala lineal de frecuencia con 2^n elementos, y obtener su IFFT.

En la práctica hay otros flequillos que ya iremos viendo, que tienen que ver con atenuación de ruido fuera de la banda pasante del filtro (más allá de sus frecuencias de corte) y con criterios sicoacústicos (cómo se oirán las manipulaciones que hacemos en la señal, pues ciertas correcciones pueden ser peores que el defecto original).

He llamado a estos filtros "filtros digitales FIR". FIR quiere decir Finite Impulse Response, es decir, respuesta impulso finita, es decir, respuesta impulso con una duración acotada en el tiempo, y esa duración es justamente la longitud de la respuesta impulso que hemos sintetizado con la IFFT, y que depende del número de puntos de frecuencia del que hayamos partido. Como vimos an el cap. 4, si queremos corregir los graves necesitaremos filtros FIR bastante largos.

¿Y cómo utilizo ese filtro FIR, qué hago con mi respuesta impulso sintetizada para que me sea útil? Hacer su convolución con la señal que quiero filtrar. Veamos lo que es eso.

Convolución

Voy a explicar la convolución de un modo gráfico. Suponed que tengo una señal musical que quiero filtrar, la he pasado al disco duro desde un CD de música. Esa señal es "S", y tiene unos valores s(1), s(2), s(3), etc.

Por otro lado, tengo mi filtro digital, que es otra señal más corta, supongamos, como en el cap., 4 que tiene 16 valores (voy a hacer por tanto un filtro de agudos ;-) ). Esta señal es "F", con valores f(1), f(2),..., f(15), f(16).

Y el resultado de mi filtrado es "R", de nuevo con valores r(1), r(2), r(3), etc.

Bien, el proceso es, primero, dar la vuelta a mi filtro (el principio pasa a ser el final). Así que lo que era f(16) pasa a ser f(1).

Los sitúo alineados en la primera muestra. Multiplico los valores que quedan unos encima de otros (s(1)*f(1), s(2)*f(2), hasta s(16)*f(16)). Sumo todos los valores que he obtenido de las multiplicaciones, y pongo esa suma en la primera muestra de mi resultado "R": Ya tengo r(1).

Ahora corro a la derecha una muestra mi filtro invertido, y repito el proceso. Multiplico los valores que quedan alineados unos encima de otros, sumo los resultados, y obtengo r(2).

Y así sucesivamente.

Los matemáticos llaman a esto un "promedio móvil". A mí me resulta más fácil imaginar el filtro como un "peine" de valores que voy deslizando por la señal original, y a medida que lo deslizo, voy multiplicando las "púas" del peine por el valor al que apuntan. Sumo todo, y deslizo otra vez. ¿se ve? A ver si un dibujo lo deja claro.


Imagen

Imagen

Si podemos hacer estas manipulaciones en el tiempo para hacer cambios en el dominio de frecuencia, es gracias a este teorema, que hay que recitar como un mantra, porque sobre él se apoya todo lo que estamos viendo:

Multiplicación en el dominio de frecuencia equivale a convolución en el dominio del tiempo

A ver, cómo va ese recitado, tiene que sonar un rumor como de monasterio tibetano, todos repitiendo por lo bajini.

Vale, suficiente, gracias ;-) Multiplicar en el dominio de frecuencia es corregir en frecuencia. Si a la respuesta de nuestro sistema altavoz-sala le sobran 5 dB a 200 Hz., por ejemplo, querremos multiplicar por una respuesta que tenga -5 dB a 200 hz, y sea plana (es decir, valga 1) en el resto de la banda. Si pasamos los dB a presión sonora, tendremos que el valor +5dB es 1.778 veces el valor a 0dB. El valor -5dB es 1/1.778 veces el valor a 0dB. Es evidente que al multiplicar uno por otro, el resultado es 1, es decir, respuesta plana.

Espero que haya quedado clara la idea de que al corregir multiplicamos respuestas en frecuencia. Pues bien, si sacamos, con la IFFT, el impulso que se corresponde a la curva de corrección, y hacemos la convolución con nuestra señal musical, el resultado tendrá sus frecuencias corregidas de acuerdo a a dicha curva (¡en magnitud y fase!).

Magia digital, ¿o no?

En esta dirección podéis profundizar más: http://es.wikipedia.org/wiki/Convoluci%C3%B3n

Ciertos programas pueden hacer este proceso en tiempo real. Los encontraréis como "convolvers" (¿convolvedores?), motores de convolución, y cosas así. Por ejemplo, brutefir (en linux), el plugin "convolver" de foobar (foobar es un "player" para windows), y el programa "ambiovolver", del profesor José Javier López, que creo que tiene alguna relación con matrix-hifi (creo haberle visto en alguna foto de Molingordo). Cada cual con sus pros y contras. Los filtros que generemos con DRC los ejecutaremos en alguno de estos programas, los "convolucionaremos" con nuestra música, para conseguir lo que se persigue: Escucharla mejor.

En la próxima entrega, hablaremos por encima de los filtros IIR, y de la idea de corrección "minimum-phase". Si alguien sabe la traducción correcta, si es que la hay, que hable ahora. Y también cuál es el verbo en castellano que corresponde a "convolución". Y, por favor, me inquieta que no haya más preguntas, ¿tan bien me explico?... ;-)

Luis ya ha explicado algo de lo de hoy, pero ya lo tenía escrito a falta del dibujito, así que va tal cual.
Avatar de Usuario
luisggarcia
Mensajes: 802
Registrado: Vie 16 Jul 2004 , 9:28

Mensaje por luisggarcia »

Lo que pretendo es contar lo mismo que Roberto pero desde otro punto de vista a ver si entre lo práctico de Winton, lo teórico de Roberto y lo que me salga a mi se entera de algo el mayor número de personas.

Vamos a ver si nos enteramos de lo que es una convolución.

Reproducimos un pulso digital de valor 1 que en analógico con el filtro paso bajo del DAC será esta curva.

Imagen

Supongamos que si escuchamos el chasquido en unos auriculares es un chasquido perfecto, pero no en nuestra sala. Medimos la respuesta al impulso de altavoces y sala juntos que es:

Imagen

Supongamos que la escala en vez de 44100 muestras por segundo tenemos una muestra por segundo:

El pulso es en el segundo 3. Y la respuesta de este en la sala: 1 en el segundo 3, -0.5 en el segundo 4,0.5 en el 5, -0.2 en el 6, 0.2 en el 7 (me he equivocado pues en el dibujo es 0,3 pero no lo corrijo), -0.1 en el 8, 0.1 en el 9, resto 0.

Nos vamos a fabricar una máquina convolucionadora o filtro FIR.

Imagen

Guapa, ¿No? Es una máquina con casillas de memoria t+1 …. Donde nos vamos quedando con las muestras anteriores que pasan a cada segundo a la casilla siguiente.

Si metemos el pulso por esta máquina nos dará :
t + (-0.5*t-1) + (0.5*t-2) + (-0.2*t-3) + (0.2*t-4) + (-0.1*t-5) + (0.1*t-6) =1
En el segundo 3:
1 + (-0.5*0) + (0.5*0) + (-0.2*0) + (0.2*0) + (-0.1*0) + (0.1*0) =1
En el segundo 4:
0 + (-0.5*1) + (0.5*0) + (-0.2*0) + (0.2*0) + (-0.1*0) + (0.1*0) =-0.5
En el segundo 5:
0 + (-0.5*0) + (0.5*1) + (-0.2*0) + (0.2*0) + (-0.1*0) + (0.1*0) =0.5
etc…

Es decir al pasar por la maquinita tenemos la respuesta al impulso de la sala.
Con este invento podremos escuchar por los auriculares el pulso o chasquido que escucharíamos en nuestra sala.
Responder