Misure acustiche nelle sale

 

Argomenti trattati :

 

 

Ipotesi sul campo acustico

Il campo acustico in un ambiente è un sistema lineare tempo invariante; supponiamo che stimolato dal segnale x(t) reagisca fornendo il segnale y(t). Questa relazione ingresso uscita è rappresentata da

 

y(t) = T[x(t)]  

 

Fig. 1 – Campo acustico in un ambiente.

 

Se ponendo singolarmente in ingresso A e B si ottengono rispettivamente le uscite C e D, la proprietà di linearità assicura che sollecitando il campo contemporaneamente con A e B si ha la somma C + D in uscita (secondo il ben noto principio di sovrapposizione degli effetti).

           

IN

OUT

A

B

C

D

A+B

C+D

 

Fig. 2 – Linearità del campo acustico.

 

Matematicamente un sistema è lineare se soddisfa la relazione:

 

T[a1x1(t) + a2x2(t)] = a1T[x1(t)] + a2T[x2(t)] = a1y1(t) + a2y2(t) " a1, a2, x1(t), x2(t)       

(1)

La proprietà di tempo invarianza garantisce che con un dato ingresso si ha la medesima uscita indipendentemente dall’istante di tempo t in cui avviene la sollecitazione, cioè la legge di trasformazione T del sistema rimane costante nel tempo

 

se         y(t) = T[x(t)]   allora T[x(t-t0)] = y(t-t0)

(2)

                       

Graficamente

 

 

Fig. 3 - Tempo invarianza del campo acustico.

 

Teoria della misura digitale

I dati entranti nel sistema (IN) possono rappresentarsi come un vettore di campioni (valori) xi di n bit ciascuno (nati dal campionamento della sorgente analogica); analoga rappresentazione si può dare dell’uscita.

Graficamente:

 

Fig. 4 - Dati digitalizzati.

Si osserva che la relazione tra i dati in ingresso e quelli in uscita è di tipo particolare; l’ambiente non risponde immediatamente alle solleciatzioni in ingresso né gli y tornano a zero quando si smette di fornire x non nulli. Tutto ciò è dovuto alla memoria del sistema; l’uscita non dipende solo dall’ingresso corrente ma anche da m campioni precedenti.

Nell’ambito dell’analisi digitale si può scrivere:

 

yn = xnh1 + xn-1h2 + xn-2h3 + … + xn-m-1hm

(3)

con xn campione corrente e xn-m-1 ultimo valore di cui il sistema ha memoria. L’operazione (3) rappresenta una operazione di convoluzione discreta e si indica

 

y = x Ä h

(4)

Gli elementi h sono caratteristici del sistema; questo vettore di lunghezza m è interpretabile come risultato del campionamento della risposta impulsiva del sistema h(t) ad una frequenza fc pari a quella usata per i dati in ingresso.

Per definizione

 

h(t) = T[d (t)]

(5)

con d (t) elemento neutro dell’operazione di convoluzione (4) denominato impulso unitario o delta di Dirac ; in ambito digitale d (t) è un vettore con valore massimo nella prima posizione seguito da tutti zeri:

 

 

Fig. 5 - d (t) in ambito digitale.

 

Dalla (5) risulta che la risposta all’impulso è l’uscita del sistema lineare tempo invariante quando è sollecitato dalla d (t)

 

infatti               y(t) = T[d (t)] = d (t) Ä h(t) = h(t)       (d (t) elemento neutro di Ä )

(6)

Si può pensare di misurare sperimentalmente i coefficienti hi immettendo nel sistema la d di Dirac, quindi compionando gli yi

 

y1 = 1*h1 + 0*h2 + 0*h3 + … + 0*hm = h1
y2 = 0*h1 + 1*h2 + 0*h3 + … + 0*hm = h2
y3 = 0*h1 + 0*h2 + 1*h3 + … + 0*hm = h3
.
.
ym = 0*h1 + 0*h2 + 0*h3 + … + 1*hm = hm

(7)

 

L’apparente semplicità della tecnica di misura si scontra con la difficoltà nel generare l’impulso unitario che deve essere brevissimo e di sufficiente potenza (60-80 db sopra il rumore di fondo).

Si usa in genere l’esplosione di una pistola caricata a salve che tuttavia genera un segnale lungo 20/40 campioni con più picchi. La situazione migliora se si applica al segnale così ottenuto un Time Reversal Mirror, tecnica che consiste nel convolvere il segnale con sè stesso ribaltato nella scala dei tempi. Se utilizzandolo si ottenesse correttamene una d viste le relazioni (7) e nota la commutatività dell’operazione Ä si potrebbe procedere nel calcolo dei termini hi con un generico segnale x in ingresso (esempio del rumore bianco); ottenuto x-1 (parte problematica di questo approccio)

 

x Ä h Ä x-1 = y Ä x-1 = h Ä d = h

(8)

 

           

Analisi in frequenza

           

            Utilizzando le trasformate di Fourier si può passare ad analizzare lo stesso problema nel dominio della frequenza ottenendo:

 

                         FFT

 

y = x Ä h
->
Y = X * H

(9)

Valutando il numero di operazioni necessarie nei due casi si osserva che nel dominio del tempo si eseguono m convoluzioni (m2 moltiplicazioni e m somme) mentre nel dominio delle frequenze sono sufficienti m moltiplicazioni (a vantaggio dei tempi di elaborazione).La funzione di trasferimento ingresso-uscita H (quindi i coefficienti h) è data da

           

                         IFFT  

 

H = Y / X

(10)

             

con H valore normalmente complesso.

Nel caso in cui una o più frequenze del segnale in ingresso X abbiano coefficienti nulli si ottengono dei picchi nella funzione H; per ovviare a questo problema si sceglie x con energia su tutte le frequenze e si mediano i risultati ottenuti su più tentativi nel tempo (circa cento). Queste ed altre operazioni (FFT, uso di rumore) sono consentite da programmi specifici come Smaart Pro distribuito con licenza commerciale dalla JBL.

 

 

 

Segnali MLS

Il segnale MLS (Maximum Length Sequence) è una sequenza binaria realizzata attraverso uno shift register (registro a scorrimento):

 

Fig.6 – Struttura a shift register per MLS con N = 4.

 

Il periodo di un segnale di questo tipo è pari alla lunghezza della sequenza L

 

L = 2N-1

(11)

con N numero di celle dello shift register; in acustica si usa N pari a 16 o superiore (17, 18) ottenendo 65535 o più campioni. Il periodo deve essere tale da permettere l’azzeramento del sistema per evitare l’insorgere di time-aliasing.

Per realizzare una buona sequenza è necessario porre una certa attenzione nella scelta dei valori iniziali con cui viene precaricato lo shift register, come del punto di prelievo per l’ingresso dell’XOR.

I vantaggi di un segnale MLS sono molteplici:

·        nota a priori la sequenza generata dal circuito (sono dati i valori iniziali e lo schema) è facilitato il calcolo del segnale inverso MLS-1 (eseguito mediante l’inversione di Hadamard)

·        essendo MLS binario le operazioni di convoluzione si riducono ad una serie di somme (veloci negli elaboratori) che possono essere realizzate in tempo reale

·        un segnale di questo tipo ha lo spettro piatto che permette una analisi in frequenza e non deve essere campionato perché generato direttamente dall’elaboratore.

L’invenzione di questa variante di analisi risale al 1975 ad opera del tedesco Alrutz; la sua notevole diffusione fu legata al successo di una scheda costruita dall’americano Douglas Rife nel 1989. Questa implementava via hardware il circuito di Fig.6, accelerando notevolmente i tempi di elaborazione, ed era distribuita assieme al potente software MLSSA (melissa) tuttora utilizzato.

La tecnica esposta non è esente da svantaggi, in particolare quando il sistema di analisi presenta non linearità si possono generare echi inesistenti e se non è perfettamente soddisfatta la tempo invarianza si può avere cancellazione alle alte frequenze (il solo riscaldamento degli autoparlanti provoca problemi di questo tipo).

 

 

Segnali sine sweep

 

            La tecnica usata correntemente è quella definita sweep. Il segnale è un seno che parte dalle basse frequenze per arrivare alle alte.

L’inverso dello sweep è lo stesso segnale invertito sull’asse dei tempi (secondo la tecnica Time Reversal Mirror); il suo utilizzo richiede però una convoluzione vera cioè maggiore potenza di calcolo, resasi disponibile solo negli ultimi due anni. Si ricorre all’analisi in frequenza dove l’operazione di convoluzione è eseguita attraverso l’algoritmo di Overlap And Save (permette di lavorare su un numero di campioni dell’ordine di centinaia di migliaia!)

 

 

Definizione di parametri acustici

 

            I seguenti parametri acustici, tutti definiti dalla norma ISO 3382/97, vengono utilizzati per determinare la qualità del campo sonoro (risultano molto utili in ambito musicale).

Viene misurato il suono riverberato integrato con parte dell’onda diretta (suono utile) quindi confrontato con la parte seguente nel tempo (più propriamente riverbero) che sporca la risposta; si ottiene in questo modo l’indice di chiarezza, nelle versioni C50 e C80. Le cifre che seguono la C sono legate all’ampiezza della finestra temporale assegnata al suono utile, rispettivamente 50 e 80 millisecondi.

Per definizione

 

(12)

 

dove p è la pressione e il suo quadrato è impropriamente l’energia.

C50 è espresso in db come suggerito dalla presenza di 10log nella formula e la sua escursione ottimale è tra –1 e 1 db; valori inferiori implicano troppo riverbero, superiori un suono eccessivamente secco.

Analogamente

 

(13)

 

è l’indice di chiarezza con finestra utile di 80 ms; l’esistenza dei due parametri simili è giustificata dal differente utilizzo: il primo è destinato all’analisi delle sale per parlato, il secondo, che a parità di valori permette un suono più ‘impastato’, è più adatto alla valutazione di sale per l’ascolto musicale.

 

(14)

 

D50 è del tutto analogo al parametro C50, la scelta dell’uno o dell’altro è pertinente alle preferenze del tecnico incaricato delle analisi.

Il seguente parametro, denominato tempo di baricentro ts, prevede una escursione di 30 ¸ 80 ms per la voce, e di 50 ¸ 120 ms per la musica.

 

(15)

Notevole importanza riveste anche l’aspetto spaziale del suono (nelle sale di ascolto musicale il pubblico è avvolto dal campo sonoro) descritto dai parametri Lf lateral fraction e Le lateral efficiency; entrambi sono espressi in percentuale. Le misurazioni in questo caso (misurazioni del surround) vengono effettuate usando un tipo particolare di microfono dotato di due capsule coincidenti, una omnidirezionale ed una a figura di otto;

 

 

 

Fig. 7 – Andamenti caratteristici di microfoni sferici e ad otto.

questi microfoni sono dotati di due uscite chiamate omni e figura di otto, rispettivamente p0 e p8.

Seguono le definizioni di Lf e di Le:

 

(16)

 

 

(17)

 

Termina l’elenco dei parametri lo IACC, inter aural cross correlation, pertinente alle metodiche di misurazioni giapponesi; in questo caso si usano microfoni binaurali da indossare sul capo in modo che i due microfoni stereo siano posti in corrispondenza delle orecchie. Si ottiene l’andamento del campo acustico di un ambiente convolvendo la sua risposta con una registrazione anecoica, cioè priva di riverbero.

 

 

 

Appendice A: campionamento dei segnali

 

            Fissato n, numero di bit per campione, si divide l’escursione della tensione da elaborare (segnale analogico) in 2n intervalli elementari, se ne calcolano i valori medi e si associano alle combinazioni disponibili (evidentemente 2n) degli n bit.

La fase successiva, il campionamento vero e proprio, prevede la misura ad intervalli regolari (intervalli di campionamento) spaziati temporalmente D t , periodo di campionamento, del segnale analogico; i campioni così ottenuti sono quantizzati ai valori medi degli intervalli elementari in cui cadono, quindi trasformati nei numeri binari associati.

            Parametri principali che determinano la qualità del campionamento sono n numero di bit usati (8 o 16 bit), e fc , frequenza di campionamento (= 1/D t ), inverso del periodo di campionamento; valori tipici di fc sono 11, 22 (musicassette), 44 (CD audio), 48khz (DAT), dove numero più alto indica una maggiore fedeltà del suono digitalizzato all’originale.

 

Fig. 8 – Esempio di campionamento a 2 bit.