Acustica psicofisica
Lessere umano dispone di un sistema uditivo che gli permette di sentire gli stimoli sonori. Tale sistema se confrontato con tutti gli altri sistemi di percezione sonora inventati dalluomo si rivela sempre di gran lunga il migliore, pur restando molto soggettivo, variando da individuo ad individuo, e presentando delle limitazioni nelle ampiezze e nelle frequenze percepibili. Esso inoltre è dotato, a differenza degli altri sistemi, di una risposta proporzionale non allo stimolo ma al suo logaritmo.
I sistema uditivo umano rappresentato in figura 1 è costituito da tre blocchi principali: lorecchio esterno, lorecchio medio e lorecchio interno.
Figura 1. Sezione dellorecchio.
E: orecchio esterno; M: orecchio medio; I: orecchio interno.
Lorecchio esterno è costituito dal padiglione auricolare, dal condotto uditivo e dal timpano. Il padiglione auricolare è la parte più esterna del sistema: il suo compito è quello di raccogliere i suoni provenienti dallambiente e, tramite la sua forma particolare, di convogliarli allinterno del condotto uditivo. Questo a sua volta, dopo aver amplificato il segnale di anche 12 dB tramite risonanza grazie alla propria forma a tromba, indirizza lo stimolo sonoro verso il timpano.
Il timpano, al termine del condotto uditivo, è una membrana impermeabile sia allacqua che allaria che separa lambiente dellorecchio esterno da quello dellorecchio medio e che viene posta in vibrazione dallonda sonora di pressione che il resto del sistema ha convogliato, amplificato e messo in risonanza verso esso. Così, sotto lo stimolo il timpano vibra e a sua volta trasmette la vibrazione ad una serie di ossicini posti nellorecchio medio con cui è in contatto. Poiché il timpano deve separare due zone entrambe piene daria, lorecchio esterno e quello medio, per minimizzare lenergia del segnale dispersa nella trasmissione, esso ha unimpedenza acustica molto simile a quella dellaria.
Lorecchio medio è costituito da un cavità piena daria, in comunicazione diretta con lesterno tramite un condotto detto tuba di Eustachio, in cui sono posti tre ossicini chiamati martello, incudine e staffa. In contatto con il timpano e con la parte più interna dellorecchio il loro compito è quello di trasportare il segnale dal timpano allorecchio interno. Poiché però le cavità dellorecchio medio ed esterno sono riempite daria mentre quelle dellorecchio interno sono riempite di un fluido detto endolinfa con densità molto maggiore, per evitare una dispersione dellenergia del segnale è necessario adattarlo perché esso possa essere percepibile dallorecchio interno. Per questo gli ossicini fungono da leve in serie che trasformano i grandi spostamenti con piccole forze del timpano in piccoli spostamenti con grandi forze sullorecchio interno. In tal modo essi hanno la funzione di amplificatori passivi, amplificando il segnale fino a 10 dB ma riducendone lo spostamento. Sono perciò degli adattatori di impedenza.
Figura 2. Ossicini e sezione della coclea
Lorecchio interno è costituito dalla coclea, dai canali semicircolari e dal nervo acustico. I canali semicircolari in realtà non servono alludito ma sono la sede del senso dellequilibrio. La coclea ( fig.2 e fig. 3) invece è costituita da due condotti paralleli, il canale vestibolare e il canale timpanico, separati da una parete chiamata membrana basale. I due condotti sono riempiti di endolinfa e sono in comunicazione tra loro tramite unapertura alla fine della membrana basale. La coclea riceve il segnale dalla staffa tramite la finestra ovale, una membrana che separa lorecchio medio da quello interno, e che lo trasmette allendolinfa nel canale vestibolare. Le variazioni di pressione del fluido nei due canali vengono quindi percepite dalle cellule cigliate presenti sulla membrana basale che trasmettono linformazione al nervo acustico. La membrana basale funge da filtro molto selettivo per quanto riguarda le frequenze percepibili: essendo più tesa e fine vicino alla finestra ovale da cui entra il segnale e via via più spessa e lasca allontanandosene ha una risposta differente al variare delle frequenze. Per la sua conformazione essa permette di percepire prima le componenti del suono ad alta frequenza e solo più tardi quelle a bassa frequenza. Tutte le informazioni estratte dal segnale dalle cellule cigliate vengono allora elaborate da una rete neurale che ritrasmette al cervello come il suono è distribuito alle varie frequenze. A causa però della limitatezza del canale di trasmissione se sono presenti troppe informazioni i suoni meno intensi con frequenze nelle vicinanze di altri suoni con intensità molto maggiori vengono trascurati e non percepiti: si ha perciò il fenomeno detto del mascheramento.
Figura 3. Sezione della coclea e percorso del segnale
Analizzando la risposta dellorecchio alle diverse frequenze e pressioni, pur essendo questa molto soggettiva, è possibile in linea generale ricavare un grafico detto diagramma di sensazione che mostra quali suoni alle varie frequenze e intensità possono essere percepiti dal sistema uditivo umano. Tale gamma di suoni può essere racchiusa tra due limiti detti soglia delludibilità e soglia del dolore: la soglia delludibilità rappresenta il limite inferiore di intensità che può essere percepito, la soglia del dolore rappresenta il limite superiore di intensità che non provoca dolore.
Fletcher e Munson, due studiosi che analizzarono la risposta dellorecchio umano, riuscirono a descrivere questo grafico con luso delle curve isofoniche. Essi utilizzando un suono di riferimento a 1000 Hz effettuarono dei test soggettivi variando lintensità del suono alle varie frequenze per verificare quale produceva unuguale sensazione sonora. In tal modo ricavarono delle curve isofoniche, rappresentate nel diagramma di Fletcher e Munson (fig. 4), che rappresentavano come variava la sensazione sonora allinterno del campo delludibile. La più alta di tali curve corrisponde alla soglia del dolore, la più bassa alla soglia delludibilità.
Figura 4. Audiogramma di Fletcher e Munson.
f: frequenza in hertz; L: livello di sensazione sonora; D: soglia del dolore; U: soglia delludibilità; I: intensità in watt/cm¹ dellonda sonora piana; P: pressione in dine/cm¹.
Osservando tali curve è possibile notare che per unuguale sensazione più bassa (o alta) è la frequenza maggiore (o minore) deve essere lintensità dello stimolo: si è perciò scoperto che ludito umano non ha risposta lineare. La sensazione a una frequenza campione di 1000 Hz si raddoppia se lintensità cresce di un fattore di circa per volta. Si è pensato perciò di utilizzare una scala logaritmica invece che lineare per rappresentare tali grafici. Un esempio può essere:
Pressione in Pa |
Livello di Sensazione |
0,01 |
1 |
0,0316 |
2 |
0,1 |
3 |
0,316 |
4 |
1 |
5 |
Per misurare la sensazione sonora si utilizza la scala di Bell (1847-1922 scienziato che inventò la centralina di commutazione, studiò a fondo il fenomeno della sensazione sonora e fondò la AT&T). Nella sua scala il valore del livello della sensazione è dato dalla formula:
(1)
dove P è la pressione sonora, e è la pressione sonora soglia a 1000 Hz, cioè la pressione del più piccolo suono udibile a 1000 Hz. Lunità di misura del livello sonoro è il bell (B).
I valori ottenuti con la formula empirica (1) corrispondono bene a quelli trovati sperimentalmente. Poiché però lunità è troppo grande si preferiscono usare i suoi sottomultipli come 1 B = 10 dB (decibell) e quindi la seguente formula misurata in dB:
(2)
E da notare che i valori dei livelli sonori ottenuti con le formule (1) e (2) sono tutti positivi; infatti lo 0 corrisponde al livello minimo udibile.
Come valore di pressione per il calcolo in queste formule non si usano i valori massimi ma i valori medi efficaci (RMS) anche per la facilità di misura degli stessi. Il tempo minimo per la misura di tali valori di pressione deve perciò essere di 125ms.
Poiché la risposta dellorecchio umano allo stimolo sonoro è logaritmica in ampiezza e varia al variare della frequenza si è deciso di uniformare gli standard di misura approssimando la risposta dellorecchio umano con un filtro di compensazione che tenga conto delle differenze tra le varie frequenze. A questo proposito sono stati creati i seguenti filtri:
Figura 5. Filtri di ponderazione
Nella pratica i filtri maggiormente utilizzati sono quello A e quello C e le loro risposte sono misurate rispettivamente in dB(A) e in dB(C). Mentre il filtro A è utilizzato a valle del microfono per misurare i valori efficaci medi e stimare la risposta effettiva dellorecchio, il filtro C è principalmente utilizzato per misurare i massimi di picco di suoni impulsivi, forti e molto brevi, tipo quelli di esplosioni.
Il limite stabilito per legge per luomo da un normativa CEE di valore massimo di picco è LP,MAX,PEAK = 130 dB(C), ovvero 130 dB misurati con il filtro C. In Italia invece la vecchia normativa prevede LP,MAX,PEAK = 140 dB(LIN), ovvero 140 dB misurati su scala lineare: tale valore è più tollerante nei confronti delle alte frequenze ed ha linconveniente di segnare massimi a causa della non ponderazione dellintensità di eventi anche non acustici a bassa frequenza.
Effetti del rumore sulluomo
Se il sistema uditivo umano rimane esposto a rumori molto intensi può essere soggetto ad una perdita della capacità uditiva, così come a danni legati allequilibrio (nausea, vomito, labirintite, perdita dellequilibrio, ecc). Ciò può accadere se il soggetto subisce livelli sonori molto alti anche per brevi periodi: in tal caso subito e fino ad una mezzora dopo si possono avvertire dei fenomeni di tal tipo seppur temporanei. Nel caso invece di esposizione a livelli medio alti per tempi prolungati possono insorgere problemi permanenti alludito. Per verificare tali eventualità si monitorizza la capacità uditiva del soggetto sottoponendolo a un test acustico con suoni di livello via via crescente per stabilire il minimo livello sonoro udibile.
Un individuo senza danni uditivi dovrebbe presentare un tracciato della perdita in dB delle frequenze percepite per le due orecchie di questo tipo:
Figura.6. Perdita media per orecchio
Nel caso invece di un individuo con danni uditivi medi si riscontrano spesso tracciati di questo tipo:
Figura 7. Perdite per danni
In questi casi si può notare che lindividuo tende a non percepire più distintamente le alte frequenze nellintorno dei 4000 Hz, questo perché lorecchio umano è molto sensibile in quellintervallo. A causa del fatto che la maggior parte delle consonati del parlato viene espressa con suoni contenenti quelle frequenze diventa sempre più difficile capire il parlato, pur cogliendo con nitidezza le vocali. Questo è un problema molto diffuso tanto che in Italia due milioni e mezzo di persone ne soffrono, circa il 5% della popolazione nazionale. A scopo di curare tale problema si utilizzano delle protesi acustiche con lo scopo di enfatizzare le parti in frequenze danneggiate: le protesi devono presentare un indice di guadagno variabile con la frequenza, che si adatti alle variazioni dello stimolo e che ricostruisca lesatto guadagno nelle varie frequenze di un orecchio sano.
Figura 8. Guadagno della protesi
Somma di livelli sonori
La somma di due o più livelli sonori può essere coerente o incoerente.
La somma si dice coerente se entrambi gli stimoli sono identici e in fase. Questo è il caso riportato in figura 9.
Figura 9. Sorgenti coerenti
In questa situazione, se i due livelli sonori sono L1=L2 ed i segnali hanno entrambi la stessa pressione istantanea P1=P2 poiché sono lo stesso identico segnale inviato contemporaneamente da due sorgenti equidistanti dal bersaglio, la pressione totale risulta la somma delle pressioni e il livello totale è facilmente ricavabile:
(3)
Nel caso L1 = 70 dB allora
LTOT = L1 + L2 = 70 dB + 70 dB = 6 dB + 70 dB = 76 dB.
Questa situazione è estremamente anomala perché è praticamente impossibile trovare due sorgenti di segnale coerenti.
La somma si dice incoerente se i due stimoli differiscono per fase e/o intensità. Questo è il caso riportato in figura 10.
Figura 10. Sorgenti incoerenti
Questo può essere il caso di due casse acustiche collegate ad uno stereo: i due segnali sono diversi perché hanno fase casuale a causa delle riflessioni nellambiente. Ci possono allora essere momenti in cui due picchi di pressione si sommano enfatizzandosi e altri in cui un picco ed una valle si sommano eliminandosi. In tal caso per il principio di conservazione dellenergia lintensità sonora è data dalla somma delle due intensità dei segnali reali, la densità di energia sonora à data dalla somma delle due densità mentre per la pressione non vale tale uguaglianza. La pressione al quadrato risulta proporzionale alla densità di energia e vale la formula:
(4)
e quindi il livello sonoro totale diventa:
(5)
Come nel caso precedente
(6)
e perciò se L1 = L 2= 70 dB allora
LTOT = L1 + L2 = 70 dB + 70 dB = 3 dB + 70 dB = 73 dB
Dalla formula (5), al variare della differenza tra i due livelli sonori si può ricavare il seguente grafico che stabilisce quale valore va aggiunto al livello sonoro maggiore per la somma di due livelli sonori:
Figura 11. Grafico incrementi per somma incoerente
Questa curva stabilisce che se i due livelli sonori da somma differiscono di più di 15 dB il livello sonoro superiore sovrasta laltro e ne rende trascurabile il contributo. Il suono con livello inferiore rimane udibile ma un fonometro non sarebbe in grado di stabilire se il suo contributo sia presente nel suono totale.
Se per esempio i due livelli sonori fossero di 70 dB e di 65 dB la loro somma incoerente sarebbe:
Se invece si hanno più di due livelli sonori di cui viene fornito lo spettro si può calcolarne il livello totale. Infatti dalla formula (2) si può ricavare:
(7)
che sostituito nella (5) da:
(8)
Figura 12. Spettro in bande dottava dei livelli sonori di un segnale
Con i dati dello spettro in figura 12 si ricava:
Questo però è il valore calcolato con la scala lineare. Nel caso si desideri il valore preciso nella scala A bisogna modificare banda dottava per banda dottava i valori dei livelli con quelli del filtro A.
Frequenza di centrobanda f (Hz) |
Livello sonoro lineare L (dB) |
Correzione di tipo A AW (dB) |
Livello sonoro ponderato LW (dB(A)) |
63 |
70 |
-26,2 |
43,8 |
125 |
80 |
-16,1 |
63,9 |
250 |
76 |
-8,6 |
67,4 |
500 |
68 |
-3,2 |
64,8 |
1000 |
63 |
0 |
63 |
2000 |
78 |
+1,2 |
79,2 |
In questo modo, applicando la ponderazione alle bande dottava, si ottengono i livelli sonori ponderati in dB(A). Il livello sonoro totale equivalente ponderato con il filtro A è allora: