homerecording

Il dithering

E-mail

Nel mondo dell'audio digitale, solitamente, quando si registra o si esegue un missaggio, si lavora a 24 (o 32) bit: utilizzare una risoluzione in bit maggiore dello standard CD (16 bit) aumenta infatti la fedeltà della registrazione e, in definitiva, la qualità audio.
Prima di addentrarci nel concetto di dithering, rivediamo dunque un paio di questioni di base... cosa sono frequenza di campionamento e risoluzione in bit?
La frequenza di campionamento descrive la qualità dell'audio in termini di rappresentazione nel tempo dello stesso: considerando che un kHz (kilohertz) equivale a 1000 campioni per secondo, se state registrando a 48 kHz, la vostra scheda audio sta creando 48000 campioni al secondo per digitalizzare l'audio: metaforicamente, potremmo dire che la scheda audio scatta 48000 fotografie al secondo per rappresentare i suoni che registra.
Ovviamente, più alta è la frequenza di campionamento, più saranno i campioni creati in un certo arco di tempo, più fedele sarà l'audio registrato.
Ogni campione è immagazzinato come una sequenza di bit, ovvero numeri binari uguali a 1 o a 0. La risoluzione in bit, è dunque la quantità di spazio digitale (memoria) che viene utilizzata per immagazzinare ogni singolo campione: anche qua, più bit vengono usati per descrivere un campione, più accurata è la sua rappresentazione digitale stessa.
Riassumendo, una frequenza di campionamento più elevata e una maggiore risoluzione in bit significano maggior qualità audio: in realtà, nella pratica, considerate che andare oltre i 48 (o al massimo 96) kHz e i 24 (o 32) bit ha poco senso.
Ovviamente, la qualità ha sempre un prezzo, e in questo caso il prezzo è la memoria: più qualità, più spazio occupato, più risorse richieste ecc... (il consiglio è di registrare e mixare a 48 kHz e 24 bit, che rappresenta un ottimo compromesso).
Quando arriverà però il momento di scrivere il vostro audio su un CD, dovrete necessariamente riportare i vostri lavori al formato del compact disc stesso: 44.1 kHz a 16 bit.
Probabilmente, qualcuno di voi si starà chiedendo che senso abbia allora registrare e mixare a frequenze di campionamento e risoluzioni più elevate se tanto poi si deve riportare tutto a una qualità inferiore al momento della masterizzazione su disco; senza addentrarsi in spiegazioni troppo tecniche, fidatevi: una registrazione a qualità migliore poi convertita a qualità CD suonerà meglio di una registrata direttamente a 44.1 kHz e 16 bit.
Detto ciò, la conversione è un processo delicato: il dithering entra in gioco quando si diminuisce la risoluzione in bit (ad esempio si passa da 24 a 16 bit).

Cosa è il dithering?

Se nel processo di conversione da una risoluzione in bit maggiore a una minore, si elimina semplicemente il numero di bit in eccesso (troncamento), oltre a perdere informazione, si introducono distorsione e artefatti indesiderati.
Gli algoritmi di dithering immettono invece una piccola quantità di rumore opportunamente distribuito al fine di ridurre al minimo possibile (fino a un livello quasi impercettibile) i fenomeni di distorsione.
Al prezzo di introdurre una certa quantità di rumore casuale distribuito, il dithering ci consente dunque di evitare fastidiosi effetti di distorsione: semplificando molto, possiamo dire che il dithering ci consente di barattare un rumore "cattivo" con un rumore meno sgradevole e più diffuso.

Fare dithering

Ovviamente, vi sono vari algoritmi di dithering, più o meno efficaci e più o meno adatti al tipo di materiale cui devono essere applicati; i software di editing audio, solitamente, permettono di scegliere il tipo di dithering da utilizzare in base al lavoro da compiere.
In generale, quando si applica il dithering si deve scegliere il tipo di rumore introdotto, descritto da una funzione specifica (di seguito le più diffuse):

- TPDF (Triangular Probability Density Function, ovvero Funzione triangolare di densità della probabilità) è una delle più utilizzate per il materiale audio

- RPDF (Rectangular Probability Density Function, Funzione rettangolare di densità della probabilità)

- Gaussian PDF (Gaussian Probability Density Function, Funzione Gaussiana di densità della probabilità)

Sebbene da un punto di vista statistico la RPDF risulti leggermente più efficente della TPDF, nella pratica quest'ultima è spesso la scelta migliore.
Oltre alla scelta della fonte di rumore, generalmente vi è la possibilità di applicare il cosidetto Noise Shaping, processo che sposta il rumore introdotto a diverse frequenze: ovviamente, obbiettvo ideale di ogni processo di dithering è spostare il rumore dove esso sia meno percepibile.