Rapporto segnale-rumore di picco - Peak signal-to-noise ratio

Rapporto segnale-rumore di picco ( PSNR ) è un termine tecnico per il rapporto tra la massima potenza possibile di un segnale e la potenza del rumore corruttore che influisce sulla fedeltà della sua rappresentazione. Poiché molti segnali hanno una gamma dinamica molto ampia , il PSNR è solitamente espresso come quantità logaritmica utilizzando la scala dei decibel .

PSNR è comunemente usato per quantificare la qualità della ricostruzione per immagini e video soggetti a compressione con perdita di dati .

Definizione

PSNR è più facilmente definito tramite l' errore quadratico medio ( MSE ). Data un'immagine monocromatica m × n priva di rumore I e la sua approssimazione rumorosa K , MSE è definito come:

Il PSNR (in dB ) è definito come:

Qui, MAX I è il valore pixel massimo possibile dell'immagine. Quando i pixel sono rappresentati utilizzando 8 bit per campione, questo è 255. Più in generale, quando i campioni sono rappresentati utilizzando PCM lineare con B bit per campione, MAX I è 2 B -1.

Applicazione in immagini a colori

Per le immagini a colori con tre valori RGB per pixel, la definizione di PSNR è la stessa eccetto che MSE è la somma di tutte le differenze di valori quadrati (ora per ciascun colore, ovvero tre volte le differenze rispetto a un'immagine monocromatica) divisa per la dimensione dell'immagine e per tre. In alternativa, per le immagini a colori, l'immagine viene convertita in uno spazio colore diverso e il PSNR viene riportato su ciascun canale di quello spazio colore, ad esempio YCbCr o HSL .

Stima della qualità con PSNR

PSNR è più comunemente usato per misurare la qualità della ricostruzione dei codec di compressione con perdita (ad esempio, per la compressione delle immagini ). Il segnale in questo caso sono i dati originali e il rumore è l'errore introdotto dalla compressione. Quando si confrontano i codec di compressione, PSNR è un'approssimazione della percezione umana della qualità della ricostruzione.

I valori tipici per il PSNR nell'immagine con perdita e nella compressione video sono compresi tra 30 e 50 dB, a condizione che la profondità di bit sia di 8  bit , dove più alto è meglio. La qualità di elaborazione delle immagini a 12 bit è considerata elevata quando il valore PSNR è 60 dB o superiore. Per i dati a 16 bit i valori tipici per il PSNR sono compresi tra 60 e 80 dB. I valori accettabili per la perdita di qualità della trasmissione wireless sono considerati compresi tra circa 20 dB e 25 dB.

In assenza di rumore, le due immagini I e K sono identiche e quindi l'MSE è zero. In questo caso il PSNR è infinito (o indefinito, vedi Divisione per zero ).

Immagine originale non compressa
Q=90, PSNR 45,53dB
Q=30, PSNR 36,81dB
Q=10, PSNR 31,45dB
Esempio di valori luma PSNR per un'immagine compressa cjpeg a vari livelli di qualità.

Confronto delle prestazioni

Sebbene un PSNR più elevato indichi generalmente che la ricostruzione è di qualità superiore, in alcuni casi potrebbe non esserlo. Bisogna essere estremamente attenti con l'intervallo di validità di questa metrica; è valido solo in modo definitivo quando viene utilizzato per confrontare i risultati dello stesso codec (o tipo di codec) e dello stesso contenuto.

In generale, è stato dimostrato che PSNR ha prestazioni scadenti rispetto ad altre metriche di qualità quando si tratta di stimare la qualità delle immagini e in particolare dei video percepiti dagli umani.

varianti

PSNR-HVS è un'estensione di PSNR che incorpora proprietà del sistema visivo umano come la percezione del contrasto .

PSNR-HVS-M migliora su PSNR-HVS tenendo conto anche del mascheramento visivo . In uno studio del 2007, ha fornito migliori approssimazioni dei giudizi sulla qualità visiva umana rispetto a PSNR e SSIM con ampio margine. È stato anche dimostrato di avere un netto vantaggio rispetto a DCTune e PSNR-HVS.

Guarda anche

Riferimenti