sintesi additiva - Additive synthesis

Un suono simile a una campana generato dalla sintesi additiva di 21 parziali inarmonici

Problemi durante la riproduzione di questo file? Vedere l'aiuto multimediale .

La sintesi additiva è una tecnica di sintesi del suono che crea il timbro sommando onde sinusoidali .

Il timbro degli strumenti musicali può essere considerato alla luce della teoria di Fourier come costituito da più parziali o armoniche armoniche o disarmoniche . Ogni parziale è un'onda sinusoidale di diversa frequenza e ampiezza che si gonfia e decade nel tempo a causa della modulazione da un inviluppo ADSR o da un oscillatore a bassa frequenza .

La sintesi additiva genera più direttamente il suono aggiungendo l'uscita di più generatori di onde sinusoidali. Implementazioni alternative possono utilizzare wavetable precalcolate o la trasformata di Fourier veloce inversa .

Spiegazione

I suoni che si sentono nella vita di tutti i giorni non sono caratterizzati da un'unica frequenza . Invece, sono costituiti da una somma di frequenze sinusoidali pure, ognuna con un'ampiezza diversa . Quando gli umani sentono queste frequenze contemporaneamente, possiamo riconoscere il suono. Questo vale sia per i suoni "non musicali" (es. spruzzi d'acqua, fruscio di foglie, ecc.) sia per i "suoni musicali" (es. una nota di pianoforte, il cinguettio di un uccellino, ecc.). Questo insieme di parametri (frequenze, loro relative ampiezze e come le relative ampiezze cambiano nel tempo) sono incapsulati dal timbro del suono. L'analisi di Fourier è la tecnica che viene utilizzata per determinare questi esatti parametri timbrici da un segnale sonoro complessivo; viceversa, l'insieme risultante di frequenze e ampiezze è chiamato la serie di Fourier del segnale sonoro originale.

Nel caso di una nota musicale, la frequenza più bassa del suo timbro è designata come frequenza fondamentale del suono . Per semplicità, spesso diciamo che la nota sta suonando a quella frequenza fondamentale (es. " Do centrale è 261,6 Hz"), anche se il suono di quella nota è composto anche da molte altre frequenze. L'insieme delle frequenze rimanenti è detto armoniche (o armoniche , se le loro frequenze sono multipli interi della frequenza fondamentale) del suono. In altre parole, la sola frequenza fondamentale è responsabile dell'altezza della nota, mentre gli armonici definiscono il timbro del suono. Gli armonici di un pianoforte che suona il Do centrale saranno molto diversi dagli armonici di un violino che suona la stessa nota; è questo che ci permette di differenziare i suoni dei due strumenti. Ci sono anche sottili differenze di timbro tra le diverse versioni dello stesso strumento (ad esempio, un pianoforte verticale rispetto a un pianoforte a coda ).

La sintesi additiva mira a sfruttare questa proprietà del suono per costruire il timbro da zero. Sommando frequenze pure ( onde sinusoidali ) di frequenze e ampiezze variabili, possiamo definire con precisione il timbro del suono che vogliamo creare.

Definizioni

Schema schematico della sintesi additiva. Gli ingressi agli oscillatori sono frequenze e ampiezze .

f_{k}

r_{k}

La sintesi armonica additiva è strettamente correlata al concetto di serie di Fourier che è un modo di esprimere una funzione periodica come somma di funzioni sinusoidali con frequenze pari a multipli interi di una frequenza fondamentale comune . Queste sinusoidi sono chiamate armoniche , armoniche o, generalmente, parziali . In generale, una serie di Fourier contiene un numero infinito di componenti sinusoidali, senza limite superiore alla frequenza delle funzioni sinusoidali e comprende una componente continua (una con frequenza di 0 Hz ). Le frequenze al di fuori della gamma udibile umana possono essere omesse nella sintesi additiva. Di conseguenza, solo un numero finito di termini sinusoidali con frequenze che si trovano all'interno della gamma udibile viene modellato in sintesi additiva.

Una forma d'onda o una funzione si dice periodica se

y(t)=y(t+P)

per tutti e per un certo periodo . ${\displaystyle}$ $P$

La serie di Fourier di una funzione periodica è espressa matematicamente come:

{\begin{aligned}y(t)&={\frac {a_{0}}{2}}+\sum _{k=1}^{\infty }\left[a_{k}\ cos(2\pi kf_{0}t)-b_{k}\sin(2\pi kf_{0}t)\right]\\&={\frac {a_{0}}{2}}+\ sum _{k=1}^{\infty }r_{k}\cos \left(2\pi kf_{0}t+\phi _{k}\right)\\\end{allineato}}

dove

$f_{0}=1/P$ è la frequenza fondamentale della forma d'onda ed è uguale al reciproco del periodo,
$a_{k}=r_{k}\cos(\phi _{k})=2f_{0}\int _{0}^{P}y(t)\cos(2\pi kf_{0 }t)\,dt,\quad k\geq 0$
$b_{k}=r_{k}\sin(\phi _{k})=-2f_{0}\int _{0}^{P}y(t)\sin(2\pi kf_{ 0}t)\,dt,\quad k\geq 1$
$r_{k}={\sqrt {a_{k}^{2}+b_{k}^{2}}}$ è l' ampiezza della th armonica, $k$
$\phi _{k}=\nomeoperatore {atan2} (b_{k},a_{k})$ è lo sfasamento della th armonica. atan2 è la funzione arcotangente a quattro quadranti , $k$

Essendo impercettibile, la componente DC , , e tutte le componenti con frequenze superiori ad un certo limite finito, , sono omesse nelle seguenti espressioni di sintesi additiva. $a_{0}/2$ $Kf_{0}$

Forma armonica

La sintesi armonica additiva più semplice può essere espressa matematicamente come:

y(t)=\sum _{k=1}^{K}r_{k}\cos \left(2\pi kf_{0}t+\phi _{k}\right),

( 1 )

dove è l'uscita della sintesi, , , e sono rispettivamente l'ampiezza, la frequenza e lo sfasamento della esima parziale armonica di un totale di parziali armoniche, ed è la frequenza fondamentale della forma d'onda e la frequenza della nota musicale . $y(t)$ $r_{k}$ $kf_{0}$ $\phi _{k}$ $k$ $K$ $f_{0}$

Ampiezze dipendenti dal tempo

	Esempio di sintesi armonica additiva in cui ogni armonica ha un'ampiezza dipendente dal tempo. La frequenza fondamentale è 440 Hz. Problemi ad ascoltare questo file? Vedi Aiuto per i media

Più in generale, l'ampiezza di ciascuna armonica può essere prescritta in funzione del tempo , nel qual caso l'uscita della sintesi è $r_{k}(t)$

y(t)=\sum _{k=1}^{K}r_{k}(t)\cos \left(2\pi kf_{0}t+\phi _{k}\right)

.

( 2 )

Ogni inviluppo dovrebbe variare lentamente rispetto alla spaziatura di frequenza tra sinusoidi adiacenti. La larghezza di banda di dovrebbe essere significativamente inferiore a . $r_{k}(t)\,$ $r_{k}(t)$ $f_{0}$

Forma disarmonica

La sintesi additiva può anche produrre suoni disarmonici (che sono forme d'onda aperiodiche ) in cui i singoli armonici non devono avere frequenze che sono multipli interi di una frequenza fondamentale comune. Mentre molti strumenti musicali convenzionali hanno parziali armonici (es. un oboe ), alcuni hanno parziali inarmonici (es. campane ). La sintesi additiva inarmonica può essere descritta come

y(t)=\sum _{k=1}^{K}r_{k}(t)\cos \left(2\pi f_{k}t+\phi _{k}\right),

dove è la frequenza costante del parziale. $f_{k}$ $k$

	Esempio di sintesi additiva inarmonica in cui sia l'ampiezza che la frequenza di ciascun parziale sono dipendenti dal tempo. Problemi ad ascoltare questo file? Vedi Aiuto per i media

Frequenze dipendenti dal tempo

Nel caso generale, la frequenza istantanea di una sinusoide è la derivata (rispetto al tempo) dell'argomento della funzione seno o coseno. Se questa frequenza è rappresentata in hertz , piuttosto che in forma di frequenza angolare , allora questa derivata è divisa per . Questo è il caso sia che il parziale sia armonico o disarmonico e che la sua frequenza sia costante o variabile nel tempo. $2\pi$

Nella forma più generale, la frequenza di ciascun parziale non armonico è una funzione non negativa del tempo, , cedendo $f_{k}(t)$

y(t)=\sum _{k=1}^{K}r_{k}(t)\cos \left(2\pi \int _{0}^{t}f_{k}( u)\ du+\phi _{k}\right).

( 3 )

Definizioni più ampie

La sintesi additiva più in generale può significare tecniche di sintesi del suono che sommano elementi semplici per creare timbri più complessi, anche quando gli elementi non sono onde sinusoidali. Ad esempio, F. Richard Moore ha elencato la sintesi additiva come una delle "quattro categorie di base" della sintesi del suono insieme alla sintesi sottrattiva , alla sintesi non lineare e alla modellazione fisica . In questo senso ampio, gli organi a canne , che hanno anche canne che producono forme d'onda non sinusoidali, possono essere considerati come una forma variante di sintetizzatori additivi. Anche la sommatoria dei componenti principali e le funzioni di Walsh sono state classificate come sintesi additiva.

Metodi di attuazione

Le implementazioni moderne della sintesi additiva sono principalmente digitali. (Vedi sezione Equazioni a tempo discreto per la teoria del tempo discreto sottostante)

Sintesi banco oscillatore

La sintesi additiva può essere implementata utilizzando un banco di oscillatori sinusoidali, uno per ogni parziale.

Sintesi Wavetable

Nel caso di toni musicali armonici, quasi periodici, la sintesi wavetable può essere generale quanto la sintesi additiva variabile nel tempo, ma richiede meno calcolo durante la sintesi. Di conseguenza, un'implementazione efficiente della sintesi additiva variabile nel tempo di toni armonici può essere ottenuta mediante l'uso della sintesi wavetable .

Sintesi additiva di gruppo

La sintesi additiva di gruppo è un metodo per raggruppare le parziali in gruppi armonici (con frequenze fondamentali diverse) e sintetizzare ciascun gruppo separatamente con la sintesi wavetable prima di mescolare i risultati.

Sintesi FFT inversa

Una trasformata di Fourier veloce inversa può essere utilizzata per sintetizzare in modo efficiente le frequenze che dividono uniformemente il periodo di trasformazione o "frame". Da un'attenta considerazione della rappresentazione nel dominio della frequenza DFT è anche possibile sintetizzare in modo efficiente sinusoidi di frequenze arbitrarie utilizzando una serie di frame sovrapposti e la trasformata Fast Fourier inversa .

Analisi additiva/resisintesi

Sistema di analisi/sintesi sinusoidale per modellazione sinusoidale (basato su McAulay & Quatieri 1988 , p. 161)

È possibile analizzare le componenti in frequenza di un suono registrato dando una rappresentazione a "somma di sinusoidi". Questa rappresentazione può essere ri-sintetizzata usando la sintesi additiva. Un metodo per scomporre un suono in parziali sinusoidali variabili nel tempo è l' analisi McAulay- Quatieri basata sulla trasformata di Fourier a tempo breve (STFT) .

Modificando la rappresentazione della somma delle sinusoidi, si possono apportare alterazioni timbriche prima della risintesi. Ad esempio, un suono armonico potrebbe essere ristrutturato in suono disarmonico e viceversa. L'ibridazione del suono o "morphing" è stata implementata mediante risintesi additiva.

L'analisi/resintesi additiva è stata impiegata in una serie di tecniche tra cui la modellazione sinusoidale, la sintesi di modelli spettrali (SMS) e il modello sonoro additivo con larghezza di banda riassegnazione e potenziata. Il software che implementa l'analisi/resintesi additiva include: SPEAR, LEMUR, LORIS, SMSTools, ARSS.

Prodotti

Ri-sintesi additiva usando la concatenazione di timbri:

Concatenazione con dissolvenze incrociate (su Synclavier)

Concatenazione con interpolazione dell'inviluppo spettrale (su Vocaloid)

New England Digital Synclavier aveva una funzione di risintesi in cui i campioni potevano essere analizzati e convertiti in "frame timbrici" che facevano parte del suo motore di sintesi additiva. Technos acxel , lanciato nel 1987, utilizzava il modello di analisi/risintesi additiva, in un'implementazione FFT .

Anche un sintetizzatore vocale, Vocaloid è stato implementato sulla base dell'analisi/risintesi additiva: il suo modello di voce spettrale chiamato modello Excitation plus Resonances (EpR) è esteso sulla base di Spectral Modeling Synthesis (SMS), e la sua sintesi concatenativa difonica è elaborata utilizzando lo spettro tecnica di elaborazione dei picchi (SPP) simile al vocoder ad aggancio di fase modificato (un vocoder di fase migliorato per l'elaborazione delle formanti). Utilizzando queste tecniche, i componenti spettrali ( formanti ) costituiti da parziali puramente armoniche possono essere opportunamente trasformati nella forma desiderata per la modellazione del suono e la sequenza di brevi campioni ( difoni o fonemi ) che costituiscono la frase desiderata, può essere facilmente collegata interpolando parziali abbinati e picchi formanti , rispettivamente, nella regione di transizione inserita tra campioni diversi. (Vedi anche Timbri dinamici )

Applicazioni

Strumenti musicali

La sintesi additiva è utilizzata negli strumenti musicali elettronici. È la principale tecnica di generazione del suono utilizzata dagli organi Eminent .

Sintesi vocale

Nella ricerca linguistica , la sintesi armonica additiva è stata utilizzata negli anni '50 per riprodurre spettrogrammi vocali modificati e sintetici.

Successivamente, all'inizio degli anni '80, furono effettuati test di ascolto su discorsi sintetici privi di segnali acustici per valutarne il significato. Le frequenze e le ampiezze delle formanti variabili nel tempo derivate dalla codifica predittiva lineare sono state sintetizzate in modo additivo come fischietti di tono puro. Questo metodo è chiamato sintesi sinusoidale . Anche la modellazione sinusoidale composita (CSM) utilizzata su una funzione di sintesi vocale cantata su Yamaha CX5M (1984), è nota per utilizzare un approccio simile che è stato sviluppato indipendentemente durante il 1966-1979. Questi metodi sono caratterizzati dall'estrazione e ricomposizione di un insieme di picchi spettrali significativi corrispondenti ai diversi modi di risonanza avvenuti nella cavità orale e nasale, in un'ottica acustica . Questo principio è stato utilizzato anche su un metodo di sintesi di modelli fisici , chiamato sintesi modale .

Storia

Lord Kelvin s' macchina Tide-predire

Sintetizzatore armonico

Analizzatore di armoniche

L'analisi armonica fu scoperta da Joseph Fourier , che pubblicò un ampio trattato delle sue ricerche nel contesto del trasferimento di calore nel 1822. La teoria trovò una prima applicazione nella previsione delle maree . Intorno al 1876, William Thomson (in seguito nobilitato come Lord Kelvin ) costruì un predittore meccanico delle maree . Consisteva in un analizzatore di armoniche e in un sintetizzatore armonico , come venivano chiamati già nel XIX secolo. L'analisi delle misurazioni della marea è stata eseguita utilizzando la macchina di integrazione di James Thomson . I coefficienti di Fourier risultanti sono stati inseriti nel sintetizzatore, che ha quindi utilizzato un sistema di corde e pulegge per generare e sommare parziali sinusoidali armoniche per la previsione delle maree future. Nel 1910 fu costruita una macchina simile per l'analisi delle forme d'onda periodiche del suono. Il sintetizzatore ha tracciato un grafico della forma d'onda combinata, che è stato utilizzato principalmente per la convalida visiva dell'analisi.

Risonatore di Helmholtz

Generatore di suoni che lo utilizza

Georg Ohm applicò la teoria di Fourier al suono nel 1843. La linea di lavoro fu notevolmente avanzata da Hermann von Helmholtz , che pubblicò i suoi otto anni di ricerca nel 1863. Helmholtz credeva che la percezione psicologica del colore tonale fosse soggetta all'apprendimento, mentre l'udito in il senso sensoriale è puramente fisiologico. Sostenne l'idea che la percezione del suono derivi da segnali provenienti dalle cellule nervose della membrana basilare e che le appendici elastiche di queste cellule siano vibrate simpaticamente da toni sinusoidali puri di frequenze appropriate. Helmholtz era d'accordo con la scoperta di Ernst Chladni del 1787 che alcune sorgenti sonore hanno modalità di vibrazione disarmoniche.

Analizzatore di suoni e sintetizzatore di Rudolph Koenig

sintetizzatore di suoni

analizzatore di suoni

Ai tempi di Helmholtz, l'amplificazione elettronica non era disponibile. Per la sintesi di toni con parziali armoniche, Helmholtz costruì una serie di diapason e camere di risonanza acustica eccitate elettricamente che consentivano la regolazione delle ampiezze dei parziali. Costruiti almeno nel 1862, questi furono a loro volta perfezionati da Rudolph Koenig , che dimostrò la propria configurazione nel 1872. Per la sintesi armonica, Koenig costruì anche un grande apparato basato sulla sua sirena a onde . Era pneumatico e utilizzava ruote foniche ritagliate , ed è stato criticato per la bassa purezza dei suoi toni parziali. Anche le canne tibiali degli organi a canne hanno forme d'onda quasi sinusoidali e possono essere combinate alla maniera della sintesi additiva.

Nel 1938, con nuove significative prove a sostegno, è stato riportato sulle pagine di Popular Science Monthly che le corde vocali umane funzionano come una sirena antincendio per produrre un tono ricco di armoniche, che viene poi filtrato dal tratto vocale per produrre diversi toni vocalici. . All'epoca, l'organo additivo Hammond era già sul mercato. La maggior parte dei primi produttori di organi elettronici pensava che fosse troppo costoso produrre la pluralità di oscillatori richiesti dagli organi additivi e iniziarono invece a costruirne di sottrattivi . In una riunione dell'Institute of Radio Engineers del 1940 , il capo ingegnere sul campo di Hammond elaborò il nuovo Novachord dell'azienda come avente un "sistema sottrattivo" in contrasto con l'organo Hammond originale in cui "i toni finali sono stati costruiti combinando le onde sonore" . Alan Douglas usò i qualificatori additivo e sottrattivo per descrivere diversi tipi di organi elettronici in un articolo del 1948 presentato alla Royal Musical Association . La formulazione contemporanea sintesi additiva e sintesi sottrattiva può essere trovata nel suo libro del 1957 La produzione elettrica della musica , in cui elenca categoricamente tre metodi di formazione dei toni-colori musicali, nelle sezioni intitolate Sintesi additiva , Sintesi sottrattiva e Altre forme di combinazioni .

Un tipico sintetizzatore additivo moderno produce la sua uscita come segnale elettrico , analogico o come audio digitale , come nel caso dei sintetizzatori software , che sono diventati popolari intorno all'anno 2000.

Sequenza temporale

Quella che segue è una cronologia di sintetizzatori e dispositivi analogici e digitali storicamente e tecnologicamente notevoli che implementano la sintesi additiva.

Implementazione o pubblicazione della ricerca	Disponibili commercialmente	Azienda o ente	Sintetizzatore o dispositivo di sintesi	Descrizione	Campioni audio
1900	1906	Compagnia di musica elettrica del New England	Telharmonium	Il primo sintetizzatore musicale polifonico sensibile al tocco. Implementata sintesi additiva sinuosa utilizzando tonewheels e alternatori . Inventato da Thaddeus Cahill .	nessuna registrazione conosciuta
1933	1935	Hammond Organ Company	Organo Hammond	Un sintetizzatore elettronico additivo che ha avuto più successo commerciale del Telharmonium. Sintesi additiva sinusoidale implementata utilizzando tonewheel e pickup magnetici . Inventato da Laurens Hammond .	Modello A ( aiuto · info )
1950 o prima		Laboratori Haskins	Riproduzione pattern	Un sistema di sintesi vocale che controllava le ampiezze delle parziali armoniche mediante uno spettrogramma disegnato a mano o un risultato di analisi. I parziali sono stati generati da un tonewheel ottico multitraccia .	campioni
1958			ANS	Un sintetizzatore additivo che riproduceva partiture simili a spettrogrammi microtonali utilizzando più tonewheel ottici multitraccia . Inventato da Evgeny Murzin . Uno strumento simile che utilizzava oscillatori elettronici, l' Oscillator Bank e il suo dispositivo di input Spectrogram furono realizzati da Hugh Le Caine nel 1959.	Modello del 1964 ( aiuto · info )
1963		MIT		Un sistema off-line per l'analisi spettrale digitale e la risintesi delle porzioni di attacco e stato stazionario dei timbri di strumenti musicali di David Luce.
1964		Università dell'Illinois	Generatore di suoni armonici	Un sistema elettronico di sintesi additiva armonica inventato da James Beauchamp.	campioni ( informazioni )
1974 o prima	1974	RMI	Sintetizzatore Armonico	Il primo prodotto sintetizzatore che ha implementato la sintesi additiva utilizzando oscillatori digitali. Il sintetizzatore aveva anche un filtro analogico variabile nel tempo. RMI era una sussidiaria di Allen Organ Company , che aveva rilasciato il primo organo da chiesa digitale commerciale , l' Allen Computer Organ , nel 1971, utilizzando la tecnologia digitale sviluppata dalla North American Rockwell .	1 2 3 4
1974		SME (Londra)	Banco oscillatore digitale	Un banco di oscillatori digitali con forme d'onda arbitrarie, controlli individuali di frequenza e ampiezza, destinati all'uso in analisi-risintesi con l' Analyzing Filter Bank (AFB) digitale anch'esso costruito presso EMS. Conosciuto anche come: DOB .	in Il nuovo suono della musica
1976	1976	Fairlight	Qasar M8	Un sintetizzatore completamente digitale che utilizzava la trasformata Fast Fourier per creare campioni da inviluppi di ampiezza disegnati in modo interattivo di armoniche.	campioni
1977		Bell Labs	Sintetizzatore digitale	Un sintetizzatore additivo digitale in tempo reale che è stato definito il primo vero sintetizzatore digitale. Conosciuto anche come: Alles Machine , Alice .	campione ( informazioni )
1979	1979	New England Digitale	Sinclavio II	Un sintetizzatore digitale commerciale che ha consentito lo sviluppo del timbro nel tempo mediante dissolvenze incrociate uniformi tra le forme d'onda generate dalla sintesi additiva.	Jon Appleton - Sashasonjon ( aiuto · informazioni )

Equazioni a tempo discreto

Nelle implementazioni digitali della sintesi additiva, vengono utilizzate equazioni a tempo discreto al posto delle equazioni di sintesi a tempo continuo. Una convenzione di notazione per i segnali a tempo discreto utilizza parentesi ie l'argomento può essere solo valori interi. Se si prevede che l' output della sintesi in tempo continuo sia sufficientemente limitato in banda ; al di sotto della metà della frequenza di campionamento o , è sufficiente campionare direttamente l'espressione a tempo continuo per ottenere l'equazione di sintesi discreta. L'output della sintesi continua può essere successivamente ricostruito dai campioni utilizzando un convertitore digitale-analogico . Il periodo di campionamento è . $y[n]\,$ $n\,$ $y(t)\,$ $f_{\mathrm {s} }/2\,$ $T=1/f_{\mathrm {s} }\,$