Analisi multilineare delle componenti principali - Multilinear principal component analysis

L'analisi delle componenti principali multilineare ( MPCA ) è un'estensione multilineare dell'analisi delle componenti principali (PCA). MPCA è impiegato nell'analisi di array n-way, cioè un cubo o un ipercubo di numeri, anche informalmente denominato "tensore di dati". Gli array a n vie possono essere scomposti, analizzati o modellati da

  • modelli di tensori lineari come CANDECOMP / Parafac o
  • modelli tensoriali multilineari, come l'analisi della componente principale multilineare (MPCA) o l'analisi della componente indipendente multilineare (MICA), ecc.

L'origine dell'MPCA può essere fatta risalire alla decomposizione di Tucker e al lavoro "M-mode PCA / 3-mode PCA" di Peter Kroonenberg. Nel 2000, De Lathauwer et al. ha ribadito il lavoro di Tucker e Kroonenberg in termini di calcolo numerici chiari e concisi nel loro articolo SIAM intitolato " Multilinear Singular Value Decomposition ", (HOSVD) e nel loro articolo "On the Best Rank-1 and Rank- (R 1 , R 2 , .. ., R N ) Approssimazione di tensori di ordine superiore ".

Intorno al 2001, Vasilescu ha riformulato i problemi di analisi, riconoscimento e sintesi dei dati come problemi tensoriali multilineari basati sull'intuizione che la maggior parte dei dati osservati sono la conseguenza compositiva di diversi fattori causali della formazione dei dati e sono adatti per l'analisi multimodale del tensore dei dati. La potenza della struttura tensoriale è stata dimostrata analizzando gli angoli delle articolazioni del movimento umano, le immagini facciali o le strutture in termini di fattori causali di formazione dei dati nei seguenti lavori: Human Motion Signatures (CVPR 2001, ICPR 2002), riconoscimento facciale - TensorFaces , ( ECCV 2002, CVPR 2003, ecc.) E computer grafica - TensorTextures (Siggraph 2004).

Storicamente, MPCA è stata definita "M-mode PCA", una terminologia coniata da Peter Kroonenberg nel 1980. Nel 2005, Vasilescu e Terzopoulos hanno introdotto la terminologia PCA multilineare come un modo per differenziare meglio tra decomposizione tensoriale lineare e multilineare, così come, per differenziare meglio tra il lavoro che ha calcolato le statistiche di secondo ordine associate a ciascuna modalità di tensore dei dati (asse), e il lavoro successivo sull'analisi dei componenti indipendenti multilineare che ha calcolato le statistiche di ordine superiore associate a ciascuna modalità / asse del tensore.

La PCA multilineare può essere applicata per calcolare i fattori causali della formazione dei dati, o come strumento di elaborazione del segnale su tensori di dati la cui osservazione individuale è stata vettorizzata, o le cui osservazioni sono trattate come matrice e concatenate in un tensore di dati.

MPCA calcola un insieme di matrici ortonormali associate a ciascuna modalità del tensore di dati che sono analoghe allo spazio di riga e colonna ortonormale di una matrice calcolata dalla matrice SVD. Questa trasformazione mira a catturare una varianza più alta possibile, tenendo conto della maggior parte della variabilità dei dati associati a ciascuna modalità di tensore dei dati (asse).

L'algoritmo

La soluzione MPCA segue l'approccio ALS (alternating minimum square). È di natura iterativa. Come in PCA, MPCA funziona su dati centrati. Il centraggio è un po 'più complicato per i tensori ed è dipendente dal problema.

Selezione delle caratteristiche

Funzionalità MPCA: la selezione delle funzionalità MPCA con supervisione viene utilizzata nel riconoscimento degli oggetti, mentre la selezione delle funzionalità MPCA senza supervisione viene utilizzata nelle attività di visualizzazione.

Estensioni

Sono state sviluppate varie estensioni di MPCA:

  • MPCA non correlato (UMPCA) Al contrario, l'MPCA non correlato (UMPCA) genera caratteristiche multilineari non correlate.
  • Boosting + MPCA
  • MPCA non negativo (NMPCA)
  • Robusto MPCA (RMPCA)
  • Multi-Tensor Factorization, che trova automaticamente anche il numero di componenti (MTF)

Riferimenti

link esterno