Analisi morfologica - Morphological parsing

L'analisi morfologica , nell'elaborazione del linguaggio naturale , è il processo di determinazione dei morfemi da cui è costruita una data parola. Deve essere in grado di distinguere tra regole ortografiche e regole morfologiche. Ad esempio, la parola "volpi" può essere scomposta in "volpe" (la radice) e "es" (un suffisso che indica la pluralità).

L'approccio generalmente accettato all'analisi morfologica è attraverso l'uso di un trasduttore a stato finito (FST), che immette parole ed emette il loro gambo e modificatori. L'FST viene inizialmente creato attraverso l'analisi algoritmica di alcune fonti di parole, come un dizionario, completo di marcatori di modifica.

Un altro approccio è attraverso l'uso di un metodo di ricerca indicizzata, che utilizza un albero radix costruito . Questo non è un percorso frequente perché si rompe per lingue morfologicamente complesse.

Con il progresso delle reti neurali nell'elaborazione del linguaggio naturale, è diventato meno comune utilizzare l'FST per l'analisi morfologica, specialmente per le lingue per le quali sono disponibili molti dati di addestramento . Per tali linguaggi, è possibile costruire modelli linguistici a livello di carattere senza l'uso esplicito di un parser morfologico.

Ortografico

Le regole ortografiche sono regole generali utilizzate per suddividere una parola nella sua radice e modificatori . Un esempio potrebbe essere: parole inglesi singolari che terminano con -y, quando pluralizzate, terminano con -ies. Contrasta questo con le regole morfologiche che contengono casi d'angolo a queste regole generali. Entrambi questi tipi di regole vengono utilizzati per costruire sistemi in grado di eseguire analisi morfologiche.

morfologico

Le regole morfologiche sono eccezioni alle regole ortografiche usate per suddividere una parola nella sua radice e modificatori. Un esempio potrebbe essere che mentre normalmente si pluralizza una parola in inglese aggiungendo "s" come suffisso, la parola "fish" non cambia quando pluralizzata. Contrasta questo con le regole ortografiche che contengono regole generali. Entrambi questi tipi di regole vengono utilizzati per costruire sistemi in grado di eseguire analisi morfologiche.

Sono stati proposti vari modelli di elaborazione morfologica naturale. Alcuni studi sperimentali suggeriscono che i parlanti monolingui elaborino le parole come intere ascoltandole, mentre i loro coetanei bilingui in ritardo scompongono le parole nei loro corrispondenti morfemi, perché le loro rappresentazioni lessicali non sono così specifiche e perché l'elaborazione lessicale nella seconda lingua può essere meno frequente rispetto all'elaborazione della lingua madre.

Le applicazioni dell'elaborazione morfologica includono la traduzione automatica, il correttore ortografico e il recupero delle informazioni.

Riferimenti