Grammatica della struttura della frase guidata dalla testa - Head-driven phrase structure grammar

La grammatica della struttura della frase guidata dalla testa ( HPSG ) è una grammatica altamente lessicalizzata e basata sui vincoli sviluppata da Carl Pollard e Ivan Sag . È un tipo di grammatica della struttura della frase , al contrario di una grammatica delle dipendenze , ed è l'immediato successore della grammatica della struttura della frase generalizzata . HPSG attinge da altri campi come l' informatica ( teoria dei tipi di dati e rappresentazione della conoscenza ) e utilizza la nozione di segno di Ferdinand de Saussure . Utilizza un formalismo uniforme ed è organizzato in modo modulare che lo rende attraente per l'elaborazione del linguaggio naturale .

Una grammatica HPSG include principi e regole grammaticali e voci lessicali che normalmente non sono considerate appartenenti a una grammatica. Il formalismo si basa sul lessicalismo. Ciò significa che il lessico è più di un semplice elenco di voci; è di per sé riccamente strutturato. Le singole voci sono contrassegnate da tipi. I tipi formano una gerarchia. Le prime versioni della grammatica erano molto lessicalizzate con poche regole grammaticali (schema). La ricerca più recente ha teso ad aggiungere regole sempre più ricche, diventando più simili alla grammatica di costruzione .

Il tipo di base di cui si occupa HPSG è il segno. Parole e frasi sono due diversi sottotipi di segno. Una parola ha due caratteristiche: [PHON] (il suono, la forma fonetica ) e [SYNSEM] (l'informazione sintattica e semantica ), entrambe suddivise in sottocaratteristiche. I segni e le regole sono formalizzati come strutture di caratteristiche tipizzate .

Esempio di grammatica

HPSG genera stringhe combinando segni, che sono definiti dalla loro posizione all'interno di una gerarchia di tipi e dalla loro struttura interna delle caratteristiche, rappresentata da matrici dei valori degli attributi (AVM). Le funzionalità accettano tipi o elenchi di tipi come valori e questi valori possono a loro volta avere la propria struttura di funzionalità. Le regole grammaticali sono in gran parte espresse attraverso i vincoli posti l'uno sull'altro dai segni. La struttura delle caratteristiche di un segno descrive le sue proprietà fonologiche, sintattiche e semantiche. Nella notazione comune, gli AVM sono scritti con le caratteristiche in maiuscolo e i tipi in corsivo minuscolo. Gli indici numerati in un AVM rappresentano valori identici al token.

Nell'AVM semplificato per la parola (in questo caso il verbo, non il sostantivo come in "belle passeggiate per il fine settimana") "cammina" di seguito, l'informazione categorica del verbo (CAT) è suddivisa in caratteristiche che lo descrivono (HEAD) e caratteristiche che descrivono i suoi argomenti (VALENZA).

AVM per le passeggiate

"Walks" è un segno di tipo parola con una testa di tipo verbo . Come verbo intransitivo, "camminare" non ha complemento ma richiede un soggetto che sia un sostantivo di terza persona singolare. Il valore semantico del soggetto (CONTENT) è co-indicizzato con l'unico argomento del verbo (l'individuo che cammina). Il seguente AVM per "lei" rappresenta un segno con un valore SYNSEM che potrebbe soddisfare tali requisiti.

Lei-avm.png

I segni di tipo frase si uniscono con uno o più figli e propagano le informazioni verso l'alto. Il seguente AVM codifica la regola di dominanza immediata per una frase head-subj , che richiede due figli: il figlio head (un verbo) e un figlio non-head che soddisfa i vincoli SUBJ del verbo.

Head-subj-avm.png

Il risultato finale è un segno con una testa del verbo, funzioni di sottocategorizzazione vuote e un valore fonologico che ordina i due figli.

Sebbene la grammatica attuale di HPSG sia composta interamente da strutture di caratteristiche, i linguisti usano spesso alberi per rappresentare l'unificazione dei segni in cui l'equivalente AVM sarebbe ingombrante.

Head-subj-tree.png

implementazioni

Sono stati scritti vari parser basati sul formalismo HPSG e sono attualmente allo studio ottimizzazioni. Un esempio di sistema di analisi delle frasi tedesche è fornito dalla Freie Universität Berlin . Inoltre, il progetto CoreGram del Grammar Group della Freie Universität Berlin fornisce grammatiche open source che sono state implementate nel sistema TRALE. Attualmente ci sono grammatiche per tedesco , danese , cinese mandarino , maltese e persiano che condividono un nucleo comune e sono disponibili pubblicamente.

Grandi grammatiche HPSG di varie lingue vengono sviluppate nel Deep Linguistic Processing con HPSG Initiative ( DELPH-IN ). Grammatiche ad ampia copertura di inglese, tedesco e giapponese sono disponibili con una licenza open source. Questi grammatiche possono essere utilizzati con una varietà di open-source HPSG parser compatibili tra: LKB , PET, Ace, e sono d'accordo . Tutti questi producono rappresentazioni semantiche nel formato di "Semantica di ricorsione minima", MRS. La natura dichiarativa del formalismo HPSG significa che queste grammatiche computazionali possono essere tipicamente utilizzate sia per l' analisi che per la generazione (producendo stringhe di superficie da input semantici). I treebank, anch'essi distribuiti da DELPH-IN , vengono utilizzati per sviluppare e testare le grammatiche, nonché per addestrare modelli di classificazione per decidere interpretazioni plausibili durante l'analisi (o realizzazioni durante la generazione).

Enju è un parser probabilistico HPSG ad ampia copertura disponibile gratuitamente per l'inglese sviluppato dal Laboratorio Tsujii presso l'Università di Tokyo in Giappone .

Guarda anche

Riferimenti

Ulteriori letture

link esterno