Grammatica stocastica - Stochastic grammar

Una grammatica stocastica ( grammatica statistica ) è un framework grammaticale con una nozione probabilistica di grammaticalità :

La grammatica è realizzata come un modello linguistico . Le frasi consentite vengono memorizzate in un database insieme alla frequenza con cui è comune una frase. L' elaborazione statistica del linguaggio naturale utilizza metodi stocastici , probabilistici e statistici , soprattutto per risolvere le difficoltà che sorgono perché frasi più lunghe sono altamente ambigue quando elaborate con grammatiche realistiche, producendo migliaia o milioni di possibili analisi. I metodi per disambiguare spesso implicano l'uso di corpora e modelli di Markov . "Un modello probabilistico è costituito da un modello non probabilistico più alcune quantità numeriche; non è vero che i modelli probabilistici sono intrinsecamente più semplici o meno strutturali dei modelli non probabilistici".

Esempi

Un metodo probabilistico per il rilevamento delle rime è stato implementato da Hirjee & Brown nel loro studio nel 2013 per trovare coppie di rime interne e imperfette nei testi rap. Il concetto è adattato da una tecnica di allineamento di sequenza utilizzando BLOSUM ( BLO cks SU bstitution M atrix). Sono stati in grado di rilevare rime non rilevabili da modelli non probabilistici.

Guarda anche

Riferimenti

  1. ^ Steve Young; Gerrit Bloothooft (14 marzo 2013). Metodi basati su corpus nell'elaborazione del linguaggio e del parlato . Springer Science & Business Media. pagg. 140–. ISBN   978-94-017-1183-8 .
  2. ^ John Goldsmith. 2002. " Modelli probabilistici di grammatica: fonologia come minimizzazione delle informazioni ". Studi fonologici n. 5: 21–46.
  3. ^ Hirjee, Hussein; Brown, Daniel (2013). "Utilizzo del rilevamento automatizzato delle rime per caratterizzare lo stile delle rime nella musica rap" (PDF) . Empirical Musicology Review .

Ulteriore lettura

  • Christopher D. Manning, Hinrich Schütze: Foundations of Statistical Natural Language Processing , MIT Press (1999), ISBN   978-0-262-13360-9 .
  • Stefan Wermter, Ellen Riloff, Gabriele Scheler (a cura di): Connectionist, Statistical and Symbolic Approaches to Learning for Natural Language Processing , Springer (1996), ISBN   978-3-540-60925-4 .
  • Pirani, Giancarlo, ed. Algoritmi e architetture avanzati per la comprensione del parlato. Vol. 1. Springer Science & Business Media, 2013.