Apache Solr - Apache Solr

Solr
Logo Solr
Sviluppatore/i Apache Software Foundation
Rilascio stabile
8.10.1 / 18 ottobre 2021 ; 0 giorni fa ( 2021-10-18 )
Repository Repository Solr
Scritto in Giava
Sistema operativo Multipiattaforma
Tipo API di ricerca e indicizzazione
Licenza Licenza Apache 2.0
Sito web solr .apache .org Modificalo su Wikidata

Solr (pronunciato "solar") è una piattaforma di ricerca aziendale open source , scritta in Java . Le sue caratteristiche principali includono la ricerca full-text , l'evidenziazione dei risultati , la ricerca sfaccettata , l'indicizzazione in tempo reale, il clustering dinamico, l'integrazione del database, le funzionalità NoSQL e la gestione di documenti avanzati (ad es. Word, PDF). Fornendo la ricerca distribuita e la replica dell'indice, Solr è progettato per la scalabilità e la tolleranza ai guasti . Solr è ampiamente utilizzato per casi d'uso di analisi e ricerca aziendale e ha una comunità di sviluppo attiva e versioni regolari.

Solr viene eseguito come server di ricerca full-text autonomo. Utilizza la libreria di ricerca Java Lucene al suo interno per l'indicizzazione e la ricerca full-text e dispone di API HTTP / XML e JSON simili a REST che lo rendono utilizzabile dai linguaggi di programmazione più diffusi. La configurazione esterna di Solr consente di adattarlo a molti tipi di applicazioni senza codifica Java e dispone di un'architettura plug-in per supportare una personalizzazione più avanzata.

Apache Solr è sviluppato in modo aperto e collaborativo dal progetto Apache Solr presso la Apache Software Foundation .

Storia

Nel 2004, Solr è stato creato da Yonik Seeley presso CNET Networks come progetto interno per aggiungere funzionalità di ricerca per il sito Web dell'azienda.

Nel gennaio 2006, CNET Networks ha deciso di pubblicare apertamente il codice sorgente donandolo all'Apache Software Foundation . Come ogni nuovo progetto Apache, è entrato in un periodo di incubazione che ha aiutato a risolvere problemi organizzativi, legali e finanziari.

Nel gennaio 2007, Solr è passata dallo stato di incubazione a un progetto di primo livello autonomo (TLP) ed è cresciuto costantemente con le funzionalità accumulate, attirando così utenti, contributori e committer. Sebbene abbastanza nuovo come progetto pubblico, ha alimentato diversi siti Web ad alto traffico.

Nel settembre 2008, è stato rilasciato Solr 1.3 che include funzionalità di ricerca distribuita e miglioramenti delle prestazioni tra molti altri.

Nel gennaio 2009, Yonik Seeley insieme a Grant Ingersoll ed Erik Hatcher è entrato a far parte di Lucidworks (precedentemente Lucid Imagination), la prima azienda che fornisce supporto commerciale e formazione per le tecnologie di ricerca Apache Solr. Da allora, le offerte di supporto intorno a Solr sono state abbondanti.

Novembre 2009 ha visto il rilascio di Solr 1.4. Questa versione ha introdotto miglioramenti nell'indicizzazione, nella ricerca e nelle sfaccettature insieme a molti altri miglioramenti come l'elaborazione di documenti avanzati ( PDF , Word , HTML ), il clustering dei risultati di ricerca basato su Carrot2 e anche una migliore integrazione del database. La versione include anche molti plug-in aggiuntivi.

Nel marzo 2010 i progetti Lucene e Solr si sono fusi. I download separati continuarono, ma i prodotti furono ora sviluppati congiuntamente da un singolo set di committer.

Nel 2011 lo schema del numero di versione di Solr è stato modificato per corrispondere a quello di Lucene. Dopo Solr 1.4, la versione successiva di Solr è stata etichettata 3.1, per mantenere Solr e Lucene sullo stesso numero di versione.

Nell'ottobre 2012 è stata rilasciata la versione 4.0 di Solr, inclusa la nuova funzionalità SolrCloud. Il 2013 e il 2014 hanno visto una serie di rilasci di Solr nella linea 4.x, aumentando costantemente il set di funzionalità e migliorando l'affidabilità.

Nel febbraio 2015, è stato rilasciato Solr 5.0, la prima versione in cui Solr è impacchettato come applicazione autonoma, terminando il supporto ufficiale per la distribuzione di Solr come guerra . Solr 5.3 presentava un framework di autenticazione e autorizzazione pluggable integrato.

Nell'aprile 2016 è stato rilasciato Solr 6.0. Aggiunto supporto per l'esecuzione di query SQL parallele nelle raccolte SolrCloud. Include il supporto StreamExpression e un nuovo driver JDBC per l'interfaccia SQL.

A settembre 2017 è stato rilasciato Solr 7.0. Questa versione, tra le altre cose, ha aggiunto il supporto di più tipi di replica, ridimensionamento automatico e un motore matematico.

A marzo 2019, è stato rilasciato Solr 8.0 che include molte correzioni di bug e aggiornamenti dei componenti. I nodi Solr possono ora ascoltare e servire le richieste HTTP/2. Tieni presente che per impostazione predefinita, le richieste interne vengono inviate anche tramite HTTP/2. Inoltre, è stato aggiunto un accesso all'interfaccia utente di amministrazione con il supporto per BasicAuth e Kerberos. E ora è possibile tracciare espressioni matematiche in Apache Zeppelin.

Nel novembre 2020, Bloomberg ha donato l' operatore Solr al progetto Lucene/Solr. L'operatore Solr aiuta a distribuire ed eseguire Solr in Kubernetes .

Nel febbraio 2021, Solr è stato istituito come progetto Apache (TLP) separato, indipendente da Lucene.

Operazioni

Per cercare un documento, Apache Solr esegue in sequenza le seguenti operazioni:

  1. Indicizzazione: converte i documenti in un formato leggibile dalla macchina.
  2. Interrogazione: comprensione dei termini di una interrogazione posta dall'utente. Questi termini possono essere immagini o parole chiave, ad esempio.
  3. Mapping: Solr associa la query dell'utente ai documenti archiviati nel database per trovare il risultato appropriato.
  4. Ranking: non appena il motore ricerca i documenti indicizzati, classifica gli output in base alla loro rilevanza.

Comunità

Solr ha sia individui che aziende che contribuiscono con nuove funzionalità e correzioni di bug.

Integrazione di Solre

Solr è incluso come ricerca integrata in molte applicazioni come i sistemi di gestione dei contenuti e i sistemi di gestione dei contenuti aziendali . Le distribuzioni Hadoop di Cloudera , Hortonworks e MapR raggruppano Solr come motore di ricerca per i loro prodotti commercializzati per i big data . DataStax DSE integra Solr come motore di ricerca con Cassandra . Solr è supportato come punto finale in vari framework di elaborazione dati e framework di integrazione aziendale .

Solr espone API simili a REST HTTP standard del settore con supporto sia XML che JSON e si integrerà con qualsiasi sistema o linguaggio di programmazione che supporti questi standard. Per facilità d'uso sono disponibili anche librerie client per Java , C# , PHP , Python , Ruby e molti altri linguaggi di programmazione popolari.

Guarda anche

Riferimenti

Bibliografia

link esterno