Elasticsearch


Elasticsearch est un moteur de recherche Open Source utilisant la librairie Apache Lucene.
La plateforme Elasticsearch se présente sous forme d’un cluster d’indexation intégrant une base documentaire NoSQL et utilisant le format JSON pour le stockage des documents.

Avec Elasticsearch, il est possible d’effectuer des recherches ‘Full text’ sur tout type de document pratiquement en temps réel.
A la différence des requêtes SQL, les requêtes Elasticsearch permettent d’obtenir les données qui répondent totalement ou partiellement aux critères de sélection, avec un classement de celles-ci selon une formule de pertinence.

L’architecture de plateforme Elasticsearch est dite ‘distribuée’ ; les données sont découpées en ‘Shard’ (éclats) stockés sur un ou plusieurs nœuds du cluster.
Pour garantir la disponibilité des données, chaque ‘Shard’ peut avoir un ou plusieurs ‘Réplica’.

Les communications avec Elasticsearch s’effectue via une RESTful API ou un Java REST Client.
Un ensemble de plugins permettent l’enrichissement des fonctionnalités de base d’Elasticsearch.

Elasticsearch Commeo moteur de recherche opensource

La suite Elastic Stack comprend :

  • Kibana : une fenêtre sur Elasticsearch permettant la visualisation et l’exploration des données.
  • Logstash : un ‘pipeline’ pour la collecte, l’enrichissement et le transfert des données vers ElasticSearch (ou un autre entrepôt de données).
  • Beats : un ensemble d’agents pour le transfert de données vers Logstash et Elasticsearch.

Commeo Elasticsearch Open Source Distributor

Le X-pack comprend les modules :

  • Security (Shield) pour protéger les données Elasticsearch : authentification des utilisateurs, gestion des droits, chiffrements des données, protection des données par niveaux (Cluster, index, document et/ou champ) et audit logging.
  • Alerting (Watcher) pour être immédiatement informé d’anomalies relevées dans un cluster Elasticsearch : consommation de CPU trop élevée, temps de réponse des applications anormal, nombre d’erreurs 503 trop nombreuses, …
  • Monitoring (Marvel) pour suivre en temps réel les performances d’Elasticsearch, de Kibana et de Logstach.
  • Reporting pour générer des rapports depuis toute visualisation ou tout tableau de bord Kibana.
  • Graph pour déceler et analyser graphiquement les relations potentielles entre les données Elasticsearch : liens entre personnes, lieux, préférences, produits, …
  • Machine Learning pour modéliser le comportement des données Elasticsearch (tendances, périodicité, …) afin d’identifier plus rapidement les anomalies et leurs causes.

Elasticsearch Commeo Open Source Distributor