Stack ELK : Logstash et Kibana les outils d'Elasticsearch

Analyse des champs textuels

Attention

Il est très important de configurer le bon type de données lorsque l'on ajoute des données à une base elasticsearch.

En effet, les chaînes de caractères sont analysées par la suite mot par mot en coupant les phrases sur les espaces et en enlevant la ponctuation. À chaque mot correspondra un pourcentage d'apparition utilisé pour tirer les données selon leur pertinence.

Remarque

On retrouve cette analyse dans kibana avec deux champs disponibles sur les champs texte :

  • nom_du_champ : Valeur du champ analysé par elasticsearch

  • nom_du_champ.raw : Valeur brute du champ (on conserve la phrase entière)

Conseil

Lorsque l'on effectue des graphes, il faut donc faire attention au nom du champ que l'on utilise pour ne pas biaiser les résultats

  1. Antoine Barbare

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimer Antoine Barbare, 2015 (Contributions : Stéphane Crozat, les étudiants de l'UTC) Paternité - Partage des Conditions Initiales à l'IdentiqueRéalisé avec Scenari (nouvelle fenêtre)