Splunk

Le principe de fonctionnement

Les entrées du logiciel

Splunk permet de charger des événements (par exemple des ventes) dans son moteur d'indéxation :

  • soit en prenant un fichier plat en entrée (fichier Micrsosoft Excel, CSV, OpenDocument,…)

  • soit en le connectant à une base de donnée via un connecteur

  • soit en récupérant les données entrant sur la connexion (via TCP/IP par exemple) pour en extraire des événements à ajouter au moteur

Il existe tout un magasin d'application intégré dans le logiciel pour assurer toutes les connexions possibles avec les solutions du marché. Une large communauté s'est formée pour compléter en permanence ce magasin d'application.

Exemple

Parmi les applications, en voici quelques exemples :

  • on peut ajouter les fonds de carte Google Maps, pour rendre plus visuels encore les rapports : on peut localiser les faits et lire cette information facilement sur un plan

  • on peut facilement superviser des machines virtuelles VMware, ou un parc d'ordinateurs Windows en entreprise

  • on peut enrichir les données insérées grâce à certains services. Par exemple on peut ajouter des informations tirées des adresses IP

Ces possibilités peuvent être étendues en développant avec le Splunk SDK qui permet de créer soi-même de nouvelles applications pour adapter exactement Splunk à ses propres besoins.

L'analyse des données

Splunk analyse les données, et en particulier le timestamp qui est associé à chaque événement, et va ensuite les indexer dans son moteur, le Splunk Indexer.

On peut ensuite faire du reporting sur l'ensemble de ces événements.

RappelLe reporting

Le reporting est le fait de présenter sous forme de rapports des données concernant une entreprise, par exemple l'évolution des ventes, de manière générale ou selon un angle particulier, afin d'aider à la décision pour la stratégie de l'entreprise.

Grâce à un langage spécifique, le SPL, ou Search Processing Language, on peut, dans une barre de recherche, analyser les données de manière multi-dimensionnelle. On peut obtenir facilement et rapidement (le moteur d'indexation optimise particulièrement les traitements) des tableaux ou des graphes.

L'analyse peut se faire "après coup", comme on l'a fait jusque-là avec nos analyses en API04. Mais on peut aussi créer des tableaux de bord, qui enregistrent des recherches et permettent ainsi de monitorer en direct les résultats.

Exemple

On pourrait par exemple se rendre compte des produits les plus commandés sur une boutique en ligne en temps réel et détecter une montée des ventes à un certain moment pour un produit en particulier, ce qui pourrait inciter à réagir commercialement, ou à s'inquiéter de l'état des stocks. C'est une vision à court-terme, en live.

Au contraire, on peut essayer de voir quels sont les produits, ou les marques qui ont le mieux marché sur l'année écoulée, afin de connaître les goûts des utilisateurs. Là, on a une vision à long terme afin d'évaluer les stratégie que peuvent adopter la direction marketing.

Attention

Splunk n'est pas un logiciel d'ETL. Il ne permet donc pas de faire tout ce qui concerne les jointures. Il est donc suggéré de faire d'abord passer les données, par un middleware comme Pentaho (partenaire de Splunk) qui se charge de faire ces jointures, avant de les analyser dans Splunk.

D'autre part, mais dans la même veine, les données doivent être nettoyées au préalable.

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimer Olympio Barthélemy Paternité - Partage des Conditions Initiales à l'IdentiqueRéalisé avec Scenari (nouvelle fenêtre)