Elasticsearch : Base & REST

Magie / Fuzzing

Elasticsearch est adapté à la langue humaine

- Normaliser les mots : enlever les accents

- Réduire les mots à leur forme de base : au singulier, masculin, etc

- "Stopwords" : Déterminants...

- Synonymes : USA-US, fast-quick

- Coquilles/Fautes d'orthographe : Fuzzing

MéthodeExemple de Fuzzing

1
POST /tests/ortho/_search
2
{
3
  "query": {
4
    "fuzzy": {
5
      "text": "dilemme"
6
    }
7
  }
8
}
9

RemarquePersonalisation de la "Fuzziness"

1
POST /tests/ortho/_search
2
{
3
  "query": {
4
    "fuzzy": {
5
      "buyer": {
6
        "value": "marie",
7
        "fuzziness": 2
8
      }
9
    }
10
  }
11
}

On peut changer la "fuzziness" qui correspond au nombre de permutations.

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimer Sylvain Doignon, 2015 (Contributions : Stéphane Crozat, les étudiants de l'UTC) Paternité - Partage des Conditions Initiales à l'IdentiqueRéalisé avec Scenari (nouvelle fenêtre)