Elasticsearch : Base & REST

Magie / Fuzzing

Elasticsearch est adapté à la langue humaine

- Normaliser les mots : enlever les accents

- Réduire les mots à leur forme de base : au singulier, masculin, etc

- "Stopwords" : Déterminants...

- Synonymes : USA-US, fast-quick

- Coquilles/Fautes d'orthographe : Fuzzing

MéthodeExemple de Fuzzing

CTRL+C pour copier, CTRL+V pour coller
1
POST /tests/ortho/_search
2
{
3
  "query": {
4
    "fuzzy": {
5
      "text": "dilemme"
6
    }
7
  }
8
}
9
POST /tests/ortho/_search
{
  "query": {
    "fuzzy": {
      "text": "dilemme"
    }
  }
}

RemarquePersonalisation de la "Fuzziness"

CTRL+C pour copier, CTRL+V pour coller
1
POST /tests/ortho/_search
2
{
3
  "query": {
4
    "fuzzy": {
5
      "buyer": {
6
        "value": "marie",
7
        "fuzziness": 2
8
      }
9
    }
10
  }
11
}
POST /tests/ortho/_search
{
  "query": {
    "fuzzy": {
      "buyer": {
        "value": "marie",
        "fuzziness": 2
      }
    }
  }
}

On peut changer la "fuzziness" qui correspond au nombre de permutations.

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimer Sylvain Doignon, 2015 (Contributions : Stéphane Crozat, les étudiants de l'UTC) Paternité - Partage des Conditions Initiales à l'IdentiqueRéalisé avec Scenari (nouvelle fenêtre)