Analyse d'une base de comics
Nous possédons une base de personnages de comics avec des textes de description. Le mapping par défaut est le suivant :
{
"mappings": {
"characters": {
"properties": {
"characters": {
"type": "string",
"index": "not_analyzed"
},
"description": {
"type": "string",
"index": "not_analyzed"
}
}
}
}
}
{ "mappings": { "characters": { "properties": { "characters": { "type": "string", "index": "not_analyzed" }, "description": { "type": "string", "index": "not_analyzed" } } } } }
Chaque données est constitué de deux champs :
"character" : Le nom du personnage
"description" : Le texte de description du personnage
Question
Combien de personnages sont de l'univers marvel ? Un des résultat possède un score plus grand que les autres sur cette recherche, quel est le personnage lié à cette recherche ?
Vous devrez préalablement redéfinir votre index avec le mapping correct pour analyser les descriptions et rechercher à partir de mots clés.
Question
Question
Procédons à une dernière amélioration de l'analyse de notre description. Dans le résultat précédent, on observe que les agrégats des mots comic et comics sont séparés. Comment pourrions nous rassembler les mots ayant la même racine ? Modifier la définition de l'index pour ajouter ce nouveau analyzer.