MediaWiki:Cirrussearch-morelikethis-settings

De Biodivers
Aller à : navigation, rechercher
#
# Ce message permet de configurer les options de la fonctionnalité "Articles Similaires" (Préfixe spécial "morelike:").
# Les changements sont pris en compte immédiatement.
# La syntaxe est la suivante :
#  * Tout ce qui suit un caractère "#" jusqu'à la fin de ligne est considéré comme un commentaire.
#  * Toutes les lignes non vides comportent le nom du paramètre suivi d'un ":" puis de la valeur du paramètre.
# Les paramètres sont :
#  * min_doc_freq (entier) : Nombre minimal de documents qu'un terme doit avoir (par mot) pour être considéré.
#  * max_doc_freq (entier) : Nombre maximal de documents qu'un terme doit avoir (par mot) pour être considéré.
#                  Les termes avec un grand nombre de documents sont généralement des "mots vides".
#  * max_query_terms (entier) : Nombre maximal de termes à considérer. Cette valeur est limitée par $wgCirrusSearchMoreLikeThisMaxQueryTermsLimit (100).
#  * min_term_freq (entier) : Nombre d'occurrences minimal qu'un terme doit avoir dans le document pour être considéré. Pour les petits champs (title) cette valeur doit être 1.
#  * minimum_should_match (pourcentage de -100% à 100% ou entier - nombre de termes): la quantité de termes devant correspondre. Par défaut 30%.
#  * min_word_len (entier) : La taille minimale d'un terme pour être considéré. Valeur par défaut à 0.
#  * max_word_len (entier) : La taille maximale d'un terme pour être considéré. Sans limite par défaut (0).
#  * fields (liste de valeurs séparées par des virgules) : ce sont les champs à utiliser. Les champs autorisés sont "title" (titre), "text" (contenu), "auxiliary_text" (contenu complémentaire), "opening_text" (aperçu), "headings" (entête) et "all" (tout).
#  * use_fields (true|false) : Indique à l'algorithme de n'utiliser que les valeurs présentes dans les champs. Faux (false) par défaut : le système extrait le contenu du champ "text" pour construire la requête.
# Exemple de configuration correcte :
# min_doc_freq:2
# max_doc_freq:20000
# max_query_terms:25
# min_term_freq:2
# minimum_should_match:30%
# min_word_len:2
# max_word_len:40
# fields:text,opening_text
# use_fields:true
#