MediaWiki:Cirrussearch-morelikethis-settings
De Biodivers
#
# Ce message permet de configurer les options de la fonctionnalité "Articles Similaires" (Préfixe spécial "morelike:"). # Les changements sont pris en compte immédiatement. # La syntaxe est la suivante : # * Tout ce qui suit un caractère "#" jusqu'à la fin de ligne est considéré comme un commentaire. # * Toutes les lignes non vides comportent le nom du paramètre suivi d'un ":" puis de la valeur du paramètre. # Les paramètres sont : # * min_doc_freq (entier) : Nombre minimal de documents qu'un terme doit avoir (par mot) pour être considéré. # * max_doc_freq (entier) : Nombre maximal de documents qu'un terme doit avoir (par mot) pour être considéré. # Les termes avec un grand nombre de documents sont généralement des "mots vides". # * max_query_terms (entier) : Nombre maximal de termes à considérer. Cette valeur est limitée par $wgCirrusSearchMoreLikeThisMaxQueryTermsLimit (100). # * min_term_freq (entier) : Nombre d'occurrences minimal qu'un terme doit avoir dans le document pour être considéré. Pour les petits champs (title) cette valeur doit être 1. # * minimum_should_match (pourcentage de -100% à 100% ou entier - nombre de termes): la quantité de termes devant correspondre. Par défaut 30%. # * min_word_len (entier) : La taille minimale d'un terme pour être considéré. Valeur par défaut à 0. # * max_word_len (entier) : La taille maximale d'un terme pour être considéré. Sans limite par défaut (0). # * fields (liste de valeurs séparées par des virgules) : ce sont les champs à utiliser. Les champs autorisés sont "title" (titre), "text" (contenu), "auxiliary_text" (contenu complémentaire), "opening_text" (aperçu), "headings" (entête) et "all" (tout). # * use_fields (true|false) : Indique à l'algorithme de n'utiliser que les valeurs présentes dans les champs. Faux (false) par défaut : le système extrait le contenu du champ "text" pour construire la requête. # Exemple de configuration correcte : # min_doc_freq:2 # max_doc_freq:20000 # max_query_terms:25 # min_term_freq:2 # minimum_should_match:30% # min_word_len:2 # max_word_len:40 # fields:text,opening_text # use_fields:true #