J’installe les différentes versions de Dolibarr depuis des années (de la version 5 à l’actuelle 22 !) et il m’a toujours été difficile—et je pense que c’est le cas pour beaucoup d’entre nous—de bien comprendre quel CHARSET et quelle COLLATE utiliser lors de la création d’une nouvelle base de données MySQL ou MariaDB pour Dolibarr.
Mais aujourd’hui, grâce aux moteurs de recherche intelligents basés sur l’IA (je recommande vivement d’essayer la version payante de Perplexity si vous ne la connaissez pas), j’ai enfin pu obtenir une réponse claire en installant un Dolibarr 22 à partir de zéro.
Version courte
La commande recommandée pour créer la base de données est :
CREATE DATABASE dolibarr22
DEFAULT CHARACTER SET utf8mb4
COLLATE utf8mb4_unicode_ci;
Si vous cherchez dans ce forum, vous trouverez des réponses variées, car la bonne pratique a évolué avec le temps, au fur et à mesure des avancées technologiques (matériel, MySQL, MariaDB).
Version détaillée
Voici la réponse TRÈS BIEN DOCUMENTÉE de Perplexity, qui explique en détail les différences entre l’utilisation du *CHARSET * et du COLLATE mentionnés (ou d’autres), qui influencent la précision des recherches et des tris de données, et qui, par le passé (mais plus maintenant), affectaient aussi les performances:
Avertissement : Je ne fais pas partie des développeurs officiels de Dolibarr. Si Eldy ou quelqu’un d’autre estime que je me trompe ou qu’une correction est nécessaire, n’hésitez pas à intervenir !
Merci pour ce lien @Beers mais il me semble qu’il s’agit de documentation MariaDB pour ArchLinux plutôt que de documentation spécifique à Dolibarr. Avant de publier sur les forums, j’ai l’habitude de faire mes recherches d’abord, et j’ai commencé par consulter le wiki officiel d’installation de Dolibarr où je n’ai rien trouvé à ce sujet - peut-être que l’information n’y figure pas ou est obsolète.
Quoi qu’il en soit, je recommande la lecture de l’analyse que Perplexity a réalisée après avoir consulté une dizaine de sources comparant les avantages et inconvénients entre utf8mb3 et utf8mb4, ainsi qu’entre utf8mb4_general_ci et utf8mb4_unicode_ci. Avant de lire cette analyse, je n’avais jamais vraiment compris la différence entre eux ni les implications du choix de l’un ou l’autre.
C’est d’ailleurs pour cela que j’ai créé ce post - pour que d’autres puissent en apprendre davantage. Je pense que ton lien contribuera également à une meilleure compréhension du sujet. Merci à toi.
Perplexity comme n’importe quelle IA similaire ne peut pas faire une analyse, ni comparer des avantages et des inconvénients d’une configuration par rapport à une autre.
Les réponses fournies par les IA ne sont pas le résultat d’une réflexion, c’est juste un assemblage de textes construit à partir de sources diverses. Il n’y a aucune garantie qu’une telle réponse corresponde à quelque chose de correct.