?DebianFrench [UTF-8]
Debian et UTF8
Question introductive
Heu... ça veut dire quoi « passer en ["UTF8"] » ? Pourquoi ?
Tester votre installation
wget http://www.melkor.dnp.fmph.uniba.sk/~garabik/debian-utf8/HOWTO/download/UTF-8-demo.txt.gz
zcat UTF-8-demo.txt.gz
Passer à UTF-8 sous debian
Cette page est née des échanges sur la liste de diffusion ?DebianUserFrench à propos d'UTF-8. Elle comporte des liens vers les fils de discussions originaux, qui peuvent éventuellement apporter un complément d'information.
Cette page est focalisée sur les problèmes de transition, certains des problèmes évoqués n'apparaîtront (heureusement) pas à l'installation d'une debian toute fraîche.
Méthode suivie :
La [http://dspnet.fr.eu.org/~lonewolf/LinuxJapan/Howto_English_Japanese.html page de Guillaume "?LoneWolf" Estival] (en anglais) explique la marche à suivre.
en résumé :
- Installer les paquets nécessaires à la prise en charge de la saisie et de l'affichage. C'est à dire ??
- Installer les locales et l'utilitaire « debian » de changement des locales.
apt-get install locales dpkg-reconfigure locales
- Reconfigurer l'environnement de manière à passer en locales « utf-8 ». On mets quelle(s) valeur(s) ?
Au final, cela donne :
$ locale LANG=fr_FR.UTF-8 LC_CTYPE="fr_FR.UTF-8" LC_NUMERIC="fr_FR.UTF-8" LC_TIME="fr_FR.UTF-8" LC_COLLATE="fr_FR.UTF-8" LC_MONETARY="fr_FR.UTF-8" LC_MESSAGES="fr_FR.UTF-8" LC_PAPER="fr_FR.UTF-8" LC_NAME="fr_FR.UTF-8" LC_ADDRESS="fr_FR.UTF-8" LC_TELEPHONE="fr_FR.UTF-8" LC_MEASUREMENT="fr_FR.UTF-8" LC_IDENTIFICATION="fr_FR.UTF-8" LC_ALL=
attention, [ne pas utiliser la variante @euro http:''/lists.debian.org/debian-user-french/2004/08/msg02134.html] dans ce cas-là./
Par défaut, les console 2 à 6 n'acceptent pas les caracteres encodés en UTF-8 ([http://bugs.debian.org/cgi-bin/bugreport.cgi?bug=271013 bug #271013]). Mais le lancement du script /usr/bin/unicode_start, contenu dans les paquets console-data et kbd, regle le probleme. Il y a eu une [http://lists.debian.org/debian-user-french/2005/09/msg00354.html conversation] à ce sujet sur ?DebianUserFrench. Les programmes ont parfois du mal à savoir comment sont encodés les noms de fichiers. Avec Gnome, il faut éventuellement [http://lists.debian.org/debian-user-french/2005/09/msg00915.html rajouter dans son environnement] G_FILENAME_ENCODING=@locale. Pour régler définitivement le problème, il est aussi possible de [http://lists.debian.org/debian-l10n-french/2005/09/msg00210.html convertir] les noms de fichier à l'aide de l'utilitaire convmv. La [http://lists.debian.org/debian-user-french/2004/07/msg01577.html solution] est de dire à xmms d'utiliser une autre police de caractère pour sa liste, comme -adobe-helvetica-medium-r-normal-'''-'''-80-'''-'''-p-*-iso10646-1. L'important est de sélectionner une police unicode. Pour ce faire, utilisez xfontsel et sélectionnez "iso10646" dans le menu "rgstry", puis "1" dans "encdng". Vous verrez alors apparaître le nombre de polices correspondant tout en haut. Affinez alors votre sélection en choisissant la taille en points, la famille et la graisse de la police... En fait si, mais il utilise less comme pageur, et certaines de ses versions sont fâchées avec l'utf8. Dans certains cas, le problème a été réglé avec l'installation de la version 382. Plus le temps passe, plus les fichiers de configurations accumulent des vieilleries. Bien vérifier les fichiers .bashrc et .bash_profile. La commande [wiki:?LESS =env || grep] permet de voir si des variables d'environnement ont été positionnées. Tester less dans une environnement où ces variables sont vides. C'est surtout visible sur des [http://lists.debian.org/debian-devel-french/2005/09/msg00029.html ordinateurs peu véloces]. Mettre LC_ALL=C devant la commande peut régler le problème. Il faut donc gentiement lui [http://lists.debian.org/debian-user-french/2004/07/msg01625.html préciser que l'on est en utf-8], avec l'option --encoding=utf-8. Ne vous laissez pas impressionner par les bugs à l'affichage, ils ne se retrouvent pas dans le fichier. On peut aussi ajouter la ligne encoding UTF-8 dans son fichier ~/.aspell.conf Les caractères latins accentués passent si on met les [http://lists.debian.org/debian-user-french/2004/08/msg02104.html commandes appropriées] dans son .emacs. La saisie de certains caractères orientaux comme les [http://fr.wikipedia.org/wiki/Hiragana hiraganas] est possible, mais les [http://fr.wikipedia.org/wiki/Kanji kanjis] refusent obstinément de renter. Alternative : il existe d'ailleurs un moyen de [http://lists.debian.org/debian-user-french/2004/07/msg01548.html demander à vi de se comporter comme emacs]: c'est le paquet vimacs. [http://lists.debian.org/debian-user-french/2004/08/msg02002.html Il existe plusieurs versions de vi]. Pour voir celle que vous utilisez, il faut entrer ls -l /etc/alternatives/vi dans un terminal. nvi, la version par défaut, ne fonctionne pas. Il vous faut vim, !ViIMproved. Cela pose de très gros problèmes de partage de données ! Heureusement, [http://lists.debian.org/debian-user-french/2004/07/msg01592.html il existe des convertisseurs]. Pour me simplifier la vie, j'ai mis alias unutf='recode UTF-8..ISO-8859-15' suivant dans mon .bashrc. Il faut [http://lists.debian.org/debian-user-french/2004/07/msg01663.html insérer un filtre] entre le shell et le terminal distant, avec la commande suivante luit (paquet [http://packages.debian.org/unstable/x11/xutils xutils]). Par exemple, LC_ALL=fr_FR luit ssh -C login@machine. Il semble que, à la date d'avril 2005, slrn et unicode étaient encore [http://lists.debian.org/debian-user-french/2005/04/msg00123.html fâchés]. Le support de l'UTF-8 est apparu dans zsh 4.3 (paquet zsh-beta de Sid), mais [http://lists.debian.org/debian-user-french/2005/09/msg01937.html il faut l'activer] dans la configuration en mettant 'setopt printeightbit' dans le fichier .zshrc. C'est normal, aucune de police de caractères ne contient tous les caractères. Il faut donc [http://lists.debian.org/debian-user-french/2006/07/msg00000.html installer des polices supplémentaires]. Cela peut entraîner une série de petits dysfonctionnements :