Differences between revisions 15 and 16
Revision 15 as of 2005-01-13 07:20:26
Size: 6165
Editor: anonymous
Comment:
Revision 16 as of 2005-04-03 12:07:26
Size: 6356
Editor: anonymous
Comment:
Deletions are marked like this. Additions are marked like this.
Line 103: Line 103:
 * ''slrn n'affiche plus les accents''

Il semble que, à la date d'avril 2005, slrn et unicode étaient encore [http://lists.debian.org/debian-user-french/2005/04/msg00123.html fâchés].

?DebianFrench [UTF-8]


Debian et UTF8

Question introductive

Heu... ça veut dire quoi « passer en ["UTF8"] » ? Pourquoi ?

Tester votre installation

  wget http://www.melkor.dnp.fmph.uniba.sk/~garabik/debian-utf8/HOWTO/download/UTF-8-demo.txt.gz

 zcat UTF-8-demo.txt.gz

Passer à UTF-8 sous debian

Cette page est née des échanges sur la liste de diffusion [debian-user-french http:index.cgi?DebFrFrenchLists] à propos d'UTF-8. Elle comporte des liens vers les fils de discussions originaux, qui peuvent éventuellement apporter un complément d'information.

Cette page est focalisée sur les problèmes de transition, certains des problèmes évoqués n'apparaîtront (heureusement) pas à l'installation d'une debian toute fraîche.

Méthode suivie :

La [http://dspnet.fr.eu.org/~lonewolf/LinuxJapan/Howto_English_Japanese.html page de Guillaume "?LoneWolf" Estival] (en anglais) explique la marche à suivre.

en résumé :

  • Installer les paquets nécessaires à la prise en charge de la saisie et de l'affichage. C'est à dire ??
  • Installer les locales et l'utilitaire « debian » de changement des locales.

  apt-get install locales
  dpkg-reconfigure locales
  • Reconfigurer l'environnement de manière à passer en locales « utf-8 ». On mets quelle(s) valeur(s) ?

Au final, cela donne :

    $ locale
    LANG=fr_FR.UTF-8
    LC_CTYPE="fr_FR.UTF-8"
    LC_NUMERIC="fr_FR.UTF-8"
    LC_TIME="fr_FR.UTF-8"
    LC_COLLATE="fr_FR.UTF-8"
    LC_MONETARY="fr_FR.UTF-8"
    LC_MESSAGES="fr_FR.UTF-8"
    LC_PAPER="fr_FR.UTF-8"
    LC_NAME="fr_FR.UTF-8"
    LC_ADDRESS="fr_FR.UTF-8"
    LC_TELEPHONE="fr_FR.UTF-8"
    LC_MEASUREMENT="fr_FR.UTF-8"
    LC_IDENTIFICATION="fr_FR.UTF-8"
    LC_ALL=

attention, [ne pas utiliser la variante @euro http:''/lists.debian.org/debian-user-french/2004/08/msg02134.html] dans ce cas-là./

Cela peut entraîner une série de petits dysfonctionnements :

  • j'ai plein de caracteres moches en mode console.

Par défaut, la console n'accepte pas les caracteres encodés en UTF-8. Mais le lancement du script /usr/bin/unicode_start, contenu dans les paquets console-data et kbd, regle le probleme.

  • KDE n'a pas l'air de supporter utf-8.

Il y a la possibilité de passer à gnome, et en particulier au gnome-terminal, qui propose des onglets comme dans la konsole (multi-gnome-terminal, contrairement à ce que dit sa [http://packages.debian.org/unstable/gnome/multi-gnome-terminal description], est dépassé.).

  • xmms n'affiche plus sa liste de lecture.

La [http://lists.debian.org/debian-user-french/2004/07/msg01577.html solution] est de dire à xmms d'utiliser une autre police de caractère pour sa liste, comme -adobe-helvetica-medium-r-normal-'''-'''-80-'''-'''-p-*-iso10646-1. L'important est de sélectionner une police unicode. Pour ce faire, utilisez xfontsel et sélectionnez "iso10646" dans le menu "rgstry", puis "1" dans "encdng". Vous verrez alors apparaître le nombre de polices correspondant tout en haut. Affinez alors votre sélection en choisissant la taille en points, la famille et la graisse de la police...

  • man ne fonctionne plus très bien.

En fait si, mais il utilise less comme pageur, et certaines de ses versions sont fâchées avec l'utf8. Dans certains cas, le problème a été réglé avec l'installation de la version 382.

  • less ne fonctionne pas, malgré la mise à jour à une version récente.

Plus le temps passe, plus les fichiers de configurations accumulent des vieilleries. Bien vérifier les fichiers .bashrc et .bash_profile. La commande [wiki:?LESS =env || grep] permet de voir si des variables d'environnement ont été positionnées. Tester less dans une environnement où ces variables sont vides.

  • aspell ne détecte pas automatiquement l'encodage.

Il faut donc gentiement lui [http://lists.debian.org/debian-user-french/2004/07/msg01625.html préciser que l'on est en utf-8], avec l'option --encoding=utf-8. Ne vous laissez pas impressionner par les bugs à l'affichage, ils ne se retrouvent pas dans le fichier.

On peut aussi ajouter la ligne  encoding UTF-8 dans son fichier  ~/.aspell.conf

  • emacs devient un peu fou quand on essaye de saisir une lettre accentuée.

Les caractères latins accentués passent si on met les [http://lists.debian.org/debian-user-french/2004/08/msg02104.html commandes appropriées] dans son .emacs. La saisie de certains caractères orientaux comme les [http://fr.wikipedia.org/wiki/Hiragana hiraganas] est possible, mais les [http://fr.wikipedia.org/wiki/Kanji kanjis] refusent obstinément de renter. Alternative : il existe d'ailleurs un moyen de [http://lists.debian.org/debian-user-french/2004/07/msg01548.html demander à vi de se comporter comme emacs]: c'est le paquet vimacs.

  • J'ai vu vi afficher des caractères utf8, mais chez moi, ça ne veut pas.

[http://lists.debian.org/debian-user-french/2004/08/msg02002.html Il existe plusieurs versions de vi]. Pour voir celle que vous utilisez, il faut entrer ls -l /etc/alternatives/vi dans un terminal. nvi, la version par défaut, ne fonctionne pas. Il vous faut vim, Vi !["IMproved"].

  • Le moindre fichier nouveau contenant des accent est encodé en utf8.

Cela pose de très gros problèmes de partage de données ! Heureusement, [http://lists.debian.org/debian-user-french/2004/07/msg01592.html il existe des convertisseurs]. Pour me simplifier la vie, j'ai mis alias unutf='recode UTF-8..ISO-8859-15' suivant dans mon .bashrc.

  • Des caractères utf8 sont envoyés aux terminaux virtuels distants, alors qu'ils ne les comprennent pas.

Il faut [http://lists.debian.org/debian-user-french/2004/07/msg01663.html insérer un filtre] entre le shell et le terminal distant, avec la commande suivante luit (paquet [http://packages.debian.org/unstable/x11/xutils xutils]). Par exemple, LC_ALL=fr_FR luit ssh -C login@machine.

  • slrn n'affiche plus les accents

Il semble que, à la date d'avril 2005, slrn et unicode étaient encore [http://lists.debian.org/debian-user-french/2005/04/msg00123.html fâchés].


Charles Plessy