Réencodage d'une arborescence vers l'UTF-8

(pour l'instant c'est une page rapidement écrite, je verrai plus tard si j'ai le temps de faire mieux)

Script bash pour convertir toute une arborescence d'un encodage dans un autre.

Le passage de Mandriva 2006 à Mandriva 2007, en particulier, occasionne bien des soucis avec les fichiers créés sous l'ancien système.

En effet, Mandriva 2006 utilise l'encodage ISO-xxx (ISO-8859-1 ou 15 pour le français) et Mandriva 2007 utilise l'encodage UTF-8 dont certains caractères sont codés sur 2 octets (caractères accentués notamment). D'où des problèmes d'affichage du nom et du contenu des fichiers codés ISO-8859-1 sous un système qui lit en UTF-8....

2 solutions :

Il existe des outils pour faire ces tâches :

Tous ces programmes sont installables avec la distribution Mandriva (par rpmdrake via le centre de contrôle Mandriva ou par urpmi conmv iconv)

J'ai créé un petit script Bash pour faire la conversion « nom + contenu » sur toute une arborescence. Voici ce qu'il fait :

1- pour toute l'arborescence donnée en paramètre il convertit les noms de fichiers et de répertoires (convmv).

2- il descend dans l'arborescence et pour chaque fichier il lit le charset (file -i), si celui-ci est différent du charset visé (UTF-8) il convertit le fichier (en conservant la date et les droits).

Le script : par ici en couleur ou en simple texte. (mise à jour : 17/03/2007)

Utilisation :

FAITES UNE COPIE DE VOS FICHIERS ET TRAVAILLEZ SUR LA COPIE

$ ./convertEnc.sh chemin/vers/dossier

Bugs :

Mise à jour :

Mandriva a publié un script Perl pour effectuer la conversion des noms de fichiers. Il est disponible ici : http://qa.mandriva.com/twiki/bin/view/Main/MandrivaLinux2007Errata#UTF8_issue_when_reinstalling_and. Notez bien qu'il ne convertit que les noms de fichiers et pas le contenu !

Discussion :

Pour l'instant je n'ai pas mis de blog (ou forum, l'installation des modules sur les sites free.fr est en panne visiblement....) sur ce site, donc les discussions sont sur le forum Mandriva, sujets Logiciels Divers / MAJ -> 2007 : UTF-8 et Conversion fichiers ISO vers UTF8.

Toute suggestion, amélioration sont bienvenues sur ce forum....