Corregir ‘codificación no valida’ masivamente con convmv

codificación no valida

A todos o a casi todos nos a pasado alguna vez tener un problema con los archivos mp3 o de texto donde nuestro SO GNU/Linux no reconoce tildes, o letras especificas como la ñ y los cambia por un símbolo ‘?’ agregando, ademas, la leyenda “Codificación no válida” al final de dicho archivo.

Bueno, ese “error” como siempre cabe suponer, no tiene nada que ver con nuestro sistema operativo pero No. El problema es que estos archivos fueron comprimidos o creados en Window$ que usa su propio formato de codificación Windows-1252 para idiomas occidentales, Windows-1253 para griego, Windows-1254 para turco, Windows-1256 para árabe… etc, mientras los demás OS como GNU/Linux, MacOsx y el resto utiliza UTF-8 el cual usa un estándar, llamado Unicode, creado y adoptado por la mayoría de empresas del sector, y diseñado para facilitar el tratamiento informático, transmisión y visualización de textos de múltiples lenguajes y disciplinas técnicas además de textos clásicos de lenguas muertas.

O sea para que quede claro no se trata de un problema de Linux si no mas bien QUE WINDOWS UNA VES MAS CREA INCOMPATIBILIDADES CON OTROS SISTEMAS.

PASEMOS A LA SOLUCIÓN!!

RENOMBRAR LOS ARCHIVOS!!

El problema,es que a veces hay muchos archivos así, para andar buscándolos uno por uno y renombrarlos puede ser un trabajo muy tedioso. Para esas situaciones existe una herramienta que, con un simple comando identificará cada archivo con este problema y lo reparará: convmv

Para instalarla solo hace falta tipear (en Debian, Ubuntu y deribados)

sudo apt-get install convmv

Luego abrimos terminal en el directorio o partición donde queremos que se ejecute le damos

find . -name '?' | xargs convmv -r --notest -f cp850 -t UTF-8

Fuente