Lo que he aprendido: bash script para pasar de html a texto

Esto que traigo hoy es un script que hice con mi hermano hace tiempo para pasar de un archivo html a un txt con líneas de longitud máxima 75 caracteres. ¿Para qué hice esto? Pues porque soy parte del equipo de traducción al español de GNU y usamos un programa que se llama Poedit que nos facilita las cosas a la hora de traducir y exporta en html. La cuestión es que luego nuestras traducciones van a una lista de correo para su revisión y ¡oh sorpresa! tienen que ser texto plano con líneas de longitud máxima 75 caracteres.

Así que después de escribir esos comandos en la consola dos veces me cansé y le pedí ayuda para hacer un pequeño script. Ahí va:


#!/bin/bash

if [ "$1" == "-h" ]
then
echo "Pasa html a txt y formatea línea a 75 caracteres. Uso: formato pathHtmlEntrada pathHtmlSalida.txt"
exit 0
fi

html2markdown $1 |fmt -w 75 > $2

Como veis, lo único que hace es usar html2markdown para pasar a texto, formatea el tamaño de la línea y lo escribe en un archivo. En sí no hace falta que sea un txt pero bueno, así no tengo problemas si luego lo quiero leer en Windows.

Le damos los permisos de ejecución con chmod, como en mi caso el archivo se llama formato:


chmod 777 formato

¡Y ya podemos usarlo!


./formato texto.html texto.txt

Nada mal para alguien que viene de la carrera de la piedra y el palo. Ya lo saben señores, pongan un teleco en sus vidas, les solucionará problemas y luego podrán apropiarse de sus logros en Internet 😉

Anuncios

2 pensamientos en “Lo que he aprendido: bash script para pasar de html a texto

¡Opina sin miedo! (Puedes usar Markdown)

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s