[successivo] [precedente] [inizio] [fine] [indice generale] [hall of fame] [indice analitico] [parte]


Capitolo 7.   Editoria

7.1   Conversione tra formati

7.1.1)   Come si può convertire un file HTML in txt?

Per trasformare le pagine da formato HTML a formato testo si utilizzare Lynx:

lynx -dump pagina.html > pagina.txt[Invio]

7.2   I file PostScript (.ps)

7.2.1)   Come si visualizzano i file PostScript in MS-Windows?

Esistono versioni di Ghostscript per i vari sistemi operativi. Esiste ad esempio Ghostview per MS-Windows.

I siti di riferimento sono: <http://www.cs.wisc.edu/~ghost/gsview/index.html> o <http://www.research.att.com/~jba/ghost/win95.html>.

7.3   I file .pdf

7.3.1)   Perché in GNU/Linux con Xpdf i file PDF vengono visualizzati male?

Se, nel tentare di aprire un file PDF si dovesse riscontrare un'incongruenza nell'ambito dei caratteri, si dovrà propendere per l'ipotesi che non ci sono sul sistema i caratteri adatti per visualizzarlo. In genere conviene usare caratteri convenzionali per aumentare la compatibilità, oppure installare anche i caratteri TrueType sotto GNU/Linux. Si deve inoltre ricordare che quando si converte da .dvi a PDF è bene utilizzare caratteri Type1 con il tfm (TeX font metric) ricompilato a dovere. Generalmente vengono usati i caratteri Type3 che sono bitmap e non vettoriali e da questi segue l'effetto sgranato quando si vedono i documenti PDF con xpdf.

7.4   I File .sgml

7.4.1)   Perché con sgml2txt si trovano spesso parole con lettere ripetute? Si tratta di un'interpretazione scorretta?

Se nell'utilizzo del comando sgml2txt si dovessero riscontrare alcune parti di testo con lettere ripetute, occorrerà aggiungere l'opzione -f al comando sgml2txt.

7.5   I file .doc

7.5.1)   Come si leggono e stampano i documenti Microsoft Word in GNU/Linux?

Per leggere documenti Microsoft Word (.DOC) esistono in GNU/Linux diversi applicativi.

Per Gnome esiste AbiWord (1) un applicativo grafico molto promettente;

da riga di comando si può utilizzare catdoc (2) che si limita ad una conversione. Ne esiste anche un visualizzatore Tcl/Tk;

sempre per la riga di comando troviamo wv (3) spesso noto come mswordview che in pratica non è altro che una libreria che interpreta documenti Microsoft Word 2 000, 97, 95 e 6. Viene utilizzato da AbiWord per importare i documenti. Questo programma inoltre converte in HTML;

troviamo inoltre Antiword (4) che esiste anche per sistemi BeOS e RISC OS. Questo programma converte i documenti in formato Microsoft Word 2 000, 97, 7 e 6 in formato testo o in Postscript.

Occorre senza dubbio ricordare che un modo per aumentare la compatibilità è in ogni caso usare il formato RTF e non il .DOC. Il formato RTF è liberamente accessibile da programmi appositi quali ad esempio Ted (5).

7.6   Compatibilità formati GNU/Linux-Dos

7.6.1)   Perché aprendo con Emacs alcuni file di testo creati con programmi Dos, compaiono una serie di ^M alla fine di ogni riga?

Il carattere di fine riga in sistemi GNU/Linux è il carattere LF, mentre nel Dos è la coppia di caratteri CR e LF. Quando si importano file di testo dal Dos si dovrà usare il comando:

mcopy -t file_dos.txt nuovo_nome.txt[Invio]

Il parametro «-t» informa il comando mcopy che il file da copiare è testuale, così nel trasferimento verranno messi a posto i caratteri di fine riga.

LDR --- Copyright © 1999-2001 Gaetano Paolone --  bigpaul @ linuxfaq.it

1) AbiWord   GPL

2) catdoc   GPL

3) wv   GPL

4) Antiword   GPL

5) Ted   GPL


Dovrebbe essere possibile fare riferimento a questa pagina anche con il nome editoria.html

[successivo] [precedente] [inizio] [fine] [indice generale] [hall of fame] [indice analitico]