Ottenere il conteggio delle parole di un documento pdf in Evince

19

C'è un modo per ottenere il conteggio delle parole di un documento PDF che sto visualizzando in Evince, il visualizzatore pdf predefinito di Ubuntu? Sono in grado di convertire i documenti in file di testo e ottenere il conteggio delle parole dal terminale, ma mi piacerebbe essere in grado di arrivare rapidamente a loro senza dover utilizzare il terminale. C'è qualche plugin in grado di farlo, o è già integrato e mi manca?

P.S. Preferirei non cambiare il mio viewer in quanto Evince è il visualizzatore PDF predefinito in Ubuntu, e mi piacerebbe fare il più possibile usando le applicazioni predefinite dal momento che molte di loro, Evince incluso, sono davvero belle.

    
posta Chris Wilson 08.11.2010 - 20:11
fonte

4 risposte

10

Una risposta di Olaf Leidinger sulla mailing list di Evince:

Penso che una tale caratteristica sia più adatta per i redattori di documenti, come hanno fatto loro più informazioni sul documento sono semplici visualizzatori e parole di conteggio banale. Prendi un file PDF come esempio. Quello che vedi come testo potrebbe effettivamente essere di qualche tipo di forma grafica vettoriale. Anche se il testo è contenuto come tale nel file PDF, quelle parole che vedi potrebbero essere composte da più "disegni di testo in posizione" (y, x) "- comandi - ad esempio in caso di dieresi o di fine riga. Quindi una sola parola potrebbe contare come più parole. Quindi penso che potrebbe essere difficile da implementare tale caratteristica in modo affidabile. Dai un'occhiata a pdftotext per vedere cosa intendo.
    
risposta data Chris Wilson 10.11.2010 - 12:22
fonte
26

Puoi farlo tramite la riga di comando:

pdftotext filename.pdf - | tr -d '.' | wc -w
    
risposta data Sid 08.11.2010 - 20:22
fonte
9

Che ne dici di uno script di bash rapido che richiede zenity ed evince. Se chiamato senza argomenti, ti darà una finestra di dialogo in modo da poter scegliere un file. Quando viene chiamato con un argomento (o dopo detta finestra di dialogo), aprirà entrambi il file in anteprima e ti darà una finestra di dialogo con un conteggio delle parole.

In altre parole, copia quanto segue in un file di testo, chiamato evince-word-count.sh o qualcosa, salvalo da qualche parte nel tuo percorso (es. ~/bin/ ), rendilo eseguibile (tramite il tasto destro di Nautilus e le proprietà o con chmod +x ~/bin/evince-word-count.sh ),

#!/bin/bash
if [ "$#" -gt "0" ] ; then
    filename=""
else
    filename="$(zenity --file-selection)"
fi
evince "$filename" &
zenity --info --text "This PDF has $(pdftotext "$filename" - | tr -d '.' | wc -w) words"
exit 0

Ora, fai clic con il tasto destro su alcuni su alcuni PDF in nautilus, scegli "Apri con ..." e aprilo con evince-word-count.sh. Ora, quando apri un PDF, si apriranno entrambi in anteprima e ti forniranno un conteggio delle parole.

    
risposta data frabjous 08.11.2010 - 23:14
fonte
4

Non credo sia possibile (beh è tecnicamente possibile ma non è stato implementato)

Devi ricordare che Evince è un documento viewer e un conteggio delle parole è una funzione più solitamente richiesta in un editor (sì, lo so che non è sempre così ).

Potresti voler contattare gli sviluppatori di Evince e chiedere se avrebbero interesse a implementare questa funzione.

    
risposta data 8128 08.11.2010 - 20:16
fonte

Leggi altre domande sui tag