Qual è la soluzione OCR migliore e più semplice?

63

Mi piacerebbe scansionare una buona quantità di carte che ho in giro, con il minimo dispiacere possibile. Mi piacerebbe convertirli in immagini usando Simple Scan, quindi convertirli in testo usando OCR. C'è una buona app OCR con una GUI che mi darà buoni risultati con la semplice pressione di un pulsante?

    
posta Bou 05.12.2010 - 11:32

7 risposte

62
  • GOCR da è un programma OCR (Optical Character Recognition). Converte le immagini scansionate del testo in file di testo.

  • CLARA è un'altra buona opzione grafica.

  • OCRAD from è un OCR può essere utilizzato come applicazione console standalone o come back-end per altri programmi.

  • KOOKA da è un'applicazione KDE ma funziona bene, inoltre devi installare programmi OCR reali come GOCR e OCRAD. Dopo aver installato Kooka e i programmi OCR, devi indirizzare Kooka al percorso di installazione OCR in modo che sia in grado di convertire Da JPEG a testo.

  • OCRFeeder da è un'analisi del layout del documento e un sistema di riconoscimento ottico dei caratteri.

  • Tesseract da è l'utilità della riga di comando ed è molto semplice da utilizzare. Puoi installare il pacchetto di lingua tesseract-ocr-eng da < a href="http://apt.ubuntu.com/p/tesseract-ocr-eng"> qui .

Dai un'occhiata a questa pagina .

Nota:
Per eseguire il terminale goto tesseract e digitare il seguente

tesseract imagefile.tif outputfile.txt

Tesseract può solo leggere un file TIFF - se hai un file JPEG o PDF o qualsiasi altra cosa, dovrai convertirlo. Inoltre, l'estensione del nome file deve essere .tif, non .tiff, altrimenti errori di tesseract.

    
risposta data karthick87 05.12.2010 - 11:38
8

linux-intelligente-OCR-soluzione

disclaimer - Sono strettamente connesso allo sviluppo di questa soluzione opensource

Lios può convertire la stampa in testo utilizzando uno scanner o una fotocamera.

Può anche produrre testo da immagini scansionate da altre fonti come Pdf, Immagine o Cartella contenente immagini.

Il programma riceve totale accessibilità per ipovedenti.

Dato che sono strettamente connesso - mi piacerebbe un feedback.

risposta data Nalin.x.Linux 13.11.2012 - 02:57
8

Ci sono pochi strumenti da riga di comando OCR popolari che puoi usare (non sono sicuro che abbiano una GUI):

  • Tesseract ( Leggimi , Domande frequenti ) (Python)

    Disponibile anche per: Tesseract .NET , Tesseract iOS

      

    Un motore OCR sviluppato in HP Labs tra il 1985 e il 1995 ...   e ora su Google. Tesseract è probabilmente l'open source più accurata   Motore OCR disponibile.

    Utilizzo:

    tesseract [inputFile] [outputFile] [-l optionalLanguageFile] [PathTohOCRConfigFile]
    
  • GOCR

      

    Riconoscimento di caratteri open source. Converte le immagini di testo scansionate   torna ai file di testo. GOCR può essere utilizzato con diversi front-end, che   rende molto facile il porting a diversi SO e architetture. Può   aprire molti formati di immagine diversi e la sua qualità è migliorata   su base giornaliera.

  • OCRopus ™ ( FAQ ) (scritto in Python, NumPy e SciPy)

      

    Sistema OCR incentrato sull'uso di   machine learning su larga scala per affrontare i problemi nel documento   analisi, con analisi di layout a innesto, riconoscimento di caratteri collegabili, modellazione statistica del linguaggio naturale e capacità multilingue.

         

    Il motore OCRopus si basa su due progetti di ricerca: a   riconoscimento della grafia ad alte prestazioni sviluppato a metà degli anni '90 e   distribuito dall'ufficio del Censimento degli Stati Uniti e un nuovo layout ad alte prestazioni   metodi di analisi.

         

    OCRopus è lo sviluppo è sponsorizzato da Google ed è inizialmente   inteso per gli sforzi di conversione dei documenti ad alto volume, ad alto volume.   Prevediamo che sarà anche un eccellente sistema OCR per molti altri   applicazioni.

  • Tessnet2 (Open source, OCR, Tesseract, .NET, DOTNET, C #, VB.NET, C ++ / CLI)

      

    Tesseract è un motore OCR open source C ++. Tessnet2 è un assembly .NET   che espongono metodi molto semplici per fare OCR. Tessnet2 è sotto licenza Apache 2 (come tesseract), il che significa che puoi usarlo come vuoi, incluso nei prodotti commerciali.

Pochi altri: ABBYY CLI OCR per Linux , Asprise OCR

Per un elenco più completo, controlla: Elenco del software di riconoscimento ottico dei caratteri su Wikipedia

Vedi anche: wanghaisheng/awesome-ocr - Un elenco completo di risorse OCR promettenti su GitHub.

    
risposta data kenorb 19.09.2014 - 14:04
6

Gscan2PDF

OCR su PDF multipagina o documenti scansionati

Questo è probabilmente il modo più semplice. Gscan2pdf è uno strumento grafico che ti consente non solo di scansionare i file, ma anche di importare file ed eseguire OCR su di essi. Installa gscan2pdf da qui , da Ubuntu Software Center o eseguendo questo comando in un terminale:

sudo apt-get install gscan2pdf
  • Esegui gscan2pdf
  • Importa il pdf (Ctrl + O)
  • Opzionale: strumenti & gt; Pulisci
  • Scegli Strumenti & gt; Salva OCR (Ctrl + S)

Gscan2PDF può utilizzare motori OCR personalizzabili, il valore predefinito è tesseract-ocr

Potresti prendere in considerazione la scelta della lingua appropriata. In tal caso dovrai installare il pacchetto tesseract-ocr-LANG , dove LANG è il codice lingua ISO 639-2 a tre lettere. In questo momento hai 108 lingue sul repository 16.04.

  • Source
risposta data mxdsp 03.02.2016 - 21:54
2

Ho appena avuto successo (meno di 16.04) con pdfocr.rb . Questo è elencato su wiki di Ubuntu

Ecco un ppa ma il repository per 16.04 non viene aggiornato. Lo script ruby ​​sopra di github funziona ancora con 16.04.

Puoi scaricarlo da Github. Avrai bisogno dei seguenti pacchetti installati:

ruby tesseract-ocr pdftk exactimage

ha quindi reso eseguibile pdfocr.rb e ha eseguito:

./pdfocf.rb -i source.pdf -o output.pdf

Opzionalmente puoi usare il parametro -l LANG . In tal caso dovrai installare il pacchetto tesseract-ocr-LANG , dove LANG è il codice lingua ISO 639-2 a tre lettere. In questo momento hai 108 lingue sul repository 16.04.

    
risposta data user75505 16.11.2016 - 20:58
2

Il modo migliore e più semplice per utilizzare pypdfocr è di non modificare il pdf. pypdfocr è un link al modulo python qui.

pypdfocr your_document.pdf

Alla fine avrai un altro your_document_ocr.pdf nel modo in cui lo vuoi con testo ricercabile. L'app non cambia la qualità dell'immagine. Aumenta un po 'la dimensione del file aggiungendo il testo di sovrapposizione.

Penso che il comando sia abbastanza semplice da non richiedere alcuna GUI. Forse l'installazione di pypdfocr è un po 'più prolissa:

sudo apt install tesseract-ocr 
pip install pypdfocr 
    
risposta data Eduard Florinescu 03.02.2018 - 20:04
0

gscan2pdf include 3 diversi motori ocr. È possibile eseguire la scansione direttamente sul programma o importare il pdf nel programma. Ho trovato che il motore di Tesseract funziona alla grande e molto facile da usare

    
risposta data Vince West 20.11.2014 - 16:45

Leggi altre domande sui tag