Site web de jdd

Recent Changes - Search:
Doc /

OCRAvecLinux

Noter qu'importer le document dans Google drive puis clic droit, ouvrir dans google docs donne de très bons résultats (meilleurs que tesseract)

Le principal programme de reconnaissance de caractères sous Linux est "Tesseract".

tesseract ~/<nom_de_l_image.tif> <nom_du_fichier_de_sortie_sans_l_extension> -l fra

for i in *.jpg ; do tesseract -l fra $i $i; done;

-l eng (pour l'anglais)