phhsnews.com


phhsnews.com / 5 services OCR en ligne gratuits testés et revus

5 services OCR en ligne gratuits testés et revus


Avoir un document PDF ou une image que vous aimeriez convertir en texte? Récemment, quelqu'un m'a envoyé un document dans le courrier que j'avais besoin d'éditer et de renvoyer avec des corrections. La personne n'a pas pu localiser une copie numérique, alors j'ai été chargée de mettre tout ce texte en format numérique.

Je ne pouvais pas passer des heures à tout recopier, alors j'ai fini par prendre une belle photo de haute qualité du document, puis je me suis frayé un chemin à travers une série de services OCR en ligne pour voir lequel me donnerait le meilleur. résultats.

Dans cet article, je vais passer en revue quelques-uns de mes sites préférés pour l'OCR qui sont gratuits. Il convient de noter que la plupart de ces sites offrent un service gratuit de base et ont ensuite des options payantes si vous souhaitez des fonctionnalités supplémentaires telles que des images plus grandes, des documents PDF multipages, différentes langues de saisie, etc.

Il est également bon de savoir à l'avance que la plupart de ces services ne pourront pas correspondre à la mise en forme de votre document original. Ce sont principalement pour l'extraction de texte et c'est tout. Si vous avez besoin que tout soit dans une mise en page ou un format spécifique, vous devrez le faire manuellement une fois que vous aurez reçu tout le texte de l'OCR.

De plus, les meilleurs résultats pour obtenir le texte proviendront de documents avec une résolution de 200 à 400 DPI. Si vous avez une image PPP basse, les résultats ne seront pas aussi bons.

Enfin, il y avait beaucoup de sites que j'ai testés qui ne fonctionnaient tout simplement pas. Si vous accédez à Google OCR en ligne gratuitement, vous verrez un tas de sites, mais plusieurs des sites figurant dans les 10 premiers résultats n'ont même pas terminé la conversion. Certains expiraient, d'autres donnaient des erreurs et d'autres restaient bloqués sur la page "conversion", donc je n'ai même pas pris la peine de mentionner ces sites.

Pour chaque site, j'ai testé deux documents pour voir à quel point la sortie serait. Pour mes tests, j'ai simplement utilisé mon iPhone 5S pour prendre une photo des deux documents et ensuite les télécharger directement sur les sites Web pour la conversion.

Dans le cas où vous voulez voir à quoi ressemblaient les images que j'ai utilisées pour mon test, je les ai attachées ici: Test1 et Test2. Notez que ce ne sont pas les versions en résolution complète des images prises depuis le téléphone. J'ai utilisé l'image en pleine résolution lors du téléchargement sur les sites.

OnlineOCR

OnlineOCR.net est un site propre et simple qui a donné de très bons résultats dans mon test. La principale chose que j'aime à ce sujet est qu'il n'a pas des tonnes de publicités partout, ce qui est généralement le cas avec ces types de sites de services de niche.

Pour commencer, sélectionnez votre fichier et attendez la fin du téléchargement. La taille de téléchargement maximale pour ce site est de 100 Mo. Si vous vous inscrivez pour un compte gratuit, vous obtenez quelques fonctionnalités supplémentaires comme la plus grande taille de téléchargement, PDF multi-pages, différentes langues d'entrée, plus de conversions par heure, etc.

Ensuite, choisissez votre langue d'entrée, puis choisissez le format de sortie. Vous pouvez choisir parmi Word, Excel ou Texte brut. Cliquez sur le bouton Convertir et vous verrez le texte affiché en bas dans une boîte avec un lien de téléchargement.

Si tout ce que vous voulez est le texte, il suffit de le copier et le coller dans la boîte. Cependant, je vous suggère de télécharger le document Word, car il fait un excellent travail de conserver la mise en page du document original.

Par exemple, lorsque j'ai ouvert le document Word pour mon deuxième test, j'ai été surpris de constater que le document comprenait une table avec trois colonnes, comme dans l'image.

De tous les sites, celui-ci était de loin le meilleur. Il vaut vraiment la peine de vous inscrire si vous avez besoin de faire beaucoup de conversions.

Pour être complet, je vais également créer un lien vers les fichiers de sortie créés par chaque service afin que vous puissiez voir les résultats par vous-même. Voici les résultats de OnlineOCR: Test1 Doc et Test2 Doc.

Notez que lors de l'ouverture de ces documents Word sur votre ordinateur, Word affiche un message indiquant qu'il provient d'Internet et que la modification a été désactivée. Cela est parfaitement correct car Word ne fait pas confiance aux documents provenant d'Internet et vous n'avez pas vraiment besoin d'activer l'édition si vous voulez simplement voir le document.

i2OCR

I2OCR est un autre site qui a donné de très bons résultats. Le processus est très similaire: choisissez votre langue, fichier, puis appuyez sur Extraire le texte .

Vous devrez attendre une minute ou deux ici parce que ce site prend un peu plus de temps. En outre, à l'étape 2, assurez-vous que votre image est affichée dans l'aperçu, sinon vous obtiendrez un tas de charabia comme résultat. Pour une raison quelconque, les images de mon iPhone s'affichaient en mode portrait sur mon ordinateur, mais en mode paysage lorsque j'ai téléchargé sur ce site.

J'ai dû ouvrir manuellement l'image dans une application de retouche photo, la faire pivoter de 90 degrés, puis la faire pivoter vers le portrait, puis la sauvegarder de nouveau. Une fois terminé, faites défiler vers le bas et il vous montrera un aperçu du texte avec un bouton de téléchargement.

Ce site s'est plutôt bien comporté avec la sortie pour le premier test, mais n'a pas très bien réussi avec le second test qui avait la disposition des colonnes. Voici les résultats de i2OCR: Test1 Doc et Test2 Doc.

FreeOCR

Free-OCR.com prendra vos images et les convertira en texte brut. Il n'a pas d'option pour exporter au format Word. Choisissez votre fichier, sélectionnez une langue, puis cliquez sur Démarrer .

Le site est rapide et vous obtiendrez la sortie assez rapidement. Cliquez simplement sur le lien pour télécharger le fichier texte sur votre ordinateur.

Comme avec NewOCR mentionné ci-dessous, ce site capitalise tous les T dans le document. Je ne sais pas pourquoi ça ferait ça, mais pour une raison étrange ce site et NewOCR l'ont fait tous les deux. Ce n'est pas une grosse affaire de le changer, mais c'est un processus fastidieux que vous ne devriez vraiment pas avoir à faire.

Voici les résultats de FreeOCR: Test1 Doc et Test2 Doc.

ABBYY FineReader en ligne

Pour utiliser FineReader Online, vous devez vous inscrire à un compte, ce qui vous permet d'obtenir un essai gratuit de 15 jours à l'OCR jusqu'à 10 pages gratuitement. Si vous avez seulement besoin de faire une OCR unique pour quelques pages, vous pouvez utiliser ce service. Assurez-vous de cliquer sur le lien Vérifier dans l'e-mail de confirmation après votre inscription.

Cliquez sur Reconnaître en haut, puis sur Télécharger pour sélectionner votre fichier. Choisissez votre langue, le format de sortie, puis cliquez sur Reconnaître en bas. Ce site a une interface propre et aucune publicité aussi.

Dans mes tests, ce site a été capable de récupérer le texte du premier document de test, mais c'était absolument énorme quand j'ai ouvert le document Word, alors j'ai fini par le refaire et j'ai choisi le format texte comme texte de sortie.

Pour le deuxième test avec les colonnes, le document Word était vide et je ne pouvais même pas trouver le texte. Je ne sais pas ce qui s'est passé là-bas, mais il ne semble pas être capable de gérer autre chose que de simples paragraphes. Voici les résultats de FineReader: Test1 Doc et Test2 Doc.

NewOCR

Le site suivant, NewOCR.com, était OK, mais pas aussi bon que le premier site. Premièrement, il y a des publicités, mais heureusement pas une tonne. Vous sélectionnez d'abord votre fichier, puis cliquez sur le bouton Aperçu .

Vous pouvez ensuite faire pivoter l'image et ajuster la zone dans laquelle vous souhaitez numériser le texte. C'est un peu comme la façon dont le processus de numérisation fonctionne sur un ordinateur avec un scanner connecté.

Si le document comporte plusieurs colonnes, vous pouvez cocher le bouton d' analyse de la mise en page et tenter de diviser le texte en colonnes. Cliquez sur le bouton OCR, attendez quelques secondes pour qu'il se termine, puis faites défiler vers le bas lorsque la page est actualisée.

Dans le premier test, il a obtenu tout le texte correctement, mais pour une raison quelconque capitalisé chaque T dans le document! Aucune idée pourquoi ça ferait ça, mais ça l'a fait. Dans le deuxième test avec l'analyse de la page activée, il a obtenu la plupart du texte, mais la mise en page était complètement désactivée.

Voici les résultats de NewOCR: Test1 Doc et Test2 Doc.

Conclusion

Comme vous pouvez le voir, le free ne vous donne pas vraiment de très bons résultats la plupart du temps malheureusement. Le premier site mentionné est de loin le meilleur parce que non seulement il a fait un excellent travail de reconnaissance de tout le texte, mais il a également réussi à conserver le format du document original.

Si vous avez juste besoin de texte, cependant, la plupart des sites ci-dessus devraient être en mesure de le faire pour vous. Si vous avez des questions, n'hésitez pas à commenter. Prendre plaisir!


Comment contrôler plusieurs périphériques SmartThings à la fois avec des routines

Comment contrôler plusieurs périphériques SmartThings à la fois avec des routines

Si vous avez une poignée d'accessoires smarthome que vous voulez contrôler en même temps, vous pouvez instantanément modifier une poignée de choses dans votre maison en utilisant "Routines" dans l'application SmartThings en appuyant simplement sur un bouton SmartThings est une gamme de produits smarthome fabriqués par Samsung qui vous permet de connecter non seulement des appareils de marque SmartThings et des appareils tiers à votre installation, vous permettant pour contrôler tous d'entre eux à partir de l'application SmartThings.

(how-to)

Comment exclure certains mots de Spellcheck dans Microsoft Word

Comment exclure certains mots de Spellcheck dans Microsoft Word

Une liste d'exclusion d'orthographe est une liste de mots que vous pouvez forcer à marquer comme mal orthographiés, même s'ils sont listés dans le dictionnaire principal. mots correctement orthographiés. Nous vous montrerons comment ajouter une liste personnalisée de mots que vous voulez toujours marquer comme mal orthographiés.

(how-to)