OCR PDF et image en ligne

Extrayez du texte de PDF ou d’images avec Tesseract.js dans votre navigateur — aucun envoi serveur. Rendu haute résolution, texte prêt à copier.

Extraire du texte de PDF ou de scans

Tesseract.js + pdf.js — tout s’exécute dans votre navigateur.

Langue du texte dans le fichier

L’OCR réservé à l’anglais ignore la plupart des caractères cyrilliques et arméniens. Choisissez la langue du scan ; le premier lancement télécharge un pack (souvent quelques Mo).

Charge plusieurs modèles (anglais, russe, arménien, arabe, langues européennes, japonais, coréen, chinois simplifié). Ce n’est pas un détecteur séparé : Tesseract fait une passe avec tous les modèles ; le premier lancement est plus lourd en téléchargement et en mémoire.

OCR

Extraire du texte de PDF ou de scans

local uniquement

Tesseract.js + pdf.js — tout s’exécute dans votre navigateur.

Déposez les fichiers ici•ou cliquez pour parcourir

Inactif

Ouvrez la page OCR et déposez un fichier ou parcourez — PNG, JPEG, WebP, GIF ou PDF.
Chaque page est rendue localement en haute résolution ; Tesseract.js s’exécute dans un worker web. Suivez la progression.
Copiez le texte ou utilisez « Recommencer » pour effacer et choisir un autre fichier. OmniPDF n’envoie pas votre document pour cette étape.

FAQ

Mon fichier est-il envoyé ?: Non. pdf.js décode le PDF et Tesseract.js fait l’OCR dans le navigateur ; les données restent sur votre appareil.
L’OCR sera-t-il parfait ?: Cela dépend de la qualité du scan, des polices et de la langue. Vérifiez les résultats pour les textes sensibles.
Cela fonctionne-t-il sur mobile ?: Oui sur les navigateurs récents. Les gros PDF peuvent être plus lents ou gourmands en mémoire.

Performances

OmniPDF traitant les fichiers en local grâce à la puissance de votre ordinateur (WebAssembly), le temps d'envoi est nul. Il est 5 fois plus rapide que les convertisseurs basés sur le cloud pour les fichiers volumineux.

Tout savoir sur l’OCR PDF et image

Comment l’OCR reste privé dans le navigateur

Choisissez un PDF ou une image (PNG, JPEG, WebP, GIF, etc.). Le fichier est lu dans votre onglet — rien n’est envoyé à un cluster distant. Avec un PDF, pdf.js décode chaque page dans un Web Worker pour garder l’interface fluide.
Chaque page est rasterisée en haute résolution pour préserver les petits caractères. Un prétraitement canvas (niveaux de gris, contraste) améliore les scans, photos et impressions pâles.
Tesseract.js exécute la reconnaissance dans un worker dédié. La progression indique la page et le pourcentage afin de montrer que le travail avance localement.
Le texte brut s’affiche dans la zone d’édition ; copiez-le ou collez-le ailleurs. Les avertissements signalent les pages vierges ou les zones purement graphiques — vérifiez-les pour les contenus sensibles.
Utilisez « Recommencer » pour effacer et choisir un autre document. Fermez l’onglet quand vous avez terminé ; le texte reste en mémoire volatile jusqu’à copie ou navigation.

Sécurité technique, confidentialité et absence de compte

L’OCR classique envoyait des scans confidentiels vers des fermes GPU tierces. Ici, pdf.js et Tesseract tournent localement : contrats, pièces d’identité et notes restent dans le navigateur pendant que modèles et données linguistiques se chargent en HTTPS.

Aucun compte n’est requis parce que nos serveurs n’ont pas besoin de lire vos pixels. Associez le traitement local à la discipline du poste — correctifs OS, regard indiscret, presse-papiers — avant de coller des données personnelles. Ajoutez DLP et règles de conservation pour les environnements réglementés.

Cinq cas d’usage pour un OCR local

Chercheurs citant des articles scannés sans API OCR externe.
Exploitation photographiant des étiquettes quand les scanners portables sont HS.
Étudiants extrayant des passages de diapositives PDF pour des notes accessibles.
Juristes juniors cherchant des mots-clés avant outils certifiés.
Accueil saisissant des formulaires multilingues quand l’OCR bureau est verrouillé.

Partager cet outil

Non. Vos fichiers restent sur votre appareil. La conversion PDF en image et image en PDF s'effectue dans votre navigateur.

OCR PDF et image en ligne

Extraire du texte de PDF ou de scans

Extraire le texte d’un PDF ou d’une image avec l’OCR (gratuit, privé)

FAQ

Performances

Tout savoir sur l’OCR PDF et image

Comment l’OCR reste privé dans le navigateur

Sécurité technique, confidentialité et absence de compte

Cinq cas d’usage pour un OCR local

Partager cet outil