Skip to content
Extraits de code Groupes Projets
Valider ce75d11b rédigé par Joseki's avatar Joseki Validation de Bastien Le Querrec
Parcourir les fichiers

Attrap: embarque une version locale de OCRmyPDF


Closes !8

Co-authored-by: default avatarJoe Seki <joeseki@proton.me>
Co-authored-by: default avatarBastien Le Querrec <blq@laquadrature.net>
parent 5ed1d5c1
Aucune branche associée trouvée
Aucune étiquette associée trouvée
Aucune requête de fusion associée trouvée
......@@ -494,7 +494,8 @@ class Attrap:
def ocr(self, raa, retry_on_failure=True):
"""OCRise un RAA"""
cmd = [
'ocrmypdf',
'python3',
'bin/ocrmypdf',
'-l', 'eng+fra',
'--output-type', 'pdf',
'--redo-ocr',
......
......@@ -16,7 +16,7 @@ source bin/activate
pip3 install -r requirements.txt
```
Vous devez avoir installé OCRmyPDF, les données `eng` et `fra` de Tesseract, et le démon Tor.
Vous devez avoir installé les données `eng` et `fra` de Tesseract et le démon Tor.
### Configuration du démon Tor
......
......@@ -2,6 +2,7 @@ beautifulsoup4>=4.12.3
dateparser>=1.2.0
ftfy>=6.2.0
Mastodon.py>=1.8.1
ocrmypdf>=16.3.1
pycodestyle>=2.11.1
pypdf>=4.2.0
PyVirtualDisplay>=3.0
......
0% Chargement en cours ou .
You are about to add 0 people to the discussion. Proceed with caution.
Terminez d'abord l'édition de ce message.
Veuillez vous inscrire ou vous pour commenter