From e9fa0d4fd86a047fe9daa6af4ee6983aaea031e4 Mon Sep 17 00:00:00 2001 From: Bastien Le Querrec <blq@laquadrature.net> Date: Sun, 12 May 2024 23:45:35 +0200 Subject: [PATCH] =?UTF-8?q?Attrap:=20abaisse=20la=20r=C3=A9solution=20maxi?= =?UTF-8?q?male=20des=20images=20=C3=A0=20partir=20de=20laquelle=20l'OCRis?= =?UTF-8?q?ation=20est=20pass=C3=A9e?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Cela devrait permettre d'éviter des OOM de OCRmyPDF. Les images des PDF qui dépassent cette limite ne devraient pas contenir d'informations utiles. --- Attrap.py | 3 ++- 1 file changed, 2 insertions(+), 1 deletion(-) diff --git a/Attrap.py b/Attrap.py index 27bc2b7..dc1eaea 100644 --- a/Attrap.py +++ b/Attrap.py @@ -437,7 +437,8 @@ class Attrap: '-l', 'eng+fra', '--output-type', 'pdf', '--redo-ocr', - '--skip-big', '500', + '--skip-big', '250', + '--max-image-mpixels', '250', '--invalidate-digital-signatures', '--optimize', '0', f'{self.data_dir}/raa/{raa.get_sha256()}.flat.pdf', -- GitLab