domingo, 21 de abril de 2024

Stirling-PDF la plataforma para manipular los archivos pdf.


Es una plataforma que permite la  manipulación de los archivos pdf alojada localmente.

"Nuestra aplicación ofrece una amplia gama de funcionalidades, desde operaciones simples como la fusión y división de archivos PDF, hasta funciones avanzadas como compresión, OCR y Conversiones."

 

Docker Compose

services:
stirling-pdf:
    image: frooodle/s-pdf:latest
    ports:
      - '8080:8080'
    volumes:
      - './docker/Stirling-Tools/trainingData:/usr/share/tessdata' #Required for extra OCR languages
      - './docker/Stirling-Tools/extraConfigs:/configs'
      - './docker/Stirling-Tools/customFiles:/customFiles/'
      - './docker/Stirling-Tools/logs:/logs/'
    environment:
      - DOCKER_ENABLE_SECURITY=false
      - INSTALL_BOOK_AND_ADVANCED_HTML_OPS=false



Agregar idioma para los archivos OCR


La gente del proyecto menciona que los paquetes "fast" son más rápidos, pero podrían ser menos precisos. Por otro lado, los paquetes completos son más precisos, pero pueden tardar más en cargar.


Los archivos hay que dejarlos en la carpeta trainingData para que puedan visualizarse en la sección de "Escaneos de limpieza / OCR (Reconocimiento óptico de caracteres)" 

 El archivo para el idioma español se llama: spa.traineddata



Cambiar a español la página por default.


Editar el archivo tu/ruta/extraConfig/settings.yml y cambiar defaultLocale: 'en-US' por  defaultLocale: 'es-ES'





url del proyectto: https://github.com/Stirling-Tools/Stirling-PDF
url para OCR https://github.com/Stirling-Tools/Stirling-PDF/blob/main/HowToUseOCR.md


No hay comentarios.:

Publicar un comentario