paperless-gpt

paperless-gpt

Ako AI transformuje vašu digitálnu knižnicu..

GitHub - icereed/paperless-gpt: Use LLMs and LLM Vision (OCR) to handle paperless-ngx - Document Digitalization powered by AI
Use LLMs and LLM Vision (OCR) to handle paperless-ngx - Document Digitalization powered by AI - icereed/paperless-gpt

V dnešnom svete, kde sa hromadia hory papierov, faktúr, zmlúv a rôznych iných dokumentov, je digitalizácia kľúčom k efektivite.

Predstavte si, že namiesto hodín strávených hľadaním starého daňového priznania alebo manuálneho triedenia škatúľ plných papierov máte systém, ktorý to urobí za vás. A to všetko lokálne, bez odosielania citlivých dát do cloudu.

Vitajte v ére AI-poháňanej správy dokumentov!

Dnes sa pozrieme na open-source projekt paperless-gpt, ktorý integruje pokročilé jazykové modely (LLM) a vizuálne modely do obľúbeného self-hosted nástroja Paperless-ngx. Tento nástroj nie je len o skenovaní – ide o inteligentné pochopenie a organizáciu vašich dokumentov.

Ak ste už počuli o Paperless-ngx, viete, že je to skvelý základ pre domáci digitálny archív. Ale paperless-gpt ho posúva na novú úroveň, pridávajúc AI, ktorá generuje názvy, tagy, identifikuje odosielateľov a dokonca extrahuje text z nekvalitných skenov pomocou OCR (optického rozpoznávania znakov).

V tomto článku sa ponoríme do projektu: od jeho vzniku, cez funkcie, inštaláciu až po praktické tipy. Ak ste developer, nadšenec do self-hostingu alebo len niekto, kto sa topí v papieroch, čítajte ďalej – toto by mohlo zmeniť váš workflow.

Prečo potrebujeme AI v správe dokumentov?

Predtým, ako sa pustíme do detailov, krátka pauza na kontext. Podľa štúdií (napr. od Gartnera) strávia zamestnanci v priemere 9,3 hodiny týždenne hľadaním informácií – a veľkú časť z toho tvoria práve dokumenty. Tradičné OCR nástroje ako Tesseract sú skvelé na jednoduchý text, ale zlyhávajú pri tabuľkách, rovniciach alebo rukou písaných poznámkach.

Tu do procesov vstupuje AI: veľké jazykové modely (LLM) ako GPT alebo lokálne alternatívy cez Ollama dokážu nie len extrahovať text, ale aj ho pochopiť v kontexte.

Paperless-ngx, open-source systém na self-hosting, už rieši základy: upload, OCR a full-text search. Ale manuálne tagovanie? To je nočná mora. Paperless-gpt to mení tým, že pridáva vrstvu inteligencie, ktorá automatizuje až 80 % práce.

Všetko beží lokálne, takže vaše daňové výkazy alebo lekárske správy nikdy neopustia váš server. V roku 2025, keď sa GDPR a súkromie stávajú ešte prísnejšími, je to absolútny must-have.

Čo je paperless-gpt? .. Krátky prehľad projektu: Paperless-gpt je open-source rozšírenie vytvorené vývojárom Icereedom, ktoré sa zameriava na integráciu LLM a vizuálnych modelov do Paperless-ngx. Projekt má za cieľ "AI-poháňanú digitalizáciu dokumentov" – čiže nie len skenovanie, ale plnú automatizáciu.

Projekt začal ako odpoveď na frustráciu z manuálneho triedenia a rýchlo sa stal populárnym v komunite self-hostingovcov. Projekt je dostupný na GitHub-e a podporuje Docker pre jednoduchú inštaláciu.

Má aktívnu komunitu na Discorde (discord.gg/fJQppDH2J7) a je sponzorovaný cez GitHub Sponsors. Od svojho spustenia sa vyvinul z jednoduchého LLM wrapperu na plnohodnotný nástroj s webovým UI, podporou viacerých poskytovateľov AI a dokonca enterprise-grade OCR cez Google alebo Azure.

V jadre projektu stojí myšlienka: prečo nútiť používateľa písať tagy ručne, keď AI dokáže analyzovať obsah a navrhnúť ich s presnosťou 95 %?. A áno, funguje to aj na slovenčine – modely ako Qwen alebo Mistral zvládajú naše jazykové nuansy.

Kľúčové funkcie: Čo paperless-gpt dokáže? Toto nie je len "nice-to-have" rozšírenie – ide o súbor funkcií, ktoré robia z vášho systému inteligentného asistenta. Tu je prehľad najdôležitejších:

1. Automatická generácia názvov, tagov a dátumov

  • AI analyzuje obsah dokumentu a navrhne výstižný názov (napr. z "faktúra.pdf" urobí "Faktúra za elektrinu – SSE, október 2025").
  • Tagovanie: Priradí relevantné kľúčové slová ako "daň", "faktúra", "slovensko" na základe sémantiky.
  • Dátum vytvorenia: Odhadne dátum z obsahu, aj keď nie je explicitne uvedený.

2. Identifikácia odosielateľa (Correspondent)

  • Automaticky vytvára alebo priradí existujúceho "odosielateľa" – ideálne pre firemné dokumenty, kde sa objavuje logo alebo adresa.

3. Pokročilé OCR s vizuálnymi modelmi

  • Tradičné OCR často zlyhá na skreslených skenoch. Paperless-gpt používa vision LLMs (vizuálne jazykové modely), ktoré "vidia" obrázok ako celok a extrahujú text s kontextom.
  • Výstup: Vytvára prehľadné PDF s vrstvou textu, ktoré sú plne vyhľadateľné.

4. Vlastné polia a flexibilné písanie

  • Podporuje custom fields v Paperless-ngx – AI ich vyplní podľa vašich šablón (napr. "Číslo zmluvy: XYZ-123").
  • Režimy zápisu: Pridať (Append), aktualizovať (Update) alebo nahradiť (Replace).

5. Webové UI a ad-hoc analýza

  • Jednoduché rozhranie na http://localhost:8080, kde môžete upraviť prompt-y (šablóny pre AI) priamo.
  • Ad-hoc: Vyberte dokument a spýtajte sa AI čokoľvek – "Ktorý je celkový súčet faktúr?" alebo "Extrahuj mená osôb".

Tieto funkcie sa aktivujú jednoducho: Označte dokument v Paperless-ngx tagom ako paperless-gpt-auto a systém to spracuje na pozadí. Žiadne zložité skripty – všetko cez API.

Podporované modely: Od cloudu po lokálny Ollama. Jedna z najväčších síl paperless-gpt je flexibilita. Podporuje širokú škálu poskytovateľov:

  • Cloudové LLM: OpenAI (GPT-4o, GPT-3.5-turbo), Mistral, Azure OpenAI, Google Gemini.
  • Lokálne cez Ollama: Ideálne pre súkromie – modely ako qwen2.5:8b pre text alebo minicpm-v pre vizuálne úlohy. Konfigurujete cez env premenné ako OLLAMA_HOST a VISION_LLM_MODEL.

Pre OCR máte na výber:

  • LLM-based: Vision modely pre vysokú presnosť.
  • Google Document AI: Pre veľké objemy, s podporou hOCR.
  • Azure Document Intelligence: Pre biznis dokumenty.
  • Docling Server: Self-hosted alternatíva s EasyOCR alebo Tesseract.

Ak chcete plnú lokálnosť, spustite Ollama na vašom serveri (napr. na Raspberry Pi 5) s modelom minicpm-v – OCR - 10-stranový PDF trvá menej ako minútu a spotrebuje minimum RAM.

Inštalácia krok za krokom: Od nuly po plný chodInštalácia je navrhnutá pre Docker fanúšikov, takže ak máte Paperless-ngx bežiaci, pridáte toto len pár riadkami. Predpokladáme, že máte Docker a Docker Compose.

Krok 1: Príprava

  • Nainštalujte Paperless-ngx (ak ešte nemáte): docker-compose up z ich repa.
  • Vytvorte API token v Paperless-ngx (Settings > API Tokens).

Krok 2: Stiahnutie a konfigurácia

  • Naklonujte repo: git clone https://github.com/icereed/paperless-gpt.git
  • Vytvorte priečinok prompts pre custom šablóny (napr. slovenčina-specific prompt-y).

Krok 3: Docker Compose súbor

Vytvorte docker-compose.yml (príklad nižšie, prispôsobte):

yaml

version: '3.8'
services:
  paperless-gpt:
    image: icereed/paperless-gpt:latest  # Alebo ghcr.io/icereed/paperless-gpt:latest
    restart: unless-stopped
    environment:
      PAPERLESS_BASE_URL: "http://paperless:8000"  # Vaša Paperless-ngx adresa
      PAPERLESS_API_TOKEN: "your_super_secret_token"
      LLM_PROVIDER: "ollama"
      LLM_MODEL: "qwen2.5:8b"
      VISION_LLM_PROVIDER: "ollama"
      VISION_LLM_MODEL: "minicpm-v"
      OCR_PROVIDER: "llm"
      OCR_PROCESS_MODE: "image"
      OLLAMA_HOST: "http://host.docker.internal:11434"  # Adresa Ollama
      OLLAMA_CONTEXT_LENGTH: "8192"
      TOKEN_LIMIT: "1000"
      AUTO_GENERATE_TITLE: "true"
      AUTO_GENERATE_TAGS: "true"
    volumes:
      - ./prompts:/app/prompts
    ports:
      - "8080:8080"
    depends_on:
      - paperless

Krok 4: Spustenie

Ak chcete manuálne build:

docker build -t paperless-gpt . a potom docker run ....

Pro tip: Pre slovenčinu pridajte do prompts súboru (napr. title_prompt.txt):

"Navrhni krátky, výstižný názov pre tento dokument v slovenčine na základe obsahu: {{.Content}}".

Ako to používať v praxi: Príklady z reálneho sveta .. Povedzme, že uploadujete sken faktúry z Orangeu.

  1. Upload do Paperless-ngx: Pridajte súbor cez web UI, označte tagom paperless-gpt-ocr-auto.
  2. Automatické spracovanie: Systém spustí OCR cez minicpm-v, extrahuje text ("Faktúra č. 12345, suma 50 €, dátum 15.10.2025").
  3. AI analýza: Generuje názov "Faktúra Orange – Október 2025", tagy ["telekomunikácie", "faktúra", "2025"], odosielateľa "Orange Slovensko".
  4. Overenie: V UI na porte 8080 vidíte návrhy – upravte ich jedným klikom a uložte.

Pre ad-hoc: Vyberte dokument, napíšte prompt "Súčet všetkých položiek?" a dostanete odpoveď priamo.

Výsledok? Z 30-minútového manuálneho triedenia sa stane 2-minútový automatický proces.

Výhody: Efektivita, súkromie a úspory

  • Časová úspora: Automatizácia šetrí hodiny – ideálne pre malé firmy alebo domácnosti s archívom tisícok dokumentov.
  • Presnosť: Vision modely zvládajú aj rukopis alebo skreslené skeny lepšie ako tradičné nástroje.
  • Súkromie: S Ollama beží všetko lokálne – žiadne API volania do USA. Perfektné pre GDPR-kompatibilné prostredia.
  • Škálovateľnosť: Od Raspberry Pi po server – a open-source znamená, že môžete prispôsobiť kód.

Samozrejme, nie je to dokonalé: Väčšie modely potrebujú GPU pre rýchlosť, a custom prompt-y vyžadujú trochu experimentovania. Ale komunita na Discorde pomôže.

Začnite svoju AI revolúciu dnes. Paperless-gpt nie je len nástroj – je to mostík k budúcnosti, kde AI robí nudnú prácu za nás. Ak ste unavení z chaosu v dokumentoch, nainštalujte si ho dnes. Navštívte GitHub repo, pridajte sa na Discord a začnite s jednoduchým setupom.

V roku 2025, keď AI ovládne svet, budete vy ten, kto má svoju digitálnu knižnicu pod kontrolou. Sledujte repo pre aktualizácie.