paperless-gpt
Ako AI transformuje vašu digitálnu knižnicu..
V dnešnom svete, kde sa hromadia hory papierov, faktúr, zmlúv a rôznych iných dokumentov, je digitalizácia kľúčom k efektivite.
Predstavte si, že namiesto hodín strávených hľadaním starého daňového priznania alebo manuálneho triedenia škatúľ plných papierov máte systém, ktorý to urobí za vás. A to všetko lokálne, bez odosielania citlivých dát do cloudu.
Vitajte v ére AI-poháňanej správy dokumentov!
Dnes sa pozrieme na open-source projekt paperless-gpt, ktorý integruje pokročilé jazykové modely (LLM) a vizuálne modely do obľúbeného self-hosted nástroja Paperless-ngx. Tento nástroj nie je len o skenovaní – ide o inteligentné pochopenie a organizáciu vašich dokumentov.
Ak ste už počuli o Paperless-ngx, viete, že je to skvelý základ pre domáci digitálny archív. Ale paperless-gpt ho posúva na novú úroveň, pridávajúc AI, ktorá generuje názvy, tagy, identifikuje odosielateľov a dokonca extrahuje text z nekvalitných skenov pomocou OCR (optického rozpoznávania znakov).
V tomto článku sa ponoríme do projektu: od jeho vzniku, cez funkcie, inštaláciu až po praktické tipy. Ak ste developer, nadšenec do self-hostingu alebo len niekto, kto sa topí v papieroch, čítajte ďalej – toto by mohlo zmeniť váš workflow.
Prečo potrebujeme AI v správe dokumentov?
Predtým, ako sa pustíme do detailov, krátka pauza na kontext. Podľa štúdií (napr. od Gartnera) strávia zamestnanci v priemere 9,3 hodiny týždenne hľadaním informácií – a veľkú časť z toho tvoria práve dokumenty. Tradičné OCR nástroje ako Tesseract sú skvelé na jednoduchý text, ale zlyhávajú pri tabuľkách, rovniciach alebo rukou písaných poznámkach.
Tu do procesov vstupuje AI: veľké jazykové modely (LLM) ako GPT alebo lokálne alternatívy cez Ollama dokážu nie len extrahovať text, ale aj ho pochopiť v kontexte.
Paperless-ngx, open-source systém na self-hosting, už rieši základy: upload, OCR a full-text search. Ale manuálne tagovanie? To je nočná mora. Paperless-gpt to mení tým, že pridáva vrstvu inteligencie, ktorá automatizuje až 80 % práce.
Všetko beží lokálne, takže vaše daňové výkazy alebo lekárske správy nikdy neopustia váš server. V roku 2025, keď sa GDPR a súkromie stávajú ešte prísnejšími, je to absolútny must-have.
Čo je paperless-gpt? .. Krátky prehľad projektu: Paperless-gpt je open-source rozšírenie vytvorené vývojárom Icereedom, ktoré sa zameriava na integráciu LLM a vizuálnych modelov do Paperless-ngx. Projekt má za cieľ "AI-poháňanú digitalizáciu dokumentov" – čiže nie len skenovanie, ale plnú automatizáciu.
Projekt začal ako odpoveď na frustráciu z manuálneho triedenia a rýchlo sa stal populárnym v komunite self-hostingovcov. Projekt je dostupný na GitHub-e a podporuje Docker pre jednoduchú inštaláciu.
Má aktívnu komunitu na Discorde (discord.gg/fJQppDH2J7) a je sponzorovaný cez GitHub Sponsors. Od svojho spustenia sa vyvinul z jednoduchého LLM wrapperu na plnohodnotný nástroj s webovým UI, podporou viacerých poskytovateľov AI a dokonca enterprise-grade OCR cez Google alebo Azure.
V jadre projektu stojí myšlienka: prečo nútiť používateľa písať tagy ručne, keď AI dokáže analyzovať obsah a navrhnúť ich s presnosťou 95 %?. A áno, funguje to aj na slovenčine – modely ako Qwen alebo Mistral zvládajú naše jazykové nuansy.
Kľúčové funkcie: Čo paperless-gpt dokáže? Toto nie je len "nice-to-have" rozšírenie – ide o súbor funkcií, ktoré robia z vášho systému inteligentného asistenta. Tu je prehľad najdôležitejších:
1. Automatická generácia názvov, tagov a dátumov
- AI analyzuje obsah dokumentu a navrhne výstižný názov (napr. z "faktúra.pdf" urobí "Faktúra za elektrinu – SSE, október 2025").
- Tagovanie: Priradí relevantné kľúčové slová ako "daň", "faktúra", "slovensko" na základe sémantiky.
- Dátum vytvorenia: Odhadne dátum z obsahu, aj keď nie je explicitne uvedený.
2. Identifikácia odosielateľa (Correspondent)
- Automaticky vytvára alebo priradí existujúceho "odosielateľa" – ideálne pre firemné dokumenty, kde sa objavuje logo alebo adresa.
3. Pokročilé OCR s vizuálnymi modelmi
- Tradičné OCR často zlyhá na skreslených skenoch. Paperless-gpt používa vision LLMs (vizuálne jazykové modely), ktoré "vidia" obrázok ako celok a extrahujú text s kontextom.
- Výstup: Vytvára prehľadné PDF s vrstvou textu, ktoré sú plne vyhľadateľné.
4. Vlastné polia a flexibilné písanie
- Podporuje custom fields v Paperless-ngx – AI ich vyplní podľa vašich šablón (napr. "Číslo zmluvy: XYZ-123").
- Režimy zápisu: Pridať (Append), aktualizovať (Update) alebo nahradiť (Replace).
5. Webové UI a ad-hoc analýza
- Jednoduché rozhranie na http://localhost:8080, kde môžete upraviť prompt-y (šablóny pre AI) priamo.
- Ad-hoc: Vyberte dokument a spýtajte sa AI čokoľvek – "Ktorý je celkový súčet faktúr?" alebo "Extrahuj mená osôb".
Tieto funkcie sa aktivujú jednoducho: Označte dokument v Paperless-ngx tagom ako paperless-gpt-auto a systém to spracuje na pozadí. Žiadne zložité skripty – všetko cez API.
Podporované modely: Od cloudu po lokálny Ollama. Jedna z najväčších síl paperless-gpt je flexibilita. Podporuje širokú škálu poskytovateľov:
- Cloudové LLM: OpenAI (GPT-4o, GPT-3.5-turbo), Mistral, Azure OpenAI, Google Gemini.
- Lokálne cez Ollama: Ideálne pre súkromie – modely ako qwen2.5:8b pre text alebo minicpm-v pre vizuálne úlohy. Konfigurujete cez env premenné ako OLLAMA_HOST a VISION_LLM_MODEL.
Pre OCR máte na výber:
- LLM-based: Vision modely pre vysokú presnosť.
- Google Document AI: Pre veľké objemy, s podporou hOCR.
- Azure Document Intelligence: Pre biznis dokumenty.
- Docling Server: Self-hosted alternatíva s EasyOCR alebo Tesseract.
Ak chcete plnú lokálnosť, spustite Ollama na vašom serveri (napr. na Raspberry Pi 5) s modelom minicpm-v – OCR - 10-stranový PDF trvá menej ako minútu a spotrebuje minimum RAM.
Inštalácia krok za krokom: Od nuly po plný chodInštalácia je navrhnutá pre Docker fanúšikov, takže ak máte Paperless-ngx bežiaci, pridáte toto len pár riadkami. Predpokladáme, že máte Docker a Docker Compose.
Krok 1: Príprava
- Nainštalujte Paperless-ngx (ak ešte nemáte): docker-compose up z ich repa.
- Vytvorte API token v Paperless-ngx (Settings > API Tokens).
Krok 2: Stiahnutie a konfigurácia
- Naklonujte repo: git clone https://github.com/icereed/paperless-gpt.git
- Vytvorte priečinok prompts pre custom šablóny (napr. slovenčina-specific prompt-y).
Krok 3: Docker Compose súbor
Vytvorte docker-compose.yml (príklad nižšie, prispôsobte):
yaml
version: '3.8'
services:
paperless-gpt:
image: icereed/paperless-gpt:latest # Alebo ghcr.io/icereed/paperless-gpt:latest
restart: unless-stopped
environment:
PAPERLESS_BASE_URL: "http://paperless:8000" # Vaša Paperless-ngx adresa
PAPERLESS_API_TOKEN: "your_super_secret_token"
LLM_PROVIDER: "ollama"
LLM_MODEL: "qwen2.5:8b"
VISION_LLM_PROVIDER: "ollama"
VISION_LLM_MODEL: "minicpm-v"
OCR_PROVIDER: "llm"
OCR_PROCESS_MODE: "image"
OLLAMA_HOST: "http://host.docker.internal:11434" # Adresa Ollama
OLLAMA_CONTEXT_LENGTH: "8192"
TOKEN_LIMIT: "1000"
AUTO_GENERATE_TITLE: "true"
AUTO_GENERATE_TAGS: "true"
volumes:
- ./prompts:/app/prompts
ports:
- "8080:8080"
depends_on:
- paperlessKrok 4: Spustenie
- docker-compose up -d
- Otvorte http://localhost:8080 a overte spojenie.
Ak chcete manuálne build:
docker build -t paperless-gpt . a potom docker run ....
Pro tip: Pre slovenčinu pridajte do prompts súboru (napr. title_prompt.txt):
"Navrhni krátky, výstižný názov pre tento dokument v slovenčine na základe obsahu: {{.Content}}".
Ako to používať v praxi: Príklady z reálneho sveta .. Povedzme, že uploadujete sken faktúry z Orangeu.
- Upload do Paperless-ngx: Pridajte súbor cez web UI, označte tagom paperless-gpt-ocr-auto.
- Automatické spracovanie: Systém spustí OCR cez minicpm-v, extrahuje text ("Faktúra č. 12345, suma 50 €, dátum 15.10.2025").
- AI analýza: Generuje názov "Faktúra Orange – Október 2025", tagy ["telekomunikácie", "faktúra", "2025"], odosielateľa "Orange Slovensko".
- Overenie: V UI na porte 8080 vidíte návrhy – upravte ich jedným klikom a uložte.
Pre ad-hoc: Vyberte dokument, napíšte prompt "Súčet všetkých položiek?" a dostanete odpoveď priamo.
Výsledok? Z 30-minútového manuálneho triedenia sa stane 2-minútový automatický proces.
Výhody: Efektivita, súkromie a úspory
- Časová úspora: Automatizácia šetrí hodiny – ideálne pre malé firmy alebo domácnosti s archívom tisícok dokumentov.
- Presnosť: Vision modely zvládajú aj rukopis alebo skreslené skeny lepšie ako tradičné nástroje.
- Súkromie: S Ollama beží všetko lokálne – žiadne API volania do USA. Perfektné pre GDPR-kompatibilné prostredia.
- Škálovateľnosť: Od Raspberry Pi po server – a open-source znamená, že môžete prispôsobiť kód.
Samozrejme, nie je to dokonalé: Väčšie modely potrebujú GPU pre rýchlosť, a custom prompt-y vyžadujú trochu experimentovania. Ale komunita na Discorde pomôže.
Začnite svoju AI revolúciu dnes. Paperless-gpt nie je len nástroj – je to mostík k budúcnosti, kde AI robí nudnú prácu za nás. Ak ste unavení z chaosu v dokumentoch, nainštalujte si ho dnes. Navštívte GitHub repo, pridajte sa na Discord a začnite s jednoduchým setupom.
V roku 2025, keď AI ovládne svet, budete vy ten, kto má svoju digitálnu knižnicu pod kontrolou. Sledujte repo pre aktualizácie.