inFakt — serwer MCP, AutoX, PKD AI: produkty łączące księgowość z LLM
Kieruję zespołem AI Engineering. Trzy główne produkty, które razem dowozimy: serwer Model Context Protocol (wydany, z toolami zapisu), system autoksięgowania AutoX (300k+ faktur/m-c, 90%+ accuracy), klasyfikator PKD AI dla rejestracji firm. Do tego modernizacja architektury danych na AWS. Dokumentacja: infakt.ai.
Kontekst
inFakt to polska platforma SaaS dla księgowości i fakturowania, obsługująca dziesiątki tysięcy małych firm oraz ponad 800 księgowych, którzy prowadzą na niej swoich klientów. Niedawno dołączyłem jako AI Engineering Manager z mandatem na zbudowanie zespołu i wprowadzenie funkcji AI-first w głównym produkcie.
Wyzwania, które zastałem
- Brak skoordynowanej praktyki AI — pojedyncze inicjatywy rozproszone po backendzie, bez wspólnego kierunku.
- Ręczne przetwarzanie faktur — mimo istniejącego systemu automatyzacji OCR znaczna część dokumentów wymagała ręcznej korekty. Wąskie gardło w pracy księgowych.
- Brak integracji z asystentami AI — klienci coraz częściej pytali „czy mogę podpiąć ChatGPT do mojego inFaktu?”. Odpowiedź brzmiała „nie”.
- Architektura danych — stary monolit z Postgresem jako single source of truth, drogi w skalowaniu i ograniczający analitykę.
Co dostarczamy
Zespół AI Engineering
Zbudowałem i prowadzę zespół AI Engineering w inFakt. Razem dowozimy roadmapę AI w całej firmie — od strategii i architektury po konkretne wdrożenia. Wprowadziliśmy agile, standardy code review, on-call rotation, cotygodniowe sesje techniczne oraz indywidualne ścieżki rozwoju. Pracuję bezpośrednio z każdym członkiem zespołu, a także z innymi działami (product, compliance, legal, support).
Serwer MCP (Model Context Protocol)
Razem z zespołem zaprojektowaliśmy i wydaliśmy produkcyjny serwer MCP, który pozwala bezpiecznie podłączyć asystentów AI (Claude, ChatGPT, Cursor i innych) do kont użytkowników inFaktu. Obsługuje zarówno operacje odczytu, jak i operacje zapisu (write tools) — m.in. tworzenie faktur, klientów oraz książek przychodów i rozchodów. Pełna dokumentacja: infakt.ai. Prowadzę prace architektoniczne i decyzje techniczne.
Stack i decyzje architektoniczne, które wypracowaliśmy z biznesem i compliance:
- OAuth2 scoped tokens zamiast jednego szerokiego tokenu — każdy tool ma deklaratywny manifest scope’ów.
- Audit log per call — każde wywołanie toola (z parametrami, odpowiedzią, latencją, kodem błędu) trafia do dedykowanego storage z retencją zgodną z RODO. Zapis przed wykonaniem; nieudany logging = nieudane wywołanie.
- Rate-limit per user — chronimy backend przed agentami wpadającymi w pętle.
- Klucze idempotencji dla operacji zapisu — ponowienie po stronie agenta nie generuje duplikatów.
- Graceful degradation — gdy backend pada, MCP zwraca ustrukturyzowany błąd, a agent decyduje, co dalej.
- Deploy: AWS Lambda + Cloud Run jako fallback, observability przez OpenTelemetry.
To nie demo. To distributed-systems engineering z LLM-em jako klientem. Więcej szczegółów: artykuł „Dlaczego serwery MCP zawodzą w produkcji”.
AutoX — system autoksięgowania faktur
Istniejący w inFakcie workflow oparty na OCR przebudowaliśmy wraz z core engineering teamem w pełnoprawny system AutoX, który zamienia surowy dokument (zdjęcie, PDF, e-mail z fakturą) w gotowy wpis księgowy — z dopasowaniem do planu kont, identyfikacją kontrahenta, klasyfikacją VAT i flagowaniem anomalii.
Pipeline:
- Warstwa OCR — ekstrakcja tekstu z dokumentów w wielu formatach.
- Normalizacja NLP — dane dostawcy, daty, kwoty, stawki VAT.
- Weryfikacja przez LLM — dopasowanie do historycznych wzorców użytkownika, wykrywanie nietypowych transakcji.
- Human-in-the-loop dla przypadków o niskiej pewności — księgowy potwierdza, system się uczy.
Rezultat: ponad 300 000 faktur miesięcznie przy 90%+ accuracy, wyraźne odciążenie ponad 800 księgowych korzystających z platformy. Czas zaksięgowania pojedynczej faktury skrócony z minut do sekund.
PKD AI — klasyfikator kodu działalności gospodarczej
Każda firma w Polsce musi przy rejestracji wskazać kod PKD (Polska Klasyfikacja Działalności). Klasyfikacja liczy kilka tysięcy pozycji, jest niespójna i pełna pułapek prawno-podatkowych.
Zbudowaliśmy asystenta AI, który na podstawie swobodnego opisu działalności (np. „robię strony www i pomagam firmom z reklamą Google”) proponuje dopasowane kody PKD wraz z uzasadnieniem i ostrzeżeniami o konsekwencjach podatkowych. Działa zarówno przy rejestracji nowej firmy, jak i przy aktualizacji wpisów istniejących klientów.
Stack:
- Retrieval po ustrukturyzowanej bazie PKD i interpretacjach GUS.
- Warstwa rozumowania LLM z jawnym chain-of-thought (audytowalnym przez compliance).
- Confidence scoring — gdy model nie jest pewien, eskalujemy do księgowego. Żadnego zgadywania.
To pierwszy w produktach inFaktu asystent decyzyjny oparty na AI, którego output ma realne konsekwencje prawne dla użytkownika. Wszystko przeszło przez review Compliance i Legal.
Nowoczesna architektura danych na AWS
Razem z zespołem zaprojektowaliśmy i wdrażamy nowoczesną architekturę warstwową: operacyjne systemy danych → data lake na S3 → warstwa transformacji w dbt → warstwa analityczna na Redshift. Wprowadziliśmy polityki data governance, frameworki monitoringu i skalowalne pipeline’y ETL. Redukcja kosztów przetwarzania danych: 40%. Real-time analytics dostępna we wszystkich jednostkach biznesowych.
Strategia AI i change management
Prowadzę inicjatywę adopcji AI: rozmowy z interesariuszami, analiza wymagań, wizja AI, 12-miesięczna roadmapa, governance framework, metryki sukcesu. Bliska współpraca z Compliance, żeby zapewnić zgodność wszystkich rozwiązań z RODO. Zidentyfikowane 6+ inicjatyw automatyzacyjnych z projekcją 30% wzrostu efektywności.
Czego się nauczyłem
- MCP w produkcji wymaga znacznie więcej niż sama specyfikacja — backpressure, idempotencja, observability. Anthropic SDK to dopiero punkt startu.
- Adopcja AI wewnątrz firmy to zmiana zarządcza, nie techniczna — najwięcej czasu schodzi na rozmowy z compliance, legal, product i support.
- Stara automatyzacja OCR + nowoczesny NLP daje więcej niż sam LLM — hybryda przy 90%+ accuracy jest tańsza i bardziej deterministyczna.
- Dobry zespół to mnożnik, nie suma — najlepsze efekty pojawiają się, gdy każdy senior ma swój obszar i jest właścicielem rezultatu, a manager usuwa blokery.