Usługa

Produkcyjna data science

Modele predykcyjne, scoring klientów, analiza odpływu (churn), frameworki A/B testów. Tam, gdzie LLM-y są przerostem formy nad treścią — klasyczne ML wciąż zarabia więcej.

Nie wszystko musi być LLM-em

Trend GenAI przykrywa mało efektowny fakt: klasyczne ML wciąż wygrywa w 80% biznesowych przypadków użycia. Scoring klientów, predykcja churnu, prognozowanie popytu, A/B testy — to narzędzia, które przewidywalnie i tanio robią pieniądze. LLM bywa tu over-engineeringiem za 100-krotną cenę.

W IG Group przez 6 lat budowałem właśnie takie systemy. Modele scoringu klientów oszczędziły ~250 000 USD rocznie dzięki lepszej alokacji zasobów retencji. Modele identyfikacji okazji tradingowych dostarczyły ~40 000 USD dodatkowego przychodu miesięcznie.

Co dostarczam

Scoring klientów i modelowanie lifetime value — modele oceniające wartość klienta na różnych etapach lifecycle, gotowe do podpięcia pod CRM i kampanie.
Analiza odpływu (churn) — identyfikacja klientów wysokiego ryzyka odejścia wraz z konkretnymi rekomendacjami akcji.
Prognozowanie popytu i przychodu — Darts, Prophet, klasyczne ARIMA tam, gdzie ma sens. Z uczciwym backtestingiem.
Infrastruktura A/B testingu — projektowanie eksperymentów, kalkulatory wielkości próby, sequential testing, korekta wielu porównań. Zrobione porządnie, a nie „ten wariant wygląda lepiej”.
Architektura danych — S3 + dbt + Redshift / GCP BigQuery / data lakehouse — dla firm, które wyrosły z pojedynczego Postgresa. (W inFakt zaprojektowałem nowoczesną architekturę z 40% redukcją kosztów przetwarzania danych.)

Częste pułapki

Train/test leakage — klasyk: model wygląda na 95% skuteczny, w produkcji spada do 60%.
Brak monitoringu modelu po wdrożeniu — modele degradują się przez data drift i concept drift. Bez monitoringu po 6 miesiącach masz tylko losowy generator.
Optymalizacja na metrykę zastępczą — model maksymalizuje CTR, biznes traci konwersję.
A/B test bez wyliczenia wielkości próby — wnioski po 3 dniach, kiedy potrzeba 3 tygodni.

Komu to pasuje

E-commerce, fintechom, SaaS-om z ≥10 tys. klientów, gdzie scoring i segmentacja realnie wpływają na przychód.
Firmom, które chcą uciec od podejścia „let’s use ChatGPT for everything” — gdy klasyczne ML wystarczy i jest 50× tańsze.
Zespołom potrzebującym setupu MLOps (CI/CD dla modeli, monitoring, retraining).

Stack

Python · scikit-learn · Pandas · NumPy · pySpark · Darts · XGBoost · LightGBM · SQL · BigQuery · Redshift · dbt · Vertex AI · SageMaker · MLflow · Streamlit · Tableau

Nie wszystko musi być LLM-em

Co dostarczam

Częste pułapki

Komu to pasuje

Stack

Porozmawiajmy.