Przejdź do treści
fewtokensai
Usługa

Produkcyjna data science

Modele predykcyjne, scoring klientów, analiza odpływu (churn), frameworki A/B testów. Tam, gdzie LLM-y są przerostem formy nad treścią — klasyczne ML wciąż zarabia więcej.

Nie wszystko musi być LLM-em

Trend GenAI przykrywa mało efektowny fakt: klasyczne ML wciąż wygrywa w 80% biznesowych przypadków użycia. Scoring klientów, predykcja churnu, prognozowanie popytu, A/B testy — to narzędzia, które przewidywalnie i tanio robią pieniądze. LLM bywa tu over-engineeringiem za 100-krotną cenę.

W IG Group przez 6 lat budowałem właśnie takie systemy. Modele scoringu klientów oszczędziły ~250 000 USD rocznie dzięki lepszej alokacji zasobów retencji. Modele identyfikacji okazji tradingowych dostarczyły ~40 000 USD dodatkowego przychodu miesięcznie.

Co dostarczam

  • Scoring klientów i modelowanie lifetime value — modele oceniające wartość klienta na różnych etapach lifecycle, gotowe do podpięcia pod CRM i kampanie.
  • Analiza odpływu (churn) — identyfikacja klientów wysokiego ryzyka odejścia wraz z konkretnymi rekomendacjami akcji.
  • Prognozowanie popytu i przychodu — Darts, Prophet, klasyczne ARIMA tam, gdzie ma sens. Z uczciwym backtestingiem.
  • Infrastruktura A/B testingu — projektowanie eksperymentów, kalkulatory wielkości próby, sequential testing, korekta wielu porównań. Zrobione porządnie, a nie „ten wariant wygląda lepiej”.
  • Architektura danych — S3 + dbt + Redshift / GCP BigQuery / data lakehouse — dla firm, które wyrosły z pojedynczego Postgresa. (W inFakt zaprojektowałem nowoczesną architekturę z 40% redukcją kosztów przetwarzania danych.)

Częste pułapki

  1. Train/test leakage — klasyk: model wygląda na 95% skuteczny, w produkcji spada do 60%.
  2. Brak monitoringu modelu po wdrożeniu — modele degradują się przez data drift i concept drift. Bez monitoringu po 6 miesiącach masz tylko losowy generator.
  3. Optymalizacja na metrykę zastępczą — model maksymalizuje CTR, biznes traci konwersję.
  4. A/B test bez wyliczenia wielkości próby — wnioski po 3 dniach, kiedy potrzeba 3 tygodni.

Komu to pasuje

  • E-commerce, fintechom, SaaS-om z ≥10 tys. klientów, gdzie scoring i segmentacja realnie wpływają na przychód.
  • Firmom, które chcą uciec od podejścia „let’s use ChatGPT for everything” — gdy klasyczne ML wystarczy i jest 50× tańsze.
  • Zespołom potrzebującym setupu MLOps (CI/CD dla modeli, monitoring, retraining).

Stack

Python · scikit-learn · Pandas · NumPy · pySpark · Darts · XGBoost · LightGBM · SQL · BigQuery · Redshift · dbt · Vertex AI · SageMaker · MLflow · Streamlit · Tableau

Porozmawiajmy o Twoim AI

Porozmawiajmy.

30 minut bez zobowiązań. Opowiedz, gdzie utknęło wdrożenie AI lub co planujesz — wyjdziesz z rozmowy z konkretnymi krokami.