(AICLS)

AI - Artificial Intelligence, AI for developers

Location, current course term

Contact us

Custom Customized Training (date, location, content, duration)

The course:

Hide detail
  • Úvod & opakování základů ML
    1. Terminologie: supervised/unsupervised, klasifikace vs. regrese, anomaly detection
    2. ML × DL: kdy stačí tree‑based modely, kdy CNN/LSTM/Transformers
    3. Data leakage, train/test split, cross‑validation – časté chyby a prevence
  • Detekční domény (security use‑cases)
    1. Phishing & spam: textové/URL rysy, reputace domén
    2. DGA/malicious domains: délka, entropie, n‑gramy, WHOIS/TLS atributy
    3. Anomálie v logech: outlier detection, DBSCAN, Isolation Forest
    4. Zdroje dat: Alexa/Tranco, Phishtank, vlastní logy, syntetická data
  • Feature engineering & výběr modelů
    1. Lexikální/statistické rysy pro domény/URL, TF‑IDF, hashing trick, embeddings
    2. XGBoost/LightGBM, SVM, RandomForest vs. jednoduchá CNN/LSTM
    3. Pipelines ve scikit‑learn, eliminace leakage, replikovatelnost
    4. Hyperparameter tuning: GridSearchCV vs. Optuna
  • Metriky a validace
    1. Confusion matrix, ROC vs. PR křivka (nevyvážená data)
    2. F1, balanced accuracy, MCC
    3. Interpretace modelu: SHAP/LIME
    4. K‑fold CV, stratifikace, time‑based split
  • Nasazení a provoz
    1. Export modelu (pickle/joblib vs. ONNX)
    2. Docker + REST API (FastAPI/Flask), CI/CD pipeline
    3. Monitoring kvality, logování predikcí, drift detekce, retraining (Airflow/cron), verzování (MLflow/DVC)
  • Hands‑on workshop
    1. Od CSV ke klasifikátoru: příprava dat, feature engineering, trénink modelů
    2. Vizualizace metrik (ROC/PR), SHAP interpretace
    3. Mini‑deploy (lokální REST API) + manažerský report
  • Bonus / rozšíření
    1. Active learning, semi‑supervised přístup
    2. Feature store & model registry (Feast, MLflow)
    3. Integrace se SIEM/SOC, automatické enrichování alertů
    4. Základy MLOps: monitoring, governance, reproducibility
Schedule:
2 days (9:00 AM - 5:00 PM )
Language: