Hello world!

Data Science & Machine Learning

[eXplainableAI (XAI)] XAI를 위한 유용한 툴들

xyz1 2022. 6. 15. 18:50

Explainer Dashboard

  • Regression, Binary Classification, Multiclass에 사용 가능
  • 사용 가능 모델: Catboost, Xgboost, LightGBM, Sklearn Ensemble, Linear models, SVM

각 class에 따른 결과값을 볼 수 있다.

  • Feature importance
    • SHAP
    • Permutation Importances
  • Classification stats
    • Confusion Matrix
    • Precision Plot
    • Classification Plot
    • ROC AUC Plot
    • PR AUC Plot
    • Lift Curve
    • Cumulative Precision
  • Cutoff prediction probability, percentile of samples 설정 가능
  • Individual Predictions
    • Prediction
    • Contributions Plot
    • Contributions Table
    • Partial Dependence Plot
  • What if analysis
    • Feature input값을 변경하면서 결과에 어떻게 영향을 미치는지 보는 것
  • Feature dependencies
    • Shap Summary
    • Shap Dependence
  • Feature interactions
    • Interactions Summary
    • Interaction Dependence
  • Decision trees

DEMO: http://titanicexplainer.herokuapp.com/multiclass/

라이센스: 상업적 이용 가능 (https://github.com/oegedijk/explainerdashboard/blob/master/LICENSE.txt)

 

DALEX + Arena

  • Predict-level explanations
    • Break Down
    • iBreakDown
    • Shapley Values
    Predict profile
    • Ceteris Paribus Profiles (관심을 가지고 있는 변수이외의 다른 변수들이 변하지 않을 때 관심있는 변수의 변화가 결과에 영향을 미치는 정도)
  • Predict parts: 하나의 예측값 조합이 들어갔을 때 들어간 각각의 예측값들이 모델 결과에 얼마나 영향을 미쳤는지 보기 위함
  • Model-level explanations
    • classification: F1, accuracy, recall, precision and AUC
    • regression: mean squared error, R squared, median absolute deviation
    Model parts
    • variable importance: 10 permutations, RMSE loss function을 통해 구한 결과
    Model profile
    • Partial Dependence
    • Accumulated local
  • Model performance
  • More explanations
    • Shap
    • Model diagnostics: Residual Diagnostics
    • Predict surrogate: LIME
    • Model surrogate: Decision Tree

DEMO (Arena를 통해 web 대시보드 생성 가능): https://arena.drwhy.ai/?demo=2

라이센스: 상업적 이용 가능(https://github.com/ModelOriented/DALEX/blob/master/LICENSE, https://github.com/ModelOriented/Arena/blob/master/LICENSE)

가이드 문서: https://arena.drwhy.ai/docs/guide/model-performance

 

Shapash

  • Regression, Binary Classification, Multiclass에 사용 가능
  • 사용 가능 모델: Catboost, Xgboost, LightGBM, Sklearn Ensemble, Linear models, SVM
  • SHAP/LIME 중 선택하여 plot 생성

https://shapash.readthedocs.io/en/latest/tutorials/plot/tuto-plot01-local_plot-and-to_pandas.html

  • Local explanation
  • Contributions plot - 특정 feature가 예측에 얼마나 영향을 끼쳤는지 보기 위함
  • Contributions comparing plot - 특정한 행 데이터들 끼리 어떤 Feature들이 영향력이 있었는지 서로 비교해보기 위함
  • Feature importance
  • Interactions plot

DEMO: https://shapash-demo.ossbymaif.fr

라이센스: 상업적 이용 가능 (https://github.com/MAIF/shapash/blob/master/LICENSE)