SHAP opis
1 EN
1.1 What SHAP tells you (simple)
- SHAP explains a prediction by answering: “Compared to a typical case, what pushed the model to this result?”
- It breaks each prediction into:
- Baseline = the model’s average output on “normal” (background) data
- Feature effects = how each feature pushes the prediction up or down
- For one person/row:
- positive SHAP value (\(\phi_j > 0\)) → feature pushes the prediction higher
- negative SHAP value (\(\phi_j < 0\)) → feature pushes the prediction lower
Key idea:
\[ \text{Prediction} = \text{Baseline} + \text{Sum of feature pushes} \]
1.2 How to read SHAP results (simple)
1.2.1 Local explanation (one row)
- Start from the baseline
- Add feature “pushes” one by one
- You end at the final prediction:
\[ f(x) = \mathbb{E}[f(X)] + \sum_{j=1}^{p} \phi_j \]
1.2.2 Global explanation (many rows)
- Feature importance is based on average size of pushes:
\[ I_j = \frac{1}{n}\sum_{i=1}^{n} |\phi_{i,j}| \]
1.2.3 Practical notes
- SHAP depends on the background dataset (it defines what “typical” means).
- For tree models, SHAP is often computed in log-odds (still: left = decreases, right = increases).
2 SI:
2.1 Kaj nam pove SHAP
- SHAP razloži napoved modela z vprašanjem:
»V primerjavi s tipičnim primerom – kaj je potisnilo napoved navzgor ali navzdol?« - Vsako napoved razdeli na:
- izhodiščno vrednost (baseline) = povprečna napoved modela
- prispevke posameznih spremenljivk = koliko vsaka spremenljivka napoved poveča ali zmanjša
- Za posamezen primer:
- pozitivna SHAP vrednost (\(\phi_j > 0\)) → spremenljivka napoved poveča
- negativna SHAP vrednost (\(\phi_j < 0\)) → spremenljivka napoved zmanjša
Ključna ideja:
\[ \text{Napoved} = \text{background} + \text{Vsota prispevkov spremenljivk} \]
2.2 Kako interpretiramo SHAP rezultate
2.2.1 Lokalna razlaga
- Začnemo pri izhodiščni vrednosti
- Prištejemo ali odštejemo prispevke posameznih spremenljivk
- Dobimo končno napoved:
\[ f(x) = \mathbb{E}[f(X)] + \sum_{j=1}^{p} \phi_j \]
2.2.2 Globalna razlaga (več primerov)
- Pomembnost spremenljivke temelji na povprečni velikosti njenega vpliva:
\[ I_j = \frac{1}{n}\sum_{i=1}^{n} |\phi_{i,j}| \]
2.2.3 Praktično
- SHAP je odvisen od background vzorca podatkov (ta določa, kaj pomeni »tipično«).
- Pri drevesnih modelih so prispevki pogosto izračunani v log-odds prostoru (a interpretacija ostane enaka: levo = zmanjšuje, desno = povečuje napoved).