SHAP opis

1 EN

1.1 What SHAP tells you (simple)

SHAP explains a prediction by answering: “Compared to a typical case, what pushed the model to this result?”
It breaks each prediction into:
- Baseline = the model’s average output on “normal” (background) data
- Feature effects = how each feature pushes the prediction up or down
For one person/row:
- positive SHAP value (\(\phi_j > 0\)) → feature pushes the prediction higher
- negative SHAP value (\(\phi_j < 0\)) → feature pushes the prediction lower

Key idea:

\[ \text{Prediction} = \text{Baseline} + \text{Sum of feature pushes} \]

1.2 How to read SHAP results (simple)

1.2.1 Local explanation (one row)

Start from the baseline
Add feature “pushes” one by one
You end at the final prediction:

\[ f(x) = \mathbb{E}[f(X)] + \sum_{j=1}^{p} \phi_j \]

1.2.2 Global explanation (many rows)

Feature importance is based on average size of pushes:

\[ I_j = \frac{1}{n}\sum_{i=1}^{n} |\phi_{i,j}| \]

1.2.3 Practical notes

SHAP depends on the background dataset (it defines what “typical” means).
For tree models, SHAP is often computed in log-odds (still: left = decreases, right = increases).

2 SI:

2.1 Kaj nam pove SHAP

SHAP razloži napoved modela z vprašanjem:
»V primerjavi s tipičnim primerom – kaj je potisnilo napoved navzgor ali navzdol?«
Vsako napoved razdeli na:
- izhodiščno vrednost (baseline) = povprečna napoved modela
- prispevke posameznih spremenljivk = koliko vsaka spremenljivka napoved poveča ali zmanjša
Za posamezen primer:
- pozitivna SHAP vrednost (\(\phi_j > 0\)) → spremenljivka napoved poveča
- negativna SHAP vrednost (\(\phi_j < 0\)) → spremenljivka napoved zmanjša

Ključna ideja:

\[ \text{Napoved} = \text{background} + \text{Vsota prispevkov spremenljivk} \]

2.2 Kako interpretiramo SHAP rezultate

2.2.1 Lokalna razlaga

Začnemo pri izhodiščni vrednosti
Prištejemo ali odštejemo prispevke posameznih spremenljivk
Dobimo končno napoved:

\[ f(x) = \mathbb{E}[f(X)] + \sum_{j=1}^{p} \phi_j \]

2.2.2 Globalna razlaga (več primerov)

Pomembnost spremenljivke temelji na povprečni velikosti njenega vpliva:

\[ I_j = \frac{1}{n}\sum_{i=1}^{n} |\phi_{i,j}| \]

2.2.3 Praktično

SHAP je odvisen od background vzorca podatkov (ta določa, kaj pomeni »tipično«).
Pri drevesnih modelih so prispevki pogosto izračunani v log-odds prostoru (a interpretacija ostane enaka: levo = zmanjšuje, desno = povečuje napoved).