Ga naar inhoud

Concept Uitwerking: Mitigatie van Math-Washing & Expert Bias

Datum: 13 maart 2026 Onderwerp: Bescherming van de professionele autonomie tegen 'Math-Washing' (automation bias) en het garanderen van schone data-input bij expert elicitatie in het BNS ecosysteem.


1. De Gevaren van Ruwe Data (Het Probleem)

A. Math-Washing

Wanneer een technisch systeem percentages genereert (bijv. "86.4% kans op falen van traject"), hebben mensen - en vooral professionals onder druk - de neiging om kritisch nadenken ("System 2" denken) uit te schakelen. Ze vertrouwen blind op het schijnbare objectieve cijfer ('Math-washing'). Dit ontneemt de professional (de Naaf) de daadwerkelijke verantwoordelijkheid, wat strijdig is met de doelen uit het Strategisch Borgingsrapport.

B. Expert Bias in de "Priors"

In sprint 1 vullen de Aandachtsfunctionarissen (de Spaken) de BNS tabellen in. Echter: specialisten zien vooral escalaties. Hierdoor overschatten zij stelselmatig risico's (Availability Heuristic). Als BORIS deze besmette aannames ("priors") kopieert, reproduceert de AI een pathologische, paniekerige focus en raken generalisten onterecht handelingsverlegen.

2. De Oplossing voor Math-Washing: UX & LLM Filters

De "Lossless Dynamic Fidelity" (LDF) Filter in de LLM Prompt

We grijpen in op de allerlaatste stap van de pipeline: het VERA-Bril LLM-prompt filter.

De Causal Engine API retourneert harde wiskunde: {"escalation_probability": 0.812}

De LLM krijgt een keiharde 'System Rule' (Ingebed in de AI Grondwet configuratie):

CRITICAL INSTRUCTION:
U ontvangt wiskundige waarschijnlijkheden van de BNS Causal Engine.
REGEL 1: Communiceer NOOIT ruwe percentages of getallen (zoals 81%, 0.8) naar gebruikers met een reading_level (DES) < 15.
REGEL 2: Transformeer wiskundige output altijd naar kwalitatieve, narratieve inschattingen conform Positieve Gezondheid.
REGEL 3: Benadruk altijd dat dit een statistisch patroon is, geen voorspelling van de toekomst.

De output naar de (L1) professional wordt:

"De analyse van historische data suggereert een aanzienlijke kwetsbaarheid voor escalatie in deze situatie, met name gedreven door factoren rondom slaappatroon. Wat zegt je eigen professionele intuïtie als je naar het herstelvermogen van deze inwoner kijkt?"

Voor de Curator/Management (L3+):

Gebruikers in de Yellow/Red Zone (DES > 15 of de LUMEN agent) krijgen wél de ruwe data en de "Logic Trace" (SHAP/Sensitivity values) te zien, om macro-strategische beslissingen te kunnen nemen.

3. De Oplossing voor Expert Bias: Bayesian Updating

We voorkomen dat de meningen van de Aandachtsfunctionarissen statische "feiten" worden door Machine Learning (Bayesian Updating) toe te passen via een feedback loop.

Het Werkingsmechanisme

  1. Initiële Priors (Tijdstip=0): Bepaald door experts en de RAG-data ("De Autisme Bijbel"). Er wordt bijvoorbeeld aangenomen dat "Ontbreken van Dagbesteding" altijd leidt tot onmiddellijke crisis bij autisme.
  2. Data Captie via de Scout Agent: Over de maanden heen legt de Scout Agent (via SharePoint documenten en intakeverslagen) vast wat er werkelijk gebeurt in gesloten casussen. De Universele Data Standaard (UDS) slaat op: wat was de PGES score ten tijde van intake, en wat was de PGES score na afsluiting van het dossier?
  3. De Update Loop (POST /causal/update_cpt): Het BNS algoritme vergelijkt de voorspelling (de expert mening) met de realiteit (de UDS-metadata output).
  4. Kalibratie: Als blijkt dat 30% van de inwoners zonder dagbesteding juist verbazingwekkend stabiel is (omdat bijvoorbeeld hun 'Sociaal Kapitaal' dit opvangt), stelt het netwerk de achterliggende wiskundige verwachting (CPT's) naar beneden bij.

4. Architecturale Borging voor Claude Code

Zorg bij de uitwerking door Claude Code voor de volgende technische ankers:

  • Pydantic Prompt Wrappers: De return-prompts van VERA moeten dwingend ge-valideerd worden op de reading_level tag. Als user.DES < 15, en de output regex /([0-9]{2}%|0\.[0-9]+)/ triggert -> Block de output (retry).
  • Synergy Logs voor de RvT (Raad van Toezicht): Bouw in de API Gateway een monitoringsdashboard. De LUMEN agent leest de causal_audit_log tabel uit en toetst kwartaallijks "De Mate van Model Drift" (Hoeveel weken het huidige model is afgeweken van de initiële aannames van de experts). Dit levert het bewijs ("Logic Trace") op dat BORIS niet bias reproduceert, maar systematisch objectiveert.