Pediatrisch delier (PD) en emergence delier (ED)

Initiatief: NVvP Aantal modules: 15

Meetinstrumenten pediatrisch delier (PD)

Uitgangsvraag

Met behulp van welke meetinstrumenten kan een pediatrisch delier het best worden gedetecteerd?

 

De uitgangsvraag omvat de volgende deelvragen:

  1. Met behulp van welke meetinstrumenten kan een pediatrisch delier het best worden gedetecteerd ten behoeve van screening en detectie?
  2. Met behulp van welke meetinstrumenten kan het verloop van de ernst van een pediatrisch delier gemeten en het verloop gemonitord worden?

Aanbeveling

Aanbeveling 1

Laat verpleegkundigen drie keer per dag screenen op PD bij patiënten die langer dan 48 uur zijn opgenomen op een kinder-IC met CAP-D of SOS-PD als screeningsinstrument. Dit als onderdeel van het routinematig meten van (pijn en) discomfort.

 

Aanbeveling 2

Laat verpleegkundigen op een (medium care) kinderafdeling een screenings-instrument gebruiken bij kinderen met een hoog risico (bijvoorbeeld post IC) voor screening op PD gedurende 72 uur.

Overwegingen

In tegenstelling tot delier bij volwassenen is nog maar beperkt onderzoek gedaan naar de validiteit (bijvoorbeeld sensitiviteit en specificiteit) en betrouwbaarheid van screeningsinstrumenten voor delier bij kinderen. De genoemde instrumenten zijn alleen gevalideerd bij ernstig zieke kinderen op een kinder-IC en zijn behoudens één studie (Ista, 2018, SOS-PD) allemaal mono-center studies. Onderzoek naar de validatie van deze instrumenten als screeningsinstrument voor delier bij kinderen opgenomen op een kinderafdeling ontbreekt. Echter, het is aannemelijk dat de instrumenten ook toepasbaar zijn voor het gebruik voor delier screening bij kinderen op een kinderafdeling, aangezien de te observeren gedragingen ook te observeren zijn bij niet ernstige zieke en/of gesedeerde kinderen. De SOS-PD schaal bestaat naast het PD-component ook uit een deel om ontwenning van sedativa en opiaten vast te stellen. Dit is de Sophia Ontwenningsverschijnselen Scorelijst (SOS) en is eveneens een valide instrument (Ista, 2013). Gebruik van sedativa (zoals benzodiazepinen) en opiaten (zoals morfine) bij ernstige zieke kinderen op een kinder-IC vormen een mogelijke risicofactor voor de ontwikkeling van een PD.

 

De pCAM-ICU is alleen geschikt bij kinderen vanaf 5 jaar. Wanneer hiervan gebruik wordt gemaakt is ook het gebruik van de psCAM-ICU (geschikt voor kinderen van 6 maanden tot 5 jaar) aan te bevelen Hiermee wordt de gehele leeftijdsperiode afgedekt. Echter, vereisen deze instrumenten dat het kind in staat moet zijn om opdrachten uit te voeren. Dit kan het gebruik in de praktijk bemoeilijken, zeker bij kinderen die ernstig ziek en/of gesedeerd zijn.

 

Het voordeel van de andere instrumenten is dat zij gedrag observeren, wat een integraal onderdeel is van het werk van zorgprofessionals, en in het bijzonder van verpleegkundigen in de dagelijks praktijk.

 

Evenals bij volwassenen, kan ook het PD worden onderscheiden in een hyperactief en/of een hypoactief delier (zie de module ‘Symptomen en Criteria PD’). Voor de behandeling van een delier is het relevant om gebruik te maken van dit onderscheid. Bij geen van de beschreven instrumenten is expliciet onderzoek gedaan naar vormen van delier en de validiteit van het instrument voor de verschillende vormen. In de studies naar de validiteit van CAP-D en de SOS-PD werd wel een onderscheid gemaakt in de vorm van delier, dit gebeurde echter op basis van de gouden standaard (psychiater) en niet aan de hand van het instrument zelf. Wel heeft zowel de CAP-D als de SOS-PD items die betrekking hebben op een hypoactief delier, zoals apathie. Daarnaast kan overwogen worden om in aanvulling op de delierscore gebruik te maken van de COMFORT gedragscore of de Richmond Agitation Sedation Score (RASS) om te beoordelen of sprake is van overmatige onrust wat kan duiden op een hyperactief delier.

 

Op basis van de individuele studies en klinische ervaring kan geconcludeerd worden dat het gebruik van de CAP-D, pCAM-ICU, psCAM-ICU en de SOS-PD als screeningsinstrumenten voor PD klinisch relevant is en het systematische gebruik in de dagelijkse praktijk kan leiden tot vroegtijdige signalering van een PD bij ernstig zieke kinderen. Vanuit klinisch expertise is bekend dat als geen systematische screening plaats vindt, dit leidt tot het missen of te laat onderkennen en zo nodig behandelen van het PD. De CAP-D en de SOS-PD zijn instrumenten die toepasbaar zijn bij een brede leeftijdscategorie. Het gebruik van screeningsinstrumenten voor PD bij beademen en gesedeerde kinderen op een kinder-IC dient gecombineerd te worden met het gebruik van de COMFORT gedragscore of de Richmond Agitation Sedation Score (RASS). Bij te diep gesedeerd, of patiënten met en te laag bewustzijn (COMFORT gedrag score <11 of RASS < -3) is afname van een PD score niet betrouwbaar.

 

Wanneer de uitslag van een screeningsinstrument aanleiding geeft tot verdenking van een delier kan een kinderpsychiater worden geconsulteerd om de verdenking te bevestigen. Echter, niet alle zorginstellingen (bijvoorbeeld algemeen ziekenhuis) hebben een kinderpsychiater tot hun beschikking. In dat geval kan door een behandeld (kinder)arts de Vanderbilt Assessment for Delirium in Infants and Children to Standardize Pediatric Delirium (VADIC) worden gebruikt als bevestiging voor het Delirium in Infants and Children to Standardize Pediatric Delirium (VADIC) worden gebruikt als bevestiging voor het PD (Gangopadhyay, 2017). De VADIC biedt een alomvattend raamwerk om de beoordeling van het PD bij kinderen door psychiaters en andere artsen te standaardiseren. Echter, het ontbrak nog aan een goede validatiestudie tegen een externe standaard en daarom werd de VADIC niet beschreven bij de samenvatting literatuur van deze module.

 

Waarden en voorkeuren van patiënten

Het belangrijkste doel van het gebruik van PD-screeninginstrumenten is het vroegtijdig opsporen van een delier bij kinderen opgenomen in het ziekenhuis, op een kinderafdeling en/of kinder-IC. Vroegtijdige onderkenning van een delier en daarmee adequate preventie en behandeling draagt bij aan een betere kwaliteit van zorg. Naast de genoemde instrumenten zijn ouders onmisbaar in het opletten en alarm slaan als er iets verandert in het gedrag van hun kind.

 

Kosten

Het screenen op PD met een van de beschreven instrumenten vereist geen extra financiële middelen. PD-screening kan onderdeel zijn van de systematische screening op pijn en discomfort (in het bijzonder op de kinder-IC’s). Dit komt neer op één keer per dienst bij kinderen op een kinder-IC. Daarbij is het aan te bevelen om hiermee te starten 24 tot 48 uur na opname, omdat de patiënt dan veelal gestabiliseerd is. Tevens voorkomt dit screening van patiënten die kortdurend (bijvoorbeeld postoperatief voor < 24 uur) worden opgenomen. Tot slot dienen de uitkomsten van de PD-screening dagelijks, of zo nodig vaker, besproken en teruggekoppeld te worden aan behandelaars en ouders en vastgelegd te worden in het patiëntendossier.

 

Aanvaardbaarheid voor de overige stakeholders

De validiteit en betrouwbaarheid van de screeningsinstrumenten is vooralsnog alleen onderzocht bij patiënten op een kinder-IC. De incidentie en prevalentie van PD buiten de kinder-IC (emergence delier uitgesloten) is niet bekend. Maar het is aannemelijk dat PD ook op een kinderafdeling/medium care voorkomt. Kinderen die worden overgeplaatst van de kinder-IC hebben mogelijk een verhoogd risico op PD (zie de module ‘Risicofactoren PD’). Verpleegkundigen en artsen op de kinderafdelingen dienen dan ook extra alert te zijn op symptomen van een PD. Wanneer bij een kind op de kinder-IC een PD is gediagnostiseerd, dient dit in de overdracht aan de kinderafdeling te worden vermeld. Daarnaast is het raadzaam om het verloop van het PD te vervolgen met hetzelfde instrument als op de kinder-IC om het PD goed te kunnen evalueren. Verpleegkundigen en artsen op de kinderafdelingen dienen dan ook geschoold te zijn in het gebruik van de screeningsinstrumenten.

 

Haalbaarheid en implementatie

Er dient voor de implementatie van routinematige screening van kinderen aandacht te zijn voor de tijdsinvestering die het van verpleegkundigen vraagt. Het invullen van de screeningsinstrumenten kost de verpleegkundige tussen de 2 en 5 minuten. Het dagelijks een of meerdere keren screenen op symptomen van PD kost relatief weinig tijd. Echter, kan de perceptie van verpleegkundigen zijn dat deze extra taak de werkdruk verhoogt. Dit kan mogelijk weerstand bij verpleegkundigen teweegbrengen omdat het takenpakket van de verpleegkundigen de laatste jaren sterk is toegenomen. Allereerst is goede informatie over de relevantie van het routinematig screenen en training in toepassing van de instrumenten noodzakelijk. Daarnaast is een goede organisatie van zorg nodig die systematische screening mogelijk maakt. Het opnemen van een screeningsinstrument in het elektronisch patiëntendossier is aan te bevelen, dit kan bijdragen aan betere naleving.

 

Hoewel weinig onderzoek is gedaan naar PD op een algemene kinderafdeling, bestaat het vermoeden dat de prevalentie laag is. Daarnaast zijn kinderen veelal jong en kort opgenomen. Dit maakt dat de doelgroep voor screening kleiner is dan op een kinder-IC. Voor het screenen van kinderen op een gewone kinderafdeling is het wenselijk om dit te doen bij kinderen met een verhoogd risico, zoals kinderen die worden overgeplaatst vanaf een kinder-IC. Omdat een beperkt aantal kinderen op een kinderafdeling in aanmerking komt voor screening, is te verwachten dat verpleegkundigen hier minder snel routine in krijgen. Hierdoor kan implementatie en borging in gevaar komen. Continue educatie is wenselijk, bijvoorbeeld middels een online tool.

 

Tot slot, het is wenselijk dat voor continuïteit in zorg tussen kinder-IC’s als wel tussen kinder-IC’s en kinderafdelingen zoveel mogelijk op nationaal niveau gewerkt wordt met één meetinstrument. Dit is in het belang van de individuele patiëntenzorg als ook in het kader van regionale en/of landelijke zorgevaluatie.

 

Concluderend:

Screening op PD:

  • Is mogelijk met gevalideerde instrumenten. Hierbij hebben de CAP-D en de SOS-PD de voorkeurgezien de bruikbaarheid van brede leeftijdspopulatie en gebaseerd op het gedrag van kind. Het gebruik van de SOS-PD heeft mogelijk een lichte voorkeur, aangezien een deel van het instrument gebruikt kan worden voor de observatie van ontwenningsverschijnselen.
  • Vereist minimale tijdinvestering.
  • Zorgt voor vroegtijdige onderkenning van PD als complicatie.

Onderbouwing

Om een pediatrisch delier (PD) vroegtijdig te onderkennen en vast te stellen bij kinderen met een verhoogd risico op een PD kunnen verpleegkundigen, artsen of andere professionals gebruik maken van meetinstrumenten. Deze instrumenten kunnen behulpzaam zijn bij het bepalen of er daadwerkelijk sprake is van een PD. Met de score van een meetinstrument kan een initiële behandeling worden gestart en een consult van de deskundig arts (bijvoorbeeld kinder- en jeugdpsychiater) worden geïndiceerd, zodat die een diagnose PD kan bevestigen. De diagnostische accuratesse van deze instrumenten wordt onderzocht.

psCAM-ICU

Laag

GRADE

De psCAM-ICU is mogelijk geschikt voor screenen op de aanwezigheid van een PD bij kinderen in de leeftijd van 6 maanden tot 5 jaar.

 

Bronnen: (Smith, 2011; Luetz, 2016)

 

pCAM-ICU

Laag

GRADE

De pCAM-ICU is mogelijk geschikt voor screenen op de aanwezigheid van een PD bij kinderen vanaf 5 jaar.

 

Bronnen: (Smith, 2011; Luetz, 2016)

 

CAPD

Laag

GRADE

De CAP-D is mogelijk geschikt voor screenen op de aanwezigheid van een PD.

 

Bronnen: (Silver, 2011; Traube, 2014)

 

SOS-PD

Laag

GRADE

SOS-PD is mogelijk geschikt voor screenen op de aanwezigheid van een PD.

 

Bronnen: (Ista, 2018a en b)

 

PAED

Laag

GRADE

De PAED is mogelijk geschikt voor screenen op de aanwezigheid van een PD, met name voor post anesthesie.

 

Bronnen: (Janssen, 2011; Blankespoor, 2012; Luetz, 2016)

 

Diagnostische instrumenten

DRS

Laag

GRADE

De DRS is mogelijk geschikt voor diagnosticeren van een PD.

 

Bronnen: (Janssen, 2011)

 

Ernstmeetinstrumenten

sspCAM-ICU

Laag

GRADE

De sspCAM-ICU is mogelijk geschikt voor het meten van de ernst van een delier.

 

Bronnen: (Luetz, 2016)

Beschrijving studies

Naast de vijf artikelen uit de richtlijn van 2014 (Blankespoor, 2012; Janssen, 2011, Silver, 2012; Traube, 2014; Smith, 2011), werden er vier nieuwe artikelen toegevoegd (Ista, 2018 a en b, Luetz, 2016, Smith, 2016), dus in totaal negen studies voldeden aan de PICO. Het betrof Engelstalige publicaties over instrumenten die na 2011 werden ontwikkeld en/of gevalideerd voor het diagnosticeren van een delier bij kinderen. Deze artikelen beschreven de volgende meetinstrumenten:

  • psCAM-ICU (Smith, 2016).
  • pCAM-ICU (Luetz, 2016; Smith, 2011)
  • CAP-D (Traube, 2014; Silver, 2012).
  • SOS-PD (Ista, 2018a en b).
  • PAED (Luetz, 2016; Blankespoor, 2012; Janssen, 2011).
  • DRS (Jansen, 2011).

 

Tabel 1 Samenvatting test eigenschappen meetinstrumenten voor PD

Instrument

Leeftijdsgroep

Score range

(afkappunt)

Interbeoordelaars-betrouwbaarheid

Sensitiviteit

Specificiteit

Klinische toepassing

psCAM-ICU (Smith, 2016f)

6 maanden tot 5 jaar

Features 1, 2 and 3 or 4 Positive = delirium *

0,79 (95% BI 0,76-0,83)a

91% (95% BI 90-93)

75% (95% BI, 72-78)

Aan bed door professional, kind moet opdrachten kunnen uitvoeren.

Afname tijd ± 5 min

pCAM-ICU

I: (Smith, 2016)

II: (Luetz, 2016)

 ³ 5 jaar

Features 1, 2 and 3 or 4 Positive = delirium *

0,96 (95% BI 0,74-1,0) a

I: 83% (95% BI 66-93%)

II: 77% (95% BI 46-95%)

 

I: 99% (95% BI 95-100%)

II: 98% (95% BI 90-100%)

Aan bed door professional, kind moet opdrachten kunnen uitvoeren.

Afname tijd ± 5 min.

CAP-D

I: (Silver, 2012)

II: (Traube, 2014)

0 tot 21 jaar

0 tot 40

(9)

0,94 (items 0,68-0.78) a

I: 92%

II: 94% (95% BI 84-99%)

I: 100%

II: 79 % (95% BI 74-85%)

Observatie aan bed door professional gedurende zorgverlening.

Afname tijd ± 2 min.

SOS-PD

I:(Ista 2018a)II: (Ista, 2018b)

0 tot 16 jaar

0 tot 15

(4)

0,99 (95% BI (0,98-0,99%) b

Items (0,79-1,0) a

I: 97% (95% BI 80-99%)

II: 92%

I: 92% (95% BI 60-99%)

II: 97%

Observatie aan bed door professional gedurende zorgverlening.

Afname tijd ± 2 min.

PAED (Luetz, 2016; Blankespoor, 2012; Janssen, 2011)

1 tot 17 jaar

0 tot 25

(10)

onbekend

91%

98%

Aan bed door professional, afname tijd ± 2 min.

DRS (Jansen, 2011)

1 tot 17 jaar

DRS-88: (³ 10)

DRS-98-R: (³ 15)

onbekend

DRS-88: 92%

DRS-98-R:75%

DRS-88: 100%

DRS-98-R: 100%

Aan bed door professional, afname tijd onbekend

 

Resultaten

De resultaten zijn per meetinstrument beschreven. Er volgt een beschrijving van het instrument en daarna van de diagnostische accuratesse van het instrument.

 

Preschool CAM-ICU (psCAM-ICU)

De psCAM-ICU is een aangepaste versie van de volwassen versie van de CAM-ICU en de pCAM-ICU en is gevalideerd voor het vaststellen van delier bij ernstig zieke kinderen in de leeftijd van 6 maanden tot 5 jaar (Smith, 2016). De psCAM-ICU bestaat uit vier kenmerken die zijn beschreven in tabel 2. In een prospectieve studie (n=300), werd de psCAM-ICU gescoord door een groep van experts en vergeleken met de gouden standaard (diagnose door psychiater - volgens DSM IV criteria) bij kinderen jonger dan 5 jaar in de Verenigde Staten. De mediane leeftijd was 20 maanden (Inter Kwartielrange IKR 10 tot 37) en in totaal werden 530 gepaarde metingen (psCAM-ICU versus Expert) uitgevoerd. Zij vonden een sensitiviteit van 75% (95% BI 72% tot 78%) en een specificiteit van 91% (95% BI 90% tot 93%). De positief voorspellende waarde was 84% (95% BI 81% tot 87%) en de negatief voorspellende waarde 86% (95% BI 84% tot 88%). Naast de volledige psCAM-ICU hebben de onderzoekers ook nog een verkorte versie van de psCAM-ICU onderzocht. Deze zou beter in de klinische (dagelijkse) praktijk toepasbaar zijn. Van de verkorte psCAM-ICU vonden ze een sensitiviteit van 78% (95% BI 75% tot 80%) en een specificiteit van 86% (95% BI 84% tot 88%). De positief voorspellende waarde was 78% (95% BI 74% tot 81%) en de negatief voorspellende waarde 86% (95% BI 85% tot 88%).

 

De interbeoordelaarsbetrouwbaarheid voor de psCAM-ICU tussen de twee observatoren was 0,79 (95% BI (0,76 tot 0,83); Cohen’s kappa).

 

Tabel 2 Preschool Confusion Assessment Method – Intensive Care Unit (psCAM-ICU)

Kenmerken Score

Score

 

 

1. Acuut begin of fluctuerend beloop (in afgelopen 24u) aanwezig afwezig

 

aanwezig

afwezig

2. Verminderde aandacht (score: 3 of meer plaatjes fout)

Visueel: 10 plaatjes (herkenning)

 

aanwezig

afwezig

3. Wisselend bewustzijnsniveau

Patiënt is niet alert of kalm. Bijvoorbeeld RASS niet 0 (0 = kalm en alert)

 

aanwezig

afwezig

4. Disorganised Brain

Patiënt heeft een verstoord slaap-waak patroon

 

aanwezig

afwezig

Conclusie psCAM-ICU: Kenmerk 1, 2 en 3 en/of 4 aanwezig

 

positief

negatief

 

pCAM-ICU

De pCAM-ICU is een aangepaste versie van de volwassen versie van de CAM-ICU en is gevalideerd voor het vaststellen van delier bij ernstig zieke kinderen van vijf jaar of ouder (Smith, 2011). De pCAM-ICU bestaat uit vier kenmerken die zijn beschreven in tabel 3. In een prospectieve studie (n=68), werd de pCAM-ICU, gescoord door een groep van experts en vergeleken met de gouden standaard (diagnose door psychiater - volgens DSM IV criteria) bij kinderen van 5 jaar en ouder in de Verenigde Staten. Zij vonden een sensitiviteit van 83% (95% BI 66% tot 93%) en een specificiteit van 99% (95% BI 95% tot 100%). De positief voorspellende waarde was 93% (95% BI 63% tot 99%) en de negatief voorspellende waarde 98% (95% BI 93% tot 99%); likelihood ratio was 105 (95% BI 14 tot 748).

 

De interbeoordelaarsbetrouwbaarheid voor de pCAM-ICU tussen de twee observatoren was 0,96 (95% BI 0,74 tot 1,00); Cohen’s kappa).

 

De pCAM-ICU werd nogmaals gevalideerd in Duitsland. De pCAM-ICU werd één keer per dag door een vaste intensivist bepaald en vergeleken met de diagnose van een delirium expert (één psychiater en één intensivist) volgens de DSM-IV TR (Luetz, 2016). In deze studie werden 64 kinderen van 5 jaar en ouder onderzocht met het genoemde instrument. De pCAM-ICU werd gedurende maximaal de eerste 21 dagen van opname bepaald en alleen als de Richmond Agitation Sedation (RASS) score groter of gelijk dan -2 was. Met de pCAM-ICU werden 10 van de 13 delirium diagnoses gevonden. De sensitiviteit was daarmee 76,9% (95% BI 46,2% tot 95,0%) en de specificiteit 98% (95% BI 89,6% tot 100,0%). Ook werd een positief voorspellende waarde van 90,9% (95% BI 58,7% tot 99,8%) gevonden en een negatief voorspellende waarde van 94,3 (95% BI 84,3% tot 98,8%); de likelihood ratio was 39 (95% BI 6 tot 279).

 

De interbeoordelaarsbetrouwbaarheid voor de pCAM-ICU tussen de twee observatoren was 0,91 (95% BI 0,61 tot 0,95%); n=42 gepaarde observaties; Cohen’s kappa).

 

Tabel 3 Pediatric Confusion Assessment Method – Intensive Care Unit (pCAM-ICU)

Kenmerken Score

Score

 

 

1. Acuut begin of fluctuerend beloop (in afgelopen 24u) aanwezig afwezig

 

aanwezig

afwezig

2. Verminderde aandacht (score kleiner dan 8)

ASE auditief: SAVEAHAART (bij A knijpen in hand)

Of ASE visueel: 5 en dan 10 plaatjes (herkenning)

 

aanwezig

afwezig

3. Ongeorganiseerd denken (gecombineerde score kleiner dan 4)

4. Vragen

 

aanwezig

afwezig

Set A

1. Zijn er vissen in de zee?

2. Is ijs warm?

3. Vliegen vogels?

4. Is de zon geel?

Set B

1. Zijn er olifanten in de zee?

2. Is ijs koud?

3. Vliegen koeien?

4. Is de zon zwart?

 

En 2 opdrachten

1. Steek eens zoveel vingers op (Onderzoeker houdt twee vingers op).

2. Doe nu hetzelfde met de andere hand (onderzoeker laat nu niet twee vingers zien).

 

 

 

4. Veranderd bewustzijnsniveau

RASS niet 0 (0 = kalm en alert)

 

aanwezig

afwezig

Conclusie p-CAM-ICU: Kenmerk 1, 2 en 3 en/of 4 aanwezig

 

positief

negatief

De p-CAM-ICU is positief indien kenmerk 1, 2 en 3 en/of 4 aanwezig zijn (dus kenmerk 1, 2 en 3, of kenmerk 1, 2 en 4 of kenmerk 1, 2, 3 én 4). In principe hoef je dus kenmerk 3 niet te testen indien kenmerk 1, 2 en 4 positief zijn. RASS – Richmond Agitation Sedation Score

 

CAP-D

De CAP-D werd ontwikkeld voor het meten van PD op de kinder-IC en is een aangepaste versie van de PAED (Silver, 2012). De auteurs hebben de oorspronkelijke items aangepast van beweringen naar vragen (tabel 4a). Daarnaast zijn er twee items toegevoegd waarmee het beter mogelijk moet zijn om een onderscheid te maken tussen, hypoactief-, hyperactief delier of een combinatie van beide. In een prospectieve pilotstudie bij 55 kinderen (drie maanden tot 21 jaar), werd de CAP-D vergeleken met de DSM-IV criteria (psychiater) en werd een sensitiviteit van 91% en een ideale specificiteit van 100% gevonden. Het gehanteerde afkappunt hierbij was een score van tien of hoger. Indien alleen gebruikt werd gemaakt van de PAED items zouden zeven van de 14 patiënten met delier zijn gemist (vijf hypoactief delier, één mixed en één hyperactief delier). Door toevoeging van twee items aan de CAP-D verbeterde de interne consistentie van 0,79 naar 0,89 (Cronbach’s alpha).

 

Tabel 4a Cornell Assessment of Pediatric Delirium (CAP-D)

Items

Punten

1. Maakt het kind oogcontact met de verzorger?a

 

2. Zijn de handelingen van het kind doelgericht? a

 

3. Is het kind zich bewust van zijn/haar omgeving? a

 

4. Is het kind rusteloos? a

 

5. Is het kind te troosten? a

 

6. Is het kind traag (hypoactief): heel weinig bewegingen en interactie? b

 

7. Zijn de reacties van het kind spaarzaam en/of vertraagd? b

 

Score (≥ 10 delier aanwezig)

 

a Items van de originele PAED, aangepast van stellingen naar vragen.

b Vragen toegevoegd om de vaststelling van hypoactief of gemengde vorm van delier te verbeteren.

Score items 1, 2 en 3 omgekeerd scoren: 4 = helemaal niet, 3 = een beetje, 2 = behoorlijk, 1 = erg, 0 = extreem. Items 4 en 5, 6 en 7 scoren: 0 = helemaal niet, 1 = een beetje, 2 = behoorlijk, 3 = erg, 4= extreem

 

Tabel 4b Cornell Assessment of Pediatric Delirium (CAP-D)

Items

Punten

1. Maakt het kind oogcontact met de verzorger?a

 

2. Zijn de handelingen van het kind doelgericht? a

 

3. Is het kind zich bewust van zijn/haar omgeving? a

 

4. Geeft het kind aan wat zij/hij nodig heeft of wilt? b

 

5. Is het kind rusteloos? a

 

6. Is het kind te troosten? a

 

7. Is het kind traag (hypoactief): heel weinig bewegingen en interactie? b

 

8. Zijn de reacties van het kind spaarzaam en/of vertraagd? b

 

Score (≥ 9 delier aanwezig)

 

a Items van de originele PAED, aangepast van stellingen naar vragen.

b Vragen toegevoegd om de vaststelling van hypoactief of gemengde vorm van delier te verbeteren.

Score items 1, 2, 3 en 4 omgekeerd scoren: 4 = nooit, 3 = zelden, 2 = soms, 1 = vaak, 0 = altijd. Items 5, 6, 7 en 8 scoren: 0 = nooit, 1 = zelden, 2 = soms, 3 = vaak, 4 = altijd

 

Op basis van de pilotstudie werd nog een extra item toegevoegd, om wisselingen in cognitieve functie beter te kunnen vaststellen (item 4, tabel 4b). Het afkappunt van de CAP-D score werd gelegd bij 9 of hoger. De validiteit van de aangepaste CAP-D werd bepaald in een prospectieve studie door dezelfde onderzoeksgroep bij 111 kinderen (0 tot 21 jaar) (Traube, 2014). In deze studie werd eveneens de CAP-D vergeleken met het oordeel van de psychiater (gouden standaard, volgens de DSM-IV criteria). Zij vonden een sensitiviteit van 94,1% (95% BI 83,8 tot 98,8%) en een specificiteit van 79,2% (95% BI 73,5 tot 84,9%). De overeenkomst tussen de CAP-D en de diagnose gesteld door de psychiater was 62% (r=0,62). De interbeoordelaarsbetrouwbaarheid tussen verpleegkundigen was 0,94 (kappa en varieerde voor de afzonderlijke items van de CAP-D tussen 0,68 en 0,78.

 

SOS-PD

SOS-PD staat voor de Sophia Ontwenningsverschijnselen Score - Pediatrisch Delier schaal (SOS-PD schaal) (Van Dijk, 2012). Dit meetinstrument bestaat uit 17 items die staan voor symptomen van een PD en een item dat het perspectief van de ouders reflecteert (“ouders herkennen het gedrag van hun kind niet meer als normaal”) (Tabel 5). De aanwezigheid van een symptoom wordt gescoord met een “ja” als het gedurende enig moment werd gezien in de voorgaande vier uur. Deze items werden gescoord door getrainde verpleegkundigen. Voor de items “hallucinaties” en “ouders herkennen het gedrag van hun kind niet meer als normaal” werd een score van 4 punten toegekend. Een score van ≥ 4 werd gezien als de aanwezigheid van een PD waarna een psychiater in consult werd gevraagd.

 

Het delier component van de SOS-PD schaal werd gevalideerd bij 146 kinderen (mediane leeftijd 49 maanden), waarvan 53% werd beademd. Na een positieve score op de SOS-PD werd de kinderpsychiater in consult gevraagd voor een diagnose conform DSM-IV. Hierbij werd een sensitiviteit van 96,8% (95% BI 80,4% tot 99,5%) en een specificiteit van 92,0% (95% BI 59,7% tot 98,9%) gevonden (Ista, 2018a).

 

Vervolgens werd dit meetinstrument gevalideerd in vier kinder-IC’s van universitaire ziekenhuizen bij 485 kinderen van 3 maanden en ouder (mediane leeftijd 27 maanden) (Ista, 2018b). De DSM-IV, bepaald door een psychiater, werd gebruikt als de referentiestandaard. Aangezien de psychiater normaal gesproken alleen in consult werd gevraagd bij een positieve testuitslag, werd ook bij een selectie van patiënten met een negatieve testuitslag een psychiater in consult gevraagd. Hierdoor werd ook een beeld gekregen van de fout-negatieve scores.

 

Deze validatie gaf een sensitiviteit van 92,3% en een specificiteit van 96,5%. Er werd een waarde onder de ROC-curve van 0,989 gezien. De positief voorspellende waarde was 76,4% en de negatief voorspellende waarde 99,1%.

 

Construct validity: De PD-score zijn vergeleken met de CAP-D in 144 situaties. De Pearson correlatiecoëfficiënt tussen de totaalscores van beide instrumenten was 0,89 (95% BI 0,82 tot 0,93%); p<0,001).

 

De interbeoordelaarsbetrouwbaarheid tussen verpleegkundigen en onderzoeker voor de individuele items van de PD-schaal varieerde tussen de 0,79 en 1,0 (Cohen’s kappa). De overeenkomst (intraclass correlatiecoëfficiënt) tussen verpleegkundigen en onderzoekers voor de totaalscore van de PD-schaal was 0,99 (95% BI 0,98 tot 0,99%).

 

Tabel 5 SOS-PD schaal

Symptoom

Ontwenning

Delier

Stap 1: Ouders

 

 

Ouders: Herkennen gedrag kind niet “dit is niet mijn kind..” – onherkenbaar

 

c

Stap 2: (scoor onderstaande symptomen)

 

 

Tachycardie

c

 

Tachypnoe

c

 

Koorts

c

 

Transpireren

c

c

Agitatie / rusteloosheid

c

c

Angst

c

c

Tremoren

c

c

Motorische onrust

c

c

Toegenomen spierspanning / afwijkende houding

c

c

Verminderde aandacht

 

c

Handelt niet doelgericht

 

c

Oogcontact verminderd / afwezig

 

c

 

 

 

Ontroostbaar huilen

c

c

Grimassen

c

c

Slapeloosheid / verstoord slaappatroon

c

c

Hallucinaties*

c

c*

Braken

c

 

Diarree

c

 

Acuut begin

 

c

Fluctuerend verloop

 

c

 

 

 

SOS score (ontwenning)

 

 

Delier score

(max. is 15) tel aantal aangekruiste vakjes stap 2

Overleg kinder- en jeugdpsychiater als:

Stap 1 is positief EN/ OF Stap 2 score is ≥4 of symptoom met * is positief

 

 

 

PAED

De PAED is origineel ontwikkeld en gevalideerd voor het meten van een emergence delier (ED) na algehele anesthesie bij kinderen in de leeftijd van 19 maanden tot zes jaar (Sikich & Lerman, 2004). De PAED wordt zeer veel toegepast in studies rondom anesthesie. In de studie van Janssen, 2011 is gekeken naar de geschiktheid van dit instrument bij ernstige zieke kinderen op de kinder-IC (tabel 6). In een prospectieve cohortstudie, bij 154 kinderen met een gemiddelde leeftijd van 7,2 jaar (standaarddeviatie, SD ± 5,4), zijn de bevindingen van een kinderpsychiater met betrekking tot PD vergeleken met de PAED (tabel 7). De PAED werd gescoord door een onderzoeksteam (bij 144 kinderen). Zij vonden een sensitiviteit van 91% en een specificiteit van 98%, waarbij het afkappunt een PAED-score van 10 of hoger was.

 

De items van de PAED worden op een vijf-punt schaal gescoord. In een secundaire post-hoc analyse is gekeken naar de effecten op de psychometrische eigenschappen van PAED bij een twee- en drie-punt schaal (Blankespoor, 2012). Een drie-punt schaal lijkt beter voor het scoren van PD met de PAED bij ernstig zieke kinderen op een kinder-IC met een afkappunt van acht en heeft daarbij goede psychometrische eigenschappen.

 

De PAED werd nogmaals gevalideerd in Duitsland. De PAED werd één keer per dag door een vaste intensivist bepaald en vergeleken met de diagnose van een delirium expert (één psychiater en één intensivist) volgens de DSM-IV (Luetz, 2016). In deze studie werden 64 kinderen van 5 jaar en ouder (gemiddeld 13 jaar) onderzocht met het genoemde instrument. Met de pCAM-ICU werden 9 van de 13 delirium diagnoses gevonden. De sensitiviteit was daarmee 69,2% (95% BI 38,6% tot 90,9%) en de specificiteit 98% (95% BI 89,6% tot 100,0%). Ook werd een positief voorspellende waarde van 90,0% (95% BI 55,5% tot 99,7%) gevonden en een negatief voorspellende waarde van 92,6 (95% BI 82,1% tot 97,9%); de likelihood ratio was 35 (95% BI 5 tot 254).

 

Tabel 6 Pediatric Anesthesia Emergence Delirium (PAED) schaal

Items

Punten

1. Het kind maakt oogcontact met de verzorger

 

2. De handelingen van het kind zijn doelgericht

 

3. Het kind is zich niet bewust van zijn/haar omgeving

 

4. Het kind is rusteloos

 

5. Het kind is niet te troosten

 

Score (≥ 10 delier aanwezig)

 

Score items 1, 2 en 3 omgekeerd scoren: 4 = helemaal niet, 3 = een beetje, 2 = behoorlijk, 1 = erg, 0 = extreem. Items 4 en 5 scoren: 0 = helemaal niet, 1 = een beetje, 2 = behoorlijk, 3 = erg, 4= extreem.

 

Diagnostische instrumenten

DRS

Diagnostische instrumenten zijn ontwikkeld voor het formeel stellen van de diagnose ‘delier’. Meestal zijn het pragmatisch geformuleerde criteria ontleend aan bijvoorbeeld de DSM.

 

De DRS (tabel 7) en de DRS-R-98 zijn oorspronkelijk ontwikkeld en gevalideerd voor het diagnosticeren van delier bij volwassenen. In een prospectief cohortonderzoek van Janssen (2011) werd bij 154 kinderen (gemiddelde leeftijd van 7,2 jaar; SD ± 5,4) een delier vastgesteld op basis van de gouden standaard (diagnose door psychiater - volgens DSM IV criteria). Bij deze kinderen werd naast PAED (zie hierboven) ook DRS-88 en DRS-R-98 vergeleken met de gouden standaard. Beide instrumenten (DRS-88 en DRS-R-98) lieten in deze studie ook een specificiteit zien (100%). De sensitiviteit van DRS-88 (n=103 patiënten) was 91,7% en van de DRS-R-98 (n=73 patiënten) 75%.

 

Tabel 7 Delirium Rating Scale (DRS)

Item

 

Temporal onset

 

Wanen

 

Hallucinaties / waarnemeningstoornissen

 

Veranderingen in psychomotorisch gedrag

 

Afwijkingen van het denkproces

 

Relatie tot lichamelijke aandoening

 

Stoornis van het Slaap/waakritme

 

Affectlabiliteit / verandering van stemming

 

Verloop over de dag

 

 

Meetschalen voor ernst van delier

De ‘severity scale for the pCAM-ICU’ (sspCAM-ICU) werd ontwikkeld op basis van de originele pCAM-ICU score. Hierbij werd de aan- of afwezigheid van een delier, vertaald naar een meetschaal om de ernst van met een delier te scoren op een schaal van 0 tot 19 punten (delier met maximale ernst) (Luetz 2016) (tabel 8). Als de patiënt een acute verandering of fluctuerend beloop van mentale status liet zien (kenmerk 1), werden vijf punten toegevoegd aan de score. Als kenmerk één negatief was, werden geen punten toegevoegd aan de score. Voor elke fout die de patiënt liet zien op de auditieve (letters) of visuele (plaatjes) test van de ASE werd 0,5 punt toegevoegd aan de score. Bewustzijn werd gemeten met de RASS. De resultaten van de RASS werden vertaald in de score, nulpunten geen punten voor de score; één punt dan werd één punt toegevoegd aan de score en bij twee punten werden twee punten toegevoegd aan de score. Voor elke fout in kenmerk vier (gedesoriënteerd brein), werd één punt toegevoegd aan de score.

 

De sspCAM-ICU werd gevalideerd in Duitsland. De pCAM-ICU werd één keer per dag door een vaste intensivist bepaald en vergeleken met de diagnose van een delirium expert (één psychiater en één intensivist) volgens de DSM-IV TR (Luetz, 2016). Op basis van de pCAM-ICU en de RASS-score werd de sspCAM-ICU score berekend. In deze studie werden 64 kinderen van 5 jaar en ouder (gemiddeld 13 jaar) onderzocht met het genoemde instrument. Met de sspCAM-ICU werden 11 van de 13 delirium diagnoses gevonden. De sensitiviteit was daarmee 84,6% (95% BI 54,6% tot 98,1%) en de specificiteit 98% (95% BI 89,6% tot 100,0%). Ook werd een positief voorspellende waarde van 91,7% (95% BI 61,5% tot 99,8%) gevonden en een negatief voorspellende waarde van 96,2 (95% BI 86,8% tot 99,5%); de likelihood ratio was 43 (95% BI 6 tot 305).

 

Tabel 8 severity scale for Pediatric Confusion Assessment Method – Intensive Care Unit (sspCAM-ICU)

Stap

Kenmerken Score

Score

1

RASS

Bewustzijn (RASS)

Als RASS is ³ -3 dan door gaan met Stap 2 (sspCAM-ICU). Indien RASS is -4 of -5, stop en herevalueer later.

 

2

sspCAM-

ICU

Kenmerk 1:

- is er een acute verandering in de mentale situatie t.o.v. van voor opname (ja/nee)

- Acuut begin of fluctuerend beloop (in afgelopen 24u) aanwezig (ja/nee)

 

Indien een van bovenstaande vragen met ja beantwoord, geef 5 punten.

0 / 5

Kenmerk 2: Verminderde aandacht (score kleiner dan 8)

ASE auditief: SAVEAHAART (bij A knijpen in hand)

Of ASE visueel: 5 en dan 10 plaatjes (herkenning)

 

Geef voor elk fout antwoord, in de letter test of plaatjes test, 0,5 punten

0 - 5

Kenmerk 3: Veranderd bewustzijnsniveau

Geef de volgende score aan de RASS:

 

RASS +4 = 4 punten, RASS +3/-3 = 3 punten, RASS +2/-2 = 2 punten, RASS +1/-1 = 1 punt, RASS 0 = 0 punten

0 - 4

Kenmerk 4: Ongeorganiseerd denken (gecombineerde score kleiner dan 4)

0 - 5

Set A

1. Zijn er vissen in de zee?

2. Is ijs warm?

3. Vliegen vogels?

4. Is de zon geel?

Set B

1. Zijn er olifanten in de zee?

2. Is ijs koud?

3. Vliegen koeien?

4. Is de zon zwart

En 2 opdrachten

1. Steek eens zoveel vingers op (Onderzoeker houdt twee vingers op).

2. Doe nu hetzelfde met de andere hand (onderzoeker laat nu niet twee vingers zien).

 

Geef 1 punt voor elk fout antwoord dat de patiënt geeft

 

Conclusie ssp-CAM-ICU: 6-19 punten = Delirium aanwezig

0 - 19

RASS - Richmond Agitation Sedation Score.

 

Bewijskracht van de literatuur

De bewijskracht voor de diagnostische accuratesse van de SOS-PD is verlaagd vanwege risk of bias (de lijst werd alleen in Nederland gevalideerd in twee studies) en imprecisie (het aantal patiënten met een PD was klein en betrouwbaarheidsinterval sensitiviteit was zeer breed). De bewijskracht is laag.

 

De bewijskracht voor de diagnostische accuratesse van de pCAM-ICU is verlaagd vanwege imprecisie (het aantal patiënten met een PD was klein en betrouwbaarheidsinterval sensitiviteit was zeer breed). De bewijskracht is laag.

 

De bewijskracht voor de diagnostische accuratesse van de PAED is verlaagd vanwege imprecisie (aantal patiënten met een PD klein en betrouwbaarheidsinterval breed) en inconsistentie (gegevens met betrekking tot de sensitiviteit zijn zeer verschillend in de twee gevonden studies). De bewijskracht is laag.

 

De bewijskracht voor de diagnostische accuratesse van de CAP-D is verlaagd vanwege risk of bias (werd slechts in één studie gevalideerd) en vanwege imprecisie (het aantal patiënten was klein). De bewijskracht is laag.

 

De bewijskracht voor de diagnostische accuratesse van de DRS is verlaagd vanwege risk of bias (werd slechts in één studie gevalideerd) en vanwege imprecisie (het aantal patiënten was klein). De bewijskracht is laag.

 

De bewijskracht voor de diagnostische accuratesse van de sspCAM-ICU is verlaagd vanwege risk of bias (werd slechts in één studie gevalideerd) en vanwege imprecisie (het aantal patiënten was klein). De bewijskracht is laag.

Om de uitgangsvraag te kunnen beantwoorden is er een systematische literatuuranalyse verricht naar de volgende zoekvraag (vragen):

 

P: kinderen verdacht van een PD;

I: meetinstrumenten: PAED, CAP-D, SOS-PD, pCAM-ICU, psCAM-ICU;

C: diagnose PD door een kinder- of jeugdpsychiater met behulp van de DSM;

O: diagnostische accuratesse: sensitiviteit, specificiteit, negatief voorspellende waarde, positief voorspellende waarde, likelihood ratio, ROC-curves, interbeoordelaarsbetrouwbaarheid.

 

Relevante uitkomstmaten

De werkgroep achtte sensitiviteit en specificiteit voor de besluitvorming cruciale uitkomstmaten; en negatief voorspellende waarde, positief voorspellende waarde, ROC-curves en interbeoordelaarsbetrouwbaarheid voor de besluitvorming belangrijke uitkomstmaten.

 

Zoeken en selecteren (Methode)

Deze vraag betreft een herziening van de richtlijntekst uit 2014, daarin waren na een systematische search in Medline en Psychinfo die 416 zoekresultaten opleverde; vijf artikelen geïncludeerd, waarin vijf verschillende meetinstrument waren onderzocht (Blankespoor, 2012; Janssen, 2011, Silver, 2012; Traube, 2014, Smith, 2011).

 

In de databases Medline en Psychinfo (via OVID) is op 11 januari 2019 opnieuw met relevante zoektermen gezocht naar literatuur over de diagnostische accuratesse van meetinstrumenten gericht op een PD gepubliceerd sinds 2012. De zoekverantwoording is weergegeven onder het tabblad Verantwoording. De literatuurzoekactie leverde 111 treffers op. Studies werden geselecteerd op grond van de volgende selectiecriteria: meetinstrumenten voor screening, diagnostiek of ernstmeting van een PD en studies die de diagnostische accuratesse beschreven op basis van een validatie tegen een DSM-diagnose door een psychiater. Op basis van titel en abstract werden in eerste instantie zeven studies voorgeselecteerd. Na raadpleging van de volledige tekst, werden vervolgens drie studies geëxcludeerd (zie exclusietabel onder het tabblad Verantwoording), en vier studies definitief geselecteerd (Ista, 2018a en b, Luetz, 2016 en Smith, 2016).

 

Resultaten

Vier onderzoeken zijn opgenomen in de literatuuranalyse voor de herziening. De belangrijkste resultaten zijn samengevat in tabel 1. Een compleet overzicht van de studiekarakteristieken en resultaten is opgenomen in de evidencetabellen (zie kopje Evidencetabellen). De beoordeling van de individuele studieopzet (risk of bias) is opgenomen in de risk-of-biastabellen.

  1. Blankespoor, R.J., Janssen, N.J., Wolters, A.M., van Os, J. & Schieveld, J.N., (2012). Post-hoc revision of the Pediatric Anesthesia Emergence Delirium rating scale: clinical improvement of a bedside-tool? Minerva Anestesiol,78(8):896-900.
  2. Dijk, M. van, Knoester, H., Beusekom, B.S. van & Ista, E., (2012). Screening pediatric delirium with an adapted version of the Sophia Observation withdrawal Symptoms scale (SOS). Intensive Care Med, 38, 531-2.
  3. Esseveld, M.M., Leroy, P.L., Leue, C., Strik, J., Tijssen, M., van de Riet, E.H. & Schieveld, J.N., (2013). Catatonia and refractory agitation in an updated flow chart for the evaluation of emotional-behavioral disturbances in severely ill children. Intensive Care Med, 39, 528-9.
  4. Gangopadhyay M, Smith H, Pao M, et al. Development of the Vanderbilt Assessment for Delirium in Infants and Children to Standardize Pediatric Delirium Assessment By Psychiatrists. Psychosomatics 2017;58(4):355-63.
  5. Ista E, de Hoog M, Tibboel D, Duivenvoorden HJ, van Dijk M. Psychometric evaluation of the Sophia Observation withdrawal symptoms scale in critically ill children. Pediatr Crit Care Med. 2013 Oct;14(8):761-9.
  6. Ista E, Te Beest H, van Rosmalen J, de Hoog M, Tibboel D, van Beusekom B, van Dijk M. Sophia Observation withdrawal Symptoms-Paediatric Delirium scale: A tool for early screening of delirium in the PICU. Aust Crit Care. 2018 Sep;31(5):266-273.
  7. Ista E, van Beusekom B, van Rosmalen J, Kneyber MCJ, Lemson J, Brouwers A, Dieleman GC, Dierckx B, de Hoog M, Tibboel D, van Dijk M. Validation of the SOS-PD scale for assessment of pediatric delirium: a multicenter study. Crit Care. 2018 Nov 20;22(1):309.
  8. Janssen, N.J., Tan, E.Y., Staal, M., Janssen, E.P., Leroy, P.L., Lousberg, R., van Os, J. & Schieveld, J.N., (2011). On the utility of diagnostic instruments for pediatric delirium in critical illness: an evaluation of the Pediatric Anesthesia Emergence Delirium Scale, the Delirium Rating Scale 88, and the Delirium Rating Scale-Revised R-98. Intensive Care Med, 37, 1331-7.
  9. McCaffery, M. & Pasero, C.L., (1997). Pain ratings: the fifth vital sign. Am J Nurs, 97, 15-6.
  10. Nederlandse Vereniging voor Klinische Geriatrie (2013). Richtlijn Delier. Volwassenen & Ouderen. Utrecht: Nederlandse Vereniging voor klinische Geriatrie.
  11. Schieveld, J.N., van der Valk, J.A., Smeets, I., Berghmans, E., Wassenberg, R., Leroy, P.L., Vos, G.D. & van Os, J., (2009). Diagnostic considerations regarding pediatric delirium: a review and a proposal for an algorithm for pediatric intensive care units. Intensive Care Med, 35, 1843-9.
  12. Sessler, C.N., Gosnell, M.S., Grap, M.J., Brophy, G.M., O'Neal, P.V., Keane, K.A., Tesoro, E.P. & Elswick, R.K., (2002). The Richmond Agitation-Sedation Scale: validity and reliability in adult intensive care unit patients. Am J Respir Crit Care Med, 166, 1338-44.
  13. Sikich, N. & Lerman, J., (2004). Development and psychometric evaluation of the pediatric anesthesia emergence delirium scale. Anesthesiology, 100, 1138-45.
  14. Silver, G., Traube, C., Kearney, J., Kelly, D., Yoon, M.J., Nash Moyal, W., Gangopadhyay, M., Shao, H. & Ward, M.J., (2012). Detecting pediatric delirium: development of a rapid observational assessment tool. Intensive Care Med, 38 (6), 1025-1031.
  15. Smith, H.A., Boyd, J., Fuchs, D.C., Melvin, K., Berry, P., Shintani A, Eden SK, Terrell MK, Boswell T, Wolfram K, Sopfe J, Barr FE, Pandharipande PP & Ely EW (2011). Diagnosing delirium in critically ill children: Validity and reliability of the Pediatric Confusion Assessment Method for the Intensive Care Unit. Crit Care Med; 39: 150-7.
  16. Traube, C., Silver, G., Kearney, J., Patel, A., Atkinson, T.M., Yoon, M.J., Halpert, S., Augenstein, J., Sickles, L.E., Li, C., Greenwald, B., (2013). Cornell Assessment of Pediatric Delirium: A Valid, Rapid, Observational Tool for Screening Delirium in the PICU. Crit Care Med. 2013 Oct 18. (Epub ahead of print)
  17. Trzepacz PT (1999). The Delirium Rating Scale. Its use in consultation-liaison research. Psychosomatics, 40, 193-204.
  18. Turkel, S.B., Braslow, K., Tavare, C.J. & Trzepacz, P.T., (2003). The delirium rating scale in children and adolescents. Psychosomatics, 44, 126-9.
  19. Thomas, E., van der Windt, D. A. W. M., Hay, E. M., Smidt, N., Dziedzic, K., Bouter, L. M., & Croft, P. R. (2005). Two pragmatic trials of treatment for shoulder disorders in primary care: generalisability, course, and prognostic indicators. Annals of the rheumatic diseases, 64(7), 1056-1061.

Study reference

Study characteristics

Patient characteristics

Index test

(test of interest)

Reference test

 

Follow-up

Outcome measures and effect size

Comments

Ista, 2018, Critical Care

 

SOS-PD

Type of study: validation study

 

Setting and country: multicentre study in four university hospitals, The Netherlands

 

Funding and conflicts of interest: Coolsingel foundation and Sophia foundation; authors have no competing interests

Inclusion criteria: Children between 3 months and 18 years of age admitted to a PICU and with an expected length of stay of at least 48 h were eligible for inclusion

 

Exclusion criteria: anticipated death within 48 h; neurological abnormality (e.g. severe psychomotor delay, encephalitis); comatose, or deeply sedated (COMFORT behaviour score < 11, or Richmond Agitation-Sedation Scale (RASS) < −3), or paralysis through neuromuscular blocking agents during the whole admission period, which would make behavioral assessment impossible

 

N = 485

 

Prevalence: 10%

 

Median age: 27 months (IQR 8-112)

 

Sex: 59.6 % M

 

Other important characteristics:

Almost half (42.5%) were admitted with respiratory failure and 56.9% (276/485) spent time on the ventilator (Table 1). More than half of the patients received sedatives (e.g. midazolam, lorazepam) or opioids, 56.1% (272/485) and 57.3% (278/485)

Describe index test:

SOS-PD administered by trained nurses.

The PD-scale consists of 17 items that represent symptoms of PD and an item that reflects the perspective of the child’s parents (“parents do not recognize their child’s behaviour as normal”) (Fig. 1)). Presence of a symptom is scored as “yes” if it was observed at any moment during the previous 4 h. If the items “hallucinations” or “parents do not recognize their child’s behavior” were positive, a score of 4 points was assigned. Therefore, if only the item hallucinations is scored as yes, it overrides the PD score < 4 – by which the threshold for the index test (SOS-PD scale) is reached. The same holds for the parents’ item. The maximum sum score of the PD-scale is 17 points.

 

Cut-off point(s): 4

 

 

Comparator test: CAP-D by administered trained nurses

 

Cut-off point(s): 9

 

Describe reference test:

DSM IV diagnosis by child psychiatrist

 

CAP-D administered by trained nurses

 

To estimate the number of false negatives, a random selection of patients with a PD-scale score <4 was assessed by a child psychiatrist on weekdays (Additional file 1: File S1). If at a particular moment more than one patient had been assigned a SOS-PD score <4 (random sample) the local study coordinator determined, with the use of opaque envelops containing the bed numbers of the eligible patients, which patient (with a maximum of 2 patients) would undergo psychiatric evaluation. The psychiatric standardized examination is non-invasive (no physical examination) and includes a succinct assessment of consciousness, attention, orientation, or other disturbances in cognitive functioning according to the DSM-IV criteria (“gold standard”) (11). The psychiatrist requested additional information (allo-anamnesis) from the parents, treating physician, and nurse, and reviewed the medical history (medication use, type of illness, etc.).

 

 

Cut-off point(s): 4 or higher

Time between the index test and reference test: 1 hour

 

For how many participants were no complete outcome data available? DSM-IV diagnoses were available for 114+54 = 168 patients

N (%)

 

Reasons for incomplete outcome data described? It was not possible to get a diagnosis by a psychiatrist for all patients

Outcome measures and effect size (include 95%CI and p-value if available):

 

Sensitivity 92.3%

Specificity 96.5%

after correction for verification bias, for a PD score ≥4. N=114+54

ROC-value 0.989

positive predictive and the negative predictive values (without adjustment for verification

bias) were 76.4% and 99.1%

 

Pearson coefficient of correlation between the sum scores of the PD-scale and the CAP-D was 0.89 (95% CI, 0.82 to 0.93; p < 0.001)

 

 

Ista, 2018, Aust Crit Care

 

SOS-PD

Type of study: validation study

 

Setting and country: university hospital, The Netherlands

 

Funding and conflicts of interest: Evidence Based Care by Nurses/Erasmus MC (No. 11404)

Inclusion criteria:

 

Exclusion criteria: anticipated death within 48 h; neurological abnormalities (e.g. traumatic brain injury, encephalitis) or paralysis through neuromuscular blocking agents (which would make behavioural assessment impossible

 

N = 146

 

Prevalence: %

 

Median age: months (IQR): 49 months (IQR 13-140)

 

Sex: 50% M

 

Other important characteristics: In total, 52.7% (77/146) were ventilated during their PICU stay for a median of 4 days (IQR 2e7).

 

Describe index test:

Knowing that symptoms of PD and IWS may overlap in critically ill children, we extended the SOS scale by adding specific PD items.20 A multidisciplinary expert group (n ¼ 15) of Dutch paediatric intensivists, PICU nurses, and child psychiatrists who had not been involved in the development of the scale judged the content validity of the PD component.21 They assessed the items on relevance and comprehensiveness and concluded that the items were relevant for measuring the construct of delirium in critically ill children. The SOS-PD consists of 22 behavioural items, of which 17 items represent symptoms of PD (Fig. 1). Ten of the 22 items of the PD-component are also included in the SOS-component. Presence of a symptom is scored as “yes” if it was observed at any moment during the previous four hours. The maximum sum score of the PD-component (hereinafter referred to as PD-scale) is 17 points. Further, at the end of the scale there was a question for parents. Nurses’ could ask the parents if they recognise their child’s behaviour as normal.

 

Comparator testL CAP-D, PD-scale

 

Cut-off point(s): 4

Describe reference test:

If in two consecutive observations a child was assigned scores 4 or higher or the item hallucination was scored ‘yes’, a child psychiatrist was consulted to assess the child using the DSM-IV criteria1 as the “gold standard”, without being informed about the score on the PD-scale

 

 

Cut-off point(s): 4 or higher

 

 

Time between the index test and reference test: 1 hour

 

For how many participants were no complete outcome data available? 16 were excluded from statistical analysis because PD-scale assessments were not available (e.g. “reminder” was ignored)

N (%): 16/162 = 9,9%

 

Reasons for incomplete outcome data described?

Outcome measures and effect size (include 95%CI and p-value if available):

 

Sensitivity 96.8% (95% CI 80.4 - 99.5%)

Specificity 92.0% (95% CI 59.7 - 98.9%).

 

 

Janssen, 2011

And post-hoc analysis Blankespoor, 2012

Type of study: prospective observational cohort study

 

Setting and country: PICU, The Netherlands

 

Funding and conflict of interest: no funding, no conflicts of interest to declare

Inclusion criteria: all non-electively admitted children (1-17 yrs); also children admitted >48H after elective surgery; patients were ventilated and nonventilated

 

Exclusion criteria: not speaking Dutch and not in need of intensive care

 

N = 154

 

Prevalence: 17%

 

Mean age ± SD:

7,2 yrs ± 5,4

 

Sex:62 % M

 

Other important characteristics:

19% ventilated patients

Describe index test:

 

PAED

 

Cut-off point: 10 or higher

 

DRS-88 (10 items)

 

Cut-off point: 10

 

DRS-R-98 (16 items)

Revised form of DRS; last three items are optional and only scored to differentiate between delirium and other disorders

 

Cut-off point:??

 

The PAED, DRS-88 and DRS-R-98 are completed during the first assessment, which is carried out by the intern over the course of their attachment to the unit, having received on-site clinical training by the pediatric neuropsychiatrist of the unit. The second assessment was carried out—within 3 h—by the pediatric neuropsychiatrist, who was unaware of the screening results. PAED, DRS-88, and DRS-R-98 were completed once a day.

Describe reference test:

 

PICU paediatric neuropsychiatrist routinely examined all children using DSM IV; he reviewed and discussed all available information and opinions (from parents, nurses and medical charts) with the other members of the PICU team making a final diagnosis.

 

Time between the index test and reference test:

 

For how many participants were no complete outcome data available?

 

Reasons for incomplete outcome data described?

Outcome measures and effect size (include 95%CI and p-value if available):

 

 

DRS-88 (N=103):

Sensitivity: 91.7%

Specificity: 100%

Internal consistentency alfa: 0.69

 

 

DRS-R-98 (N=73)

Sensitivity: 75%

Specificity: 100%

Internal consistency alfa:0.57

 

PAED (N=144) (cut-off 8)

Sensitivity: 91.3%

Specificity:98.3%

Internal consistency:

Post-hoc analysis results Blankespoor, 2012

 

 

Two point scale PAED

Sensitivity 100%

Specificity 91.7%

Internal consistency: 0.86

 

Three point scale PAED

Sensitivity: 100%

Specificity: 96.7%

Internal consistency: 0.88

Luetz, 2016

Type of study: Validation Study

 

Setting and country: ICU, Germany

 

Funding and conflicts of interest: Dr. Luetz is a participant in the Charité Clinical Scientist Program funded by

the Charité—Universitaetsmedizin Berlin and the Berlin Institute of Health; funding by pharmaceutical companies of some authors is also reported, but not relevant to this particular study

Inclusion criteria: pediatric patients, at least 5 years old, ventilated or nonventilated, admitted to the PICU of a tertiary care medical centre in Germany from August 2011 to December 2011

 

Exclusion criteria: PICU stay less than 24 hours; non-German-speaking patients; inability to communicate due to severe hearing loss or brain injury; mental retardation due to a specific disease; and documented history of psychosis in the medical record. All patients were monitored for a maximum of 21 PICU days.

 

N = 64

 

Prevalence: 23%

 

Mean age ± SD:

Patients with delirium: 13 (7-16)

Patients without delirium: 11 (9-14)

 

Sex: % M / % F

Patients with delirium: 6/15 40% M

Patients without delirium: 30/49 61% M

 

Other important characteristics:

 

Describe index test:

Pediatric Confusion Assessment Method ICU (pCAM-ICU)

Pediatric Anaesthesia Emergence Delirium Scale (PAED)

Severity Scale for the Pediatric Confusion Assessment Method (sspCAM-ICU):

For development of the sspCAM-ICU, the original binary pCAM-ICU score (delirium positive/negative) were translated to a severity scale, ranging from 0 (no delirium) to 19 points (delirium with the maximum of severity).

If the patient showed an acute change or fluctuating course of mental status (feature 1), 5 points were added to the score. If feature 1 was negative, no points were added to the score. For every error, the patient demonstrated on either the auditory (letters) or the visual (pictures) ASE (feature 2), 0.5 points were added to the score. We assessed the level of consciousness (feature 3) using the RASS. Results of the RASS assessment were translated and added to the score as follows: RASS score +2/– 2 = +2 points; RASS score +1/–1 = +1 points; and RASS score 0 = 0 points. For every error the patient demonstrated in feature 4 (disorganized brain), 1 point was added to the score.

Cut-off point(s): 6 or more points

 

Describe reference test:

 

delirium experts (a board-certified psychiatrist and an intensivist) working as a team using DSM-IVText Revision (TR) criteria for delirium diagnosis. DAs were always performed in a specific order: Daily at 4 pm, a trained physician, using the pCAM-ICU, started testing the first patient. Following, a second trained physician evaluated the patient with the PAED scale. To avoid bias due to “between observer variation,” one of the two trained physicians always used the pCAM-ICU and the other one always used the PAED for assessing delirium. In order to ensure that every physician of the scoring team was blinded against the other test results, we started PAED scoring with the same patient 20 minutes after the pCAM-ICU testing. Every patient was assessed for all four consecutive pCAM-ICU items regardless whether item 1 and 2 were positive or not. The Attention Screening Examination (ASE) of the pCAM-ICU was performed with the vigilance A test followed by using the memory pictures. The evaluation by the delirium experts was always applied after all scorings were finished (once daily at 5 pm)

Time between the index test and reference test:

 

For how many participants were no complete outcome data available?

N (%)

 

Reasons for incomplete outcome data described?

Outcome measures and effect size (include 95%CI and p-value if available):

 

pCAM-ICU (10 out of 13)

sensitivity 76.9% (95%CI 46.2% - 95.0%)

specificity 98% (95% CI 89.6% - 100.0%)

positive predictive value (PPV) 90.9% (95% CI 58.7% - 99.8%))

negative predictive value (NPV) 94.3% (95% CI (84.3% - 98.8%))

PLR 39 (95% CI 6 - 279)

 

PAED (9 out of 13)

Sensitivity 69.2% (95% CI 38.6 - 90.9)

Specificity 98% (95% CI 89.6% - 100.0%)

PPV 90% (95% CI 55.5% - 99.7%)

NPV 92.6% (95% CI 82.1 – 97.9%)

PLR 35 (5-254)

 

sspCAM-ICU (11 out of 13)

Sensitivity 84.6% (95% CI 54.6 – 98.1)

Specificity 98% (95% CI 89.6% - 100.0%)

PPV 91.7% (95% CI 61.5% - 99.8%)

NPV 96.2% (95% CI 86.8 – 99.5%)

PLR 43 (6-305)

 

 

Repeated measures:

Sensitivity pCAM-ICU 52.3%

Specificity 99.4%

Sensitivity PAED 35.9%

Specificity 99.4%

 

Silver, 2012

Type of study[1]: validation study

 

Setting and country: PICU, USA

 

Funding and conflicts of interest: Drs. Traube and Greenwald received support for travel from Weill Cornell Medical College. Dr. Greenwald received support for travel from the Society of Critical Care Medicine. Dr. Greenwald consults for various law firms.

Inclusion criteria: patients in the PICU from all age groups with and without developmental delay

 

Exclusion criteria: sedation score less than -3 (deeply sedated or unarousable) using the RASS

 

N = 111 patients

 

Prevalence: 20.6%

 

Mean age ± SD:

 

Sex: % M / % F

 

Other important characteristics:

 

Describe index test: revised Cornell assessment of pediatric delirium (CAP-D) administered by bedside nurse

 

 

Cut-off point(s): 9 or higher

 

 

Describe reference test[2]:

Assessment by consultation liaison child psychiatrist using DSM IV

 

 

 

Time between the index test en reference test: both methods were used subsequently

 

For how many participants were no complete outcome data available?

N (%) not reported

 

Reasons for incomplete outcome data described? Not reported

Outcome measures and effect size (include 95%CI and p-value if available)4:

 

CAP-D

Sensitivity: 94.1% (95% CI 83.8-98.8%)

Specificity: 79.2% (95% CI 73.5% - 84.9%)

Internal consistency Cronbach’s alfa: 0.90 (0.87-0.90)

 

In patients without significant developmental delay, sensitivity was 92.0% (95% CI, 85.7–98.3%) and specificity was 86.5% (95% CI, 75.4–97.6%). In developmentally delayed children, the Cornell Assessment of Pediatric Delirium showed decreased specificity of 51.2% (95% CI, 24.7–77.8%) but sensitivity remained high at 96.2% (95% CI, 86.5–100%)

See Traube

Smith, 2016

Type of study[3]: prospective cohort validation study

 

Setting and country:

PICU

 

Funding and conflicts of interest:

 The Authors were supported by different non-commercial organisations: the Foundation for Anesthesia Education and Research (FAER), the Vanderbilt CTSA,the National Institutes of Health; The Veterans Affairs Tennessee Valley Geriatric Research, Education and Clinical Center, the VA Clinical Science Research and Development Service, and funding from Abbott Laboratories, Orion, and Hospira.

Inclusion criteria: paediatric patients aged 6 months to 5 years who were hospitalized at the Monroe Carell Jr. Children's Hospital at Vanderbilt (MCJCHV) paediatric intensive care unit (PICU), regardless of diagnosis, either ventilated or non-ventilated

 

Exclusion criteria: hearing/visual impairments, developmental delay (cognition < 6 months of age), those who were non-English speaking, were transitioning out of the PICU, were moribund, or for whom we could not obtain consent

 

N = 320

 

Prevalence: 47%

 

Median age: 20 months (IQR 11, 37)

 

Sex: 63% M

 

Other important characteristics:

43% required mechanical ventilation

Describe index test:

Ps-CAM-ICU

 

Cut-off point(s):

 

 

Comparator test[4]:

 

Cut-off point(s):

 

Describe reference test[5]:

DSM diagnosis

 

 

Cut-off point(s):

 

 

Time between the index test and reference test: no more than hours apart

 

For how many participants were no complete outcome data available?

N (%)

 

Reasons for incomplete outcome data described?

Outcome measures and effect size (include 95%CI and p-value if available)4:

 

psCAM-ICU

Sensitivity: 75% (95% CI 72-78)

Specificity: 91% (95% CI 90-93)

NPV: 86% (95% CI 84-88)

PPV: 84% (95% CI 81-87)

 

psCAM-ICU (short, clinical version)

Sensitivity: 78% (95% CI 75-80)

Specificity: 86% (95% CI 84-88)

NPV: 86% (95% CI 85-88)

PPV: 78% (95% CI 74-81)

 

 

Smith, 2011

Type of study: validation study

 

Setting and country: PICU, USA

 

Funding and conflict of interest: no funding

Inclusion criteria: children ≥5 y, ventilated or non-ventilated, admitted to PICU

 

Exclusion criteria: -

 

N=68 (included in final analysis)

 

Prevalence: 13%

 

Age (mean SD): 12.2y ± 3.4

 

Other important characteristics: admission diagnoses surgical intervention for congenital heart disease (18%) and respiratory insufficiency in the setting of status asthmaticus (12%). Mean (SD) Pediatric Risk of Mortality (PRISM) score was 8.6 (7.0). Mechanical ventilation: 6% of study assessments conducted

Describe index test: pCAM-ICU

Feature 1 (acute change or fluctuation in mental status) Particular consideration was placed on the attention screening examination (ASE), which are the tools designed to assess for inattention (feature 2) among verbal and nonverbal intensive care unit patients and used as a central feature of the CAM-ICU. Inattention can be assessed using attention screening examinations, the ASE auditory or Vigilance A Letter test or the ASE visual. Feature 3 (altered level of consciousness) was assessed using the Richmond Agitation Sedation Scale (RASS) (37, 38). Feature 4 (disorganized thinking) was made developmentally appropriate for a child as young as 5 yrs. The commands (ie, “hold up this many fingers”) for feature 4 were retained as in the original CAM-ICU.

 

The pCAM-ICU team consisted of two pediatric intensivists, one pediatric critical care nurse practitioner, and three pediatric registered nurses, who used the pCAM-ICU for diagnosis of delirium

 

Cut-off point: 1&2 or 3&4 are positive

Describe reference test[6]:

patient evaluation by a paediatric psychiatrist using Diagnostic Statistical Manual (DSM) criteria

Time between the index test and reference test: <3 hours apart

 

For how many participants were no complete outcome data available?

N (%) 22/93 = 24%

 

Reasons for incomplete outcome data described? Yes, transfer in <24 hrs of PICU admission and before paired assessment completion (13), remained comatose (7), withdrawn by family (1), developmental delay (1) and three patients had paired assessments >3 hours apart; those were excluded.

Outcome measures and effect size (include 95%CI and p-value if available)4:

 

total of 146 blinded, paired assessments between reference standard delirium experts and the pCAM-ICU raters were completed in 68 patients

 

Sensitivity: 83% (95% CI 66-93%)

 

Specificity: 99% (95% CI 95-100%)

 

Positive predictive

value of 93% (95% CI, 63–99%)

 

Negative predictive value of 98% (95% CI, 93–99%) for the pCAM-ICU.

 

Likelihood ratio for the pCAM-ICU in the diagnosis of delirium was 105 (95% CI, 14–748).

 

Interrater reliability of'&0.96

(95% CI, 0.74 –1.0).

 

Traube, 2014

Type of study[7]: validation study

 

Setting and country: PICU, USA

 

Funding and conflicts of interest: Drs. Traube and Greenwald received support for travel from Weill Cornell Medical College. Dr. Greenwald received support for travel from the Society of Critical Care Medicine. Dr. Greenwald consults for various law firms.

Inclusion criteria: patients in the PICU from all age groups with and without developmental delay

 

Exclusion criteria: sedation score less than -3 (deeply sedated or unarousable) using the RASS

 

N = 111 patients

 

Prevalence: 20.6%

 

Mean age ± SD:

 

Sex: % M / % F

 

Other important characteristics:

 

Describe index test: revised Cornell assessment of pediatric delirium (CAP-D) administered by bedside nurse

 

 

Cut-off point(s): 9 or higher

 

 

Comparator test[8]:

 

Cut-off point(s):

 

Describe reference test[9]:

Assessment by consultation liaison child psychiatrist using DSM IV

 

 

Cut-off point(s):

 

 

Time between the index test en reference test: both methods were used subsequently

 

For how many participants were no complete outcome data available?

N (%) not reported

 

Reasons for incomplete outcome data described? Not reported

Outcome measures and effect size (include 95%CI and p-value if available)4:

 

CAP-D

Sensitivity: 94.1% (95% CI 83.8-98.8%)

Specificity: 79.2% (95% CI 73.5% - 84.9%)

Internal consistency Cronbach’s alfa: 0.90 (0.87-0.90)

 

In patients without significant developmental delay, sensitivity was 92.0% (95% CI, 85.7–98.3%) and specificity was 86.5% (95% CI, 75.4–97.6%). In developmentally delayed children, the Cornell Assessment of Pediatric Delirium showed decreased specificity of 51.2% (95% CI, 24.7–77.8%) but sensitivity remained high at 96.2% (95% CI, 86.5–100%)

 

 

Risk of bias assessment diagnostic accuracy studies (QUADAS II, 2011)

Study reference

Patient selection

 

Index test

Reference standard

Flow and timing

Comments with respect to applicability

Ista 2018a, Aust Crit Care

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

No

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: UNCLEAR

 

Ista, 2018b

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

No

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: UNCLEAR

 

Janssen, 2011

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

No

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: UNCLEAR

Luetz, 2016

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes, though some measurements were missed due to unavailability psychiatrist for example

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Silver, 2012

 

 

 

 

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes, otherwise exluded

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

Smith, 2016

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes/No/Unclear

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Smith, 2011

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yesr

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

No, those with incomplete measurements were excluded

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

Traube, 2014

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

No

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

 

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

Judgments on risk of bias are dependent on the research question: some items are more likely to introduce bias than others, and may be given more weight in the final conclusion on the overall risk of bias per domain:

Patient selection:

  • Consecutive or random sample has a low risk to introduce bias.
  • A case control design is very likely to overestimate accuracy and thus introduce bias.
  • Inappropriate exclusion is likely to introduce bias.

Index test:

  • This item is similar to “blinding” in intervention studies. The potential for bias is related to the subjectivity of index test interpretation and the order of testing.
  •  Selecting the test threshold to optimise sensitivity and/or specificity may lead to overoptimistic estimates of test performance and introduce bias.

Reference standard:

  • When the reference standard is not 100% sensitive and 100% specific, disagreements between the index test and reference standard may be incorrect, which increases the risk of bias.
  • This item is similar to “blinding” in intervention studies. The potential for bias is related to the subjectivity of index test interpretation and the order of testing.

Flow and timing:

  • If there is a delay or if treatment is started between index test and reference standard, misclassification may occur due to recovery or deterioration of the condition, which increases the risk of bias.
  • If the results of the index test influence the decision on whether to perform the reference standard or which reference standard is used, estimated diagnostic accuracy may be biased.
  • All patients who were recruited into the study should be included in the analysis, if not, the risk of bias is increased.

 

Judgement on applicability:

Patient selection: there may be concerns regarding applicability if patients included in the study differ from those targeted by the review question, in terms of severity of the target condition, demographic features, presence of differential diagnosis or co-morbidity, setting of the study and previous testing protocols.

Index test: if index tests methods differ from those specified in the review question there may be concerns regarding applicability.

Reference standard: the reference standard may be free of bias but the target condition that it defines may differ from the target condition specified in the review question.

 

Tabel Exclusie na het lezen van het volledige artikel

Auteur en jaartal

Redenen van exclusie

Gangopadhyay 2017

Methode om interview psychiater te structureren, geen diagnostische accuratesse vragenlijst

Meyburg 2017

Delirium patroon, geen vragenlijst

Silver 2015

Anchor points in de ontwikkeling van een kind gekoppeld aan de CAP-D, geen echte validatiestudie


[1] In geval van een case-control design moeten de patiëntkarakteristieken per groep (cases en controls) worden uitgewerkt. NB; case control studies z Nullen de accuratesse overschatten (Lijmer et al., 1999)

[2] De referentiestandaard is de test waarmee definitief wordt aangetoond of iemand al dan niet ziek is. Idealiter is de referentiestandaard de Gouden standaard (100% sensitief en 100% specifiek). Let op! dit is niet de “comparison test/index 2”.

4 Beschrijf de statistische parameters voor de vergelijking van de indextest(en) met de referentietest, en voor de vergelijking tussen de indextesten onderling (als er twee of meer indextesten worden vergeleken).

[3] In geval van een case-control design moeten de patiëntkarakteristieken per groep (cases en controls) worden uitgewerkt. NB; case control studies z Nullen de accuratesse overschatten (Lijmer et al., 1999)

[4] Comparator test is vergelijkbaar met de C uit de PICO van een interventievraag. Er kunnen ook meerdere tests worden vergeleken. Voeg die toe als comparator test 2 etc. Let op: de comparator test kan nooit de referentiestandaard zijn.

[5] De referentiestandaard is de test waarmee definitief wordt aangetoond of iemand al dan niet ziek is. Idealiter is de referentiestandaard de Gouden standaard (100% sensitief en 100% specifiek). Let op! dit is niet de “comparison test/index 2”.

4 Beschrijf de statistische parameters voor de vergelijking van de indextest(en) met de referentietest, en voor de vergelijking tussen de indextesten onderling (als er twee of meer indextesten worden vergeleken).

[6] De referentiestandaard is de test waarmee definitief wordt aangetoond of iemand al dan niet ziek is. Idealiter is de referentiestandaard de Gouden standaard (100% sensitief en 100% specifiek). Let op! dit is niet de “comparison test/index 2”.

4 Beschrijf de statistische parameters voor de vergelijking van de indextest(en) met de referentietest, en voor de vergelijking tussen de indextesten onderling (als er twee of meer indextesten worden vergeleken).

[7] In geval van een case-control design moeten de patiëntkarakteristieken per groep (cases en controls) worden uitgewerkt. NB; case control studies z Nullen de accuratesse overschatten (Lijmer et al., 1999)

[8] Comparator test is vergelijkbaar met de C uit de PICO van een interventievraag. Er kunnen ook meerdere tests worden vergeleken. Voeg die toe als comparator test 2 etc. Let op: de comparator test kan nooit de referentiestandaard zijn.

[9] De referentiestandaard is de test waarmee definitief wordt aangetoond of iemand al dan niet ziek is. Idealiter is de referentiestandaard de Gouden standaard (100% sensitief en 100% specifiek). Let op! dit is niet de “comparison test/index 2”.

4 Beschrijf de statistische parameters voor de vergelijking van de indextest(en) met de referentietest, en voor de vergelijking tussen de indextesten onderling (als er twee of meer indextesten worden vergeleken).

Autorisatiedatum en geldigheid

Laatst beoordeeld  : 01-11-2021

Laatst geautoriseerd  : 01-11-2021

Geplande herbeoordeling  : 01-01-2027

Initiatief en autorisatie

Initiatief:
  • Nederlandse Vereniging voor Psychiatrie
Geautoriseerd door:
  • Nederlandse Vereniging voor Anesthesiologie
  • Nederlandse Vereniging voor Kindergeneeskunde
  • Nederlandse Vereniging voor Psychiatrie

Algemene gegevens

De richtlijnontwikkeling werd ondersteund door het Kennisinstituut van de Federatie Medisch Specialisten en werd gefinancierd uit de Stichting Kwaliteitsgelden Medisch Specialisten (SKMS).

 

De financier heeft geen enkele invloed gehad op de inhoud van de richtlijn.

 

Deze richtlijn is ontwikkeld in samenwerking met:

  • V&VN kinderen
  • V&VN IC
  • Stichting Kind en Ziekenhuis
  • Nederlandse Associatie van Physician Assistants

Doel en doelgroep

Doel

Het doel van de richtlijn is om de zorg voor en behandeling van het kritisch zieke kind met een PD en voor kinderen met een ED verder te optimaliseren en om zo de overlevingskansen verder te optimaliseren. De richtlijn wil op wetenschappelijke gronden aanbevelingen doen voor optimale preventie, diagnostiek en behandeling van een PD en ED in het algemene/academische ziekenhuis door het verwerken van recente wetenschappelijke inzichten. Meer specifiek zijn de aanbevelingen over medicatie aangepast.

 

Doelgroep

Deze richtlijn is geschreven voor alle leden van de beroepsgroepen die betrokken zijn bij de zorg voor kinderen met een PD en ED.

Samenstelling werkgroep

Voor het ontwikkelen van de richtlijn is in 2018 een multidisciplinaire werkgroep ingesteld, bestaande uit vertegenwoordigers van alle relevante specialismen die betrokken zijn bij de zorg voor kinderen met een PD te maken hebben.

 

Werkgroep

  • Prof. Dr. J.J.M.H. (Jacqueline) Strik, psychiater en voorzitter van de werkgroep, werkzaam in MUMC+ te Maastricht, NVvP
  • Dr. J.N.M. (Jan) Schieveld, psychiater, werkzaam als adviseur bij het MUMC+ te Maastricht en de Mutsaers Stichting te Venlo, NVvP
  • Dr. L. (Lisette) ‘t Hart-Kerkhoffs, kinder- en jeugdpsychiater, werkzaam bij Levvel (voorheen de Bascule) en het Emma kinderziekenhuis AUMC Amsterdam, NVvP
  • Drs. S.B.J. (Bas) Oude Ophuis, kinder- en jeugdpsychiater, werkzaam in het UMC Utrecht en Prinses Máxima Centrum, NVvP
  • Dr. H. (Hennie) Knoester, kinderarts-intensivist, werkzaam in Emma Kinderziekenhuis, AUMC, Amsterdam, NVK
  • Prof. Dr. S. N. (Saskia) de Wildt, kinderarts-intensivist, klinisch farmacoloog, werkzaam in het Radboud UMC, Nijmegen en Erasmus MC, Rotterdam, NVK
  • Dr. W.G. (Erwin) Ista, universitair hoofddocent verplegingswetenschap, kinder-IC verpleegkundige, werkzaam in Erasmus MC, Rotterdam, V&VN IC
  • Drs. M. (Marjorie) de Neef, kinder-IC verpleegkundige, werkzaam in Emma Kinderziekenhuis UMC, Amsterdam, V&VN kinderen
  • G.S.M. (Dianne) van der Weerden, physician assistant, werkzaam in UMC Utrecht, NAPA
  • Dr. dr. M.F. (Markus) Stevens, kinderanesthesioloog, AUMC Amsterdam, NVA
  • Drs. E. (Erik) Koomen, anesthesioloog-kinderintensivist, werkzaam in UMC, Utrecht, NVA

 

Klankbordgroep

  • Dr. C. (Coriene) E. Catsman-Berrevoets, neuroloog-kinderneuroloog, voor pensionering (juli 2020) werkzaam in Erasmus MC/Sophia kinderziekenhuis, Rotterdam. Nu werkzaam HAGA/Juliana Kinderziekenhuis, Den Haag
  • J. (Janine) Pingen, Stichting Kind en Ziekenhuis te Utrecht, tot 1 december 2020
  • R. (Rowy) Uitzinger, Stichting Kind en Ziekenhuis te Utrecht, vanaf 1 december 2020

 

Met ondersteuning van

  • Dr. M.L. (Marja) Molag, adviseur, Kennisinstituut van de Federatie Medisch Specialisten
  • Dr. M. (Mirre) Den Ouden, adviseur, Kennisinstituut van de Federatie Medisch Specialisten

Belangenverklaringen

De Code ter voorkoming van oneigenlijke beïnvloeding door belangenverstrengeling is gevolgd. Alle werkgroepleden hebben schriftelijk verklaard of zij in de laatste drie jaar directe financiële belangen (betrekking bij een commercieel bedrijf, persoonlijke financiële belangen, onderzoeksfinanciering) of indirecte belangen (persoonlijke relaties, reputatiemanagement) hebben gehad. Gedurende de ontwikkeling of herziening van een module worden wijzigingen in belangen aan de voorzitter doorgegeven. De belangenverklaring wordt opnieuw bevestigd tijdens de commentaarfase.

 

Een overzicht van de belangen van werkgroepleden en het oordeel over het omgaan met eventuele belangen vindt u in onderstaande tabel. De ondertekende belangenverklaringen zijn op te vragen bij het secretariaat van het Kennisinstituut van de Federatie Medisch Specialisten.

 

Werkgroep-lid

Functie

Nevenfuncties

Gemelde belangen

Ondernomen actie

Catsman

Kinderneuroloog,

geen

geen

geen

’t Hart-Kerkhofs

Kinder- en jeugdpsychiater

geen

geen

geen

Ista

Universitair hoofddocent en verplegingswetenschapper

Lid cie. richtlijnen V&VN tot 01-01-2019, lid CCMO

Ontwikkelaar SOS-PD schaal

Andere werkgroepleden kritisch laten tegenlezen

Koomen

Anesthesioloog-kinderintensivist

geen

Bezig met ontwikkeling nieuwe PICU met devices bedrijven

Geen, aangezien dit niet richtlijn onderwerpen betreft

Knoester

Kinderarts-intensivist

geen

geen

geen

Molag

Adviseur, methodoloog

geen

geen

geen

de Neef

Verpleegkundig onderzoeker kinder-IC

geen

geen

geen

Oude Ophuis

Kinder- en jeugdpsychiater

geen

geen

geen

Pingen / Uitzinger

Stichting kind en ziekenhuis,

geen

geen

geen

Strik

Psychiater Kind en Jeugd, hoogleraar kind en jeugd psychiatrie en somatische comorbiditeit hoofdopleider psychiatrie, plaatsvervangend medisch afdelingshoofd

geen

geen

geen

Schieveld

Gepensioneerd kinder- en jeugdpsychiater

adviseur MUMC+ en Mutsaers Venlo

geen

geen

Stevens

Kinderanesthesioloog

geen

Grant onderzoek post hospital behavioral questionnaire

geen

Van der weerden

Physician assistant PICU

geen

geen

geen

De Wildt

Kinderarts-intensivist

Klinisch farmacoloog

Directeur Kinderformularium

Lidmaatschap wetenschappelijke adviesraden en editorial boards, zie verder volledige belangenverklaring

geen

Inbreng patiëntenperspectief

Er werd aandacht besteed aan het patiëntenperspectief door afvaardiging van Stichting Kind en Ziekenhuis in de Klankbordgroep en een enquête bij ouders van kinderen die een delier hebben doorgemaakt. Een verslag hiervan (zie bijlagen) is besproken in de werkgroep en de belangrijkste knelpunten zijn verwerkt in de richtlijn. De conceptrichtlijn is tevens voor commentaar voorgelegd aan Stichting Kind en Ziekenhuis.

Methode ontwikkeling

Evidence based

Implementatie

In de verschillende fasen van de richtlijnontwikkeling is rekening gehouden met de implementatie van de richtlijn (module) en de praktische uitvoerbaarheid van de aanbevelingen. Daarbij is uitdrukkelijk gelet op factoren die de invoering van de richtlijn in de praktijk kunnen bevorderen of belemmeren. Het implementatieplan is te vinden in de bijlagen.

Werkwijze

AGREE

Deze richtlijnmodule is opgesteld conform de eisen vermeld in het rapport Medisch Specialistische Richtlijnen 2.0 van de adviescommissie Richtlijnen van de Raad Kwaliteit. Dit rapport is gebaseerd op het AGREE II instrument (Appraisal of Guidelines for Research & Evaluation II; Brouwers, 2010).

 

Knelpuntenanalyse en uitgangsvragen

Tijdens de voorbereidende fase inventariseerden de voorzitter van de werkgroep en de adviseur de knelpunten met een schriftelijke uitvraag bij wetenschappelijke verenigingen en hoofden van de kinder-IC. Daaruit kwam de behoefte naar voren ook een addendum emergence delier te ontwikkelen.

 

De werkgroep beoordeelde de aanbevelingen uit de eerdere richtlijn Pediatrisch Delier 2014 op noodzaak tot revisie. Tevens zijn er knelpunten aangedragen door ouders via een uitvraag van Kind en Ziekenhuis, een schriftelijke Invitational conference en consultatie onder afdelingshoofden van de kinder-IC. De aangedragen knelpunten zijn verwerkt in de richtlijn.

 

Op basis van de uitkomsten van de knelpuntenanalyse zijn door de voorzitter en de adviseur concept-uitgangsvragen opgesteld. Deze zijn met de werkgroep besproken waarna de werkgroep de definitieve uitgangsvragen heeft vastgesteld. Vervolgens inventariseerde de werkgroep per uitgangsvraag welke uitkomstmaten voor de patiënt relevant zijn, waarbij zowel naar gewenste als ongewenste effecten werd gekeken. De werkgroep waardeerde deze uitkomstmaten volgens hun relatieve belang bij de besluitvorming rondom aanbevelingen, als cruciaal (kritiek voor de besluitvorming), belangrijk (maar niet cruciaal) en onbelangrijk. Tevens definieerde de werkgroep tenminste voor de cruciale uitkomstmaten welke verschillen zij klinisch (patiënt) relevant vonden.

 

Methode literatuursamenvatting

Er werd voor de afzonderlijke uitgangsvragen aan de hand van specifieke zoektermen gezocht naar gepubliceerde wetenschappelijke studies in (verschillende) elektronische databases. Tevens werd aanvullend gezocht naar studies aan de hand van de literatuurlijsten van de geselecteerde artikelen. In eerste instantie werd gezocht naar studies met de hoogste mate van bewijs. De werkgroepleden selecteerden de via de zoekactie gevonden artikelen op basis van vooraf opgestelde selectiecriteria. De geselecteerde artikelen werden gebruikt om de uitgangsvraag te beantwoorden. De databases waarin is gezocht, de zoekstrategie en de gehanteerde selectiecriteria zijn te vinden in de module met desbetreffende uitgangsvraag. De zoekstrategie voor de oriënterende zoekactie en patiëntenperspectief zijn opgenomen in de bijlagen.

 

Beoordelen van de kracht van het wetenschappelijke bewijs

De kracht van het wetenschappelijke bewijs werd bepaald volgens de GRADE-methode. GRADE staat voor ‘Grading Recommendations Assessment, Development and Evaluation’ (zie http://www.gradeworkinggroup.org/). De basisprincipes van de GRADE-methodiek zijn: het benoemen en prioriteren van de klinisch (patiënt) relevante uitkomstmaten, een systematische review per uitkomstmaat, en een beoordeling van de bewijskracht per uitkomstmaat op basis van de acht GRADE-domeinen (domeinen voor downgraden: risk of bias, inconsistentie, indirectheid, imprecisie, en publicatiebias; domeinen voor upgraden: dosis-effect relatie, groot effect, en residuele plausibele confounding).

 

GRADE onderscheidt vier gradaties voor de kwaliteit van het wetenschappelijk bewijs: hoog, redelijk, laag en zeer laag. Deze gradaties verwijzen naar de mate van zekerheid die er bestaat over de literatuurconclusie, in het bijzonder de mate van zekerheid dat de literatuurconclusie de aanbeveling adequaat ondersteunt (Schünemann, 2013; Hultcrantz, 2017).

 

GRADE

Definitie

Hoog

  • er is hoge zekerheid dat het ware effect van behandeling dicht bij het geschatte effect van behandeling ligt;
  • het is zeer onwaarschijnlijk dat de literatuurconclusie klinisch relevant verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Redelijk

  • er is redelijke zekerheid dat het ware effect van behandeling dicht bij het geschatte effect van behandeling ligt;
  • het is mogelijk dat de conclusie klinisch relevant verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Laag

  • er is lage zekerheid dat het ware effect van behandeling dicht bij het geschatte effect van behandeling ligt;
  • er is een reële kans dat de conclusie klinisch relevant verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Zeer laag

  • er is zeer lage zekerheid dat het ware effect van behandeling dicht bij het geschatte effect van behandeling ligt;
  • de literatuurconclusie is zeer onzeker.

 

Bij het beoordelen (graderen) van de kracht van het wetenschappelijk bewijs in richtlijnen volgens de GRADE-methodiek spelen grenzen voor klinische besluitvorming een belangrijke rol (Hultcrantz, 2017). Dit zijn de grenzen die bij overschrijding aanleiding zouden geven tot een aanpassing van de aanbeveling. Om de grenzen voor klinische besluitvorming te bepalen moeten alle relevante uitkomstmaten en overwegingen worden meegewogen. De grenzen voor klinische besluitvorming zijn daarmee niet één op één vergelijkbaar met het minimaal klinisch relevant verschil (Minimal Clinically Important Difference, MCID). Met name in situaties waarin een interventie geen belangrijke nadelen heeft en de kosten relatief laag zijn, kan de grens voor klinische besluitvorming met betrekking tot de effectiviteit van de interventie bij een lagere waarde (dichter bij het nuleffect) liggen dan de MCID (Hultcrantz, 2017).

 

Overwegingen (van bewijs naar aanbeveling)

Om te komen tot een aanbeveling zijn naast (de kwaliteit van) het wetenschappelijke bewijs ook andere aspecten belangrijk en worden meegewogen, zoals aanvullende argumenten uit bijvoorbeeld de biomechanica of fysiologie, waarden en voorkeuren van patiënten, kosten (middelenbeslag), aanvaardbaarheid, haalbaarheid en implementatie. Deze aspecten zijn systematisch vermeld en beoordeeld (gewogen) onder het kopje ‘Overwegingen’ en kunnen (mede) gebaseerd zijn op expert opinion. Hierbij is gebruik gemaakt van een gestructureerd format gebaseerd op het evidence-to-decision framework van de internationale GRADE Working Group (Alonso-Coello, 2016a; Alonso-Coello, 2016b). Dit evidence-to-decision framework is een integraal onderdeel van de GRADE-methodiek.

 

Formuleren van aanbevelingen

De aanbevelingen geven antwoord op de uitgangsvraag en zijn gebaseerd op het beschikbare wetenschappelijke bewijs en de belangrijkste overwegingen, en een weging van de gunstige en ongunstige effecten van de relevante interventies. De kracht van het wetenschappelijk bewijs en het gewicht dat door de werkgroep wordt toegekend aan de overwegingen, bepalen samen de sterkte van de aanbeveling. Conform de GRADE-methodiek sluit een lage bewijskracht van conclusies in de systematische literatuuranalyse een sterke aanbeveling niet a priori uit, en zijn bij een hoge bewijskracht ook zwakke aanbevelingen mogelijk (Agoritsas, 2017; Neumann, 2016). De sterkte van de aanbeveling wordt altijd bepaald door weging van alle relevante argumenten tezamen.

 

Organisatie van zorg

In de knelpuntenanalyse en bij de ontwikkeling van de richtlijn is expliciet rekening gehouden met de organisatie van zorg: alle aspecten die randvoorwaardelijk zijn voor het verlenen van zorg (zoals coördinatie, communicatie, (financiële) middelen, menskracht en infrastructuur).

 

Indicatorontwikkeling

Er werd besloten geen indicatoren te ontwikkelen. De bij de vorige richtlijn opgeleverde indicatoren werden niet gebruikt in de praktijk.

 

Kennislacunes

Tijdens de ontwikkeling van deze richtlijn is systematisch gezocht naar onderzoek waarvan de resultaten bijdragen aan een antwoord op de uitgangsvragen. Bij elke uitgangsvraag is door de werkgroep nagegaan of er (aanvullend) wetenschappelijk onderzoek gewenst is om de uitgangsvraag te kunnen beantwoorden. Een overzicht van de onderwerpen waarvoor (aanvullend) wetenschappelijk van belang wordt geacht, is als aanbeveling in de bijlage Kennislacunes beschreven.

 

Commentaar- en autorisatiefase

De conceptrichtlijnmodules werden aan de betrokken (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd ter commentaar. De commentaren werden verzameld en besproken met de werkgroep. Naar aanleiding van de commentaren werden de conceptrichtlijnmodules aangepast en definitief vastgesteld door de werkgroep. De definitieve richtlijnmodules werden aan de deelnemende (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd voor autorisatie en door hen geautoriseerd dan wel geaccordeerd.

 

Literatuur

Agoritsas T, Merglen A, Heen AF, Kristiansen A, Neumann I, Brito JP, Brignardello-Petersen R, Alexander PE, Rind DM, Vandvik PO, Guyatt GH. UpToDate adherence to GRADE criteria for strong recommendations: an analytical survey. BMJ Open. 2017 Nov 16;7(11):e018593. doi: 10.1136/bmjopen-2017-018593. PubMed PMID: 29150475; PubMed Central PMCID: PMC5701989.

Alonso-Coello P, Schünemann HJ, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, Treweek S, Mustafa RA, Rada G, Rosenbaum S, Morelli A, Guyatt GH, Oxman AD; GRADE Working Group. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 1: Introduction. BMJ. 2016 Jun 28;353:i2016. doi: 10.1136/bmj.i2016. PubMed PMID: 27353417.

Alonso-Coello P, Oxman AD, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, Treweek S, Mustafa RA, Vandvik PO, Meerpohl J, Guyatt GH, Schünemann HJ; GRADE Working Group. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 2: Clinical practice guidelines. BMJ. 2016 Jun 30;353:i2089. doi: 10.1136/bmj.i2089. PubMed PMID: 27365494.

Brouwers MC, Kho ME, Browman GP, Burgers JS, Cluzeau F, Feder G, Fervers B, Graham ID, Grimshaw J, Hanna SE, Littlejohns P, Makarski J, Zitzelsberger L; AGREE Next Steps Consortium. AGREE II: advancing guideline development, reporting and evaluation in health care. CMAJ. 2010 Dec 14;182(18):E839-42. doi: 10.1503/cmaj.090449. Epub 2010 Jul 5. Review. PubMed PMID: 20603348; PubMed Central PMCID: PMC3001530.

Hultcrantz M, Rind D, Akl EA, Treweek S, Mustafa RA, Iorio A, Alper BS, Meerpohl JJ, Murad MH, Ansari MT, Katikireddi SV, Östlund P, Tranæus S, Christensen R, Gartlehner G, Brozek J, Izcovich A, Schünemann H, Guyatt G. The GRADE Working Group clarifies the construct of certainty of evidence. J Clin Epidemiol. 2017 Jul;87:4-13. doi: 10.1016/j.jclinepi.2017.05.006. Epub 2017 May 18. PubMed PMID: 28529184; PubMed Central PMCID: PMC6542664.

Medisch Specialistische Richtlijnen 2.0 (2012). Adviescommissie Richtlijnen van de Raad Kwalitieit. https://richtlijnendatabase.nl/over_deze_site/richtlijnontwikkeling.html.

Neumann I, Santesso N, Akl EA, Rind DM, Vandvik PO, Alonso-Coello P, Agoritsas T, Mustafa RA, Alexander PE, Schünemann H, Guyatt GH. A guide for health professionals to interpret and use recommendations in guidelines developed with the GRADE approach. J Clin Epidemiol. 2016 Apr;72:45-55. doi: 10.1016/j.jclinepi.2015.11.017. Epub 2016 Jan 6. Review. PubMed PMID: 26772609.

Schünemann H, Brożek J, Guyatt G, et al. GRADE handbook for grading quality of evidence and strength of recommendations. Updated October 2013. The GRADE Working Group, 2013. Available from http://gdt.guidelinedevelopment.org/central_prod/_design/client/handbook/handbook.html.

Zoekverantwoording

Zoekacties zijn opvraagbaar. Neem hiervoor contact op met de Richtlijnendatabase.

Volgende:
Deel 2 - Emergence delier (ED)