Pilotonderzoek codering doodsoorzaken Caribisch Nederland

2. Data en methode

2.1 Data en setting

Ruwe data voor deze pilotstudie zijn verkregen via informatie afkomstig van doodsoorzaakverklaringen uit Caribisch Nederland. De geneeskundige geeft een verklaring van overlijden af en doet daarnaast een afzonderlijke opgave van de doodsoorzaak. Beiden verklaringen worden overgedragen aan de ambtenaar van de burgerlijke stand. De verklaring met daarin de opgave van de doodsoorzaak wordt door de ambtenaar van de burgerlijke stand ongeopend verzonden naar het CBS (Bonaire). Voor deze pilotstudie zijn gegevens uit 758 doodsoorzaakverklaringen over de periode 2014-2023 ontvangen. De informatie die op de ontvangen doodsoorzaakverklaringen was ingevuld is voor de uitvoering van deze studie handmatig overgetypt. Op basis van de overgetypte formulieren zijn data verkregen over overlijdensdatum, geslacht, leeftijd (afgeleid van geboorte- en overlijdensdatum), geboorteland, nationaliteit, woonplaats en de doodsoorzaken. Daarnaast zijn openbaar beschikbare data geraadpleegd over het aantal overlijdens in Caribisch Nederland (StatLine - Caribisch Nederland;overledenen, geslacht, leeftijd en burgerlijke staat (cbs.nl)). 

2.2 Bepaling van de doodsoorzaak

De doodsoorzaak is gecodeerd aan de hand van internationaal opgestelde richtlijnen van de Wereldgezondheidsorganisatie (WHO)2). Met ‘de doodsoorzaak’ wordt de onderliggende doodsoorzaak bedoeld. Het coderen volgens de richtlijnen van de WHO houdt in dat één ziekte of gebeurtenis als onderliggende doodsoorzaak kan worden aangemerkt. De onderliggende doodsoorzaak wordt gedefinieerd als (a) de ziekte of aandoening waarmee de reeks van gebeurtenissen die uiteindelijk het overlijden van de persoon veroorzaakte een aanvang nam of (b) de omstandigheden van het ongeval of geweld dat het letsel waardoor de persoon overleed veroorzaakte. Aan de hand van alle doodsoorzaken en bijkomende aandoeningen die hebben bijgedragen tot de dood, zoals vermeld op de doodsoorzaakverklaringen, is er dus per formulier één onderliggende doodsoorzaak bepaald. Deze doodsoorzaak is geclassificeerd volgens de International Statistical Classification of Diseases and Related Health Problems (ICD) van de World Health Organization (WHO).

In deze pilotstudie is eerst onderzocht in hoeverre de doodsoorzaak gecodeerd kon worden middels het automatische codeerprogramma Iris (BfArM). Deze Iris codeersoftware wordt in meerdere landen gebruikt voor het coderen van doodsoorzaken. Voor Europees Nederland werd in 2014-2023 ruim de helft van de formulieren automatisch gecodeerd. Om de mogelijkheid van automatische codering van doodsoorzaakverklaringen uit Caribisch Nederland te exploreren, zijn de compleet ingevulde formulieren met het automatische codeersysteem verwerkt. Hierna is geteld hoeveel formulieren er daadwerkelijk automatisch verwerkt konden worden. Vervolgens zijn formulieren die niet automatisch gecodeerd konden worden handmatig gecodeerd door medisch codeurs, onder supervisie van de medisch ambtenaar van het CBS. Dit is conform de werkwijze die nu gebruikt wordt voor het produceren van de doodsoorzakenstatistiek voor Europees Nederland. 

2.3 Verkennende analyses  

Er zijn een aantal verkennende en beschrijvende analyses uitgevoerd. Ten eerste zijn het aantal ontvangen doodsoorzaakverklaringen uit Caribisch Nederland en het aantal overlijdens getabelleerd, waarna het aandeel ontbrekende doodsoorzaakformulieren is geschat. Deze analyse is uitgesplitst naar jaartal. Vervolgens zijn de karakteristieken van de studiepopulatie getabelleerd waarbij een inventarisatie is gedaan van de compleetheid van de data. Aantallen kleiner dan vijf zijn aangegeven met ‘<5’. 

Ten tweede zijn de doodsoorzaken in kaart gebracht. Voor elk formulier is er een onderliggende doodsoorzaakcode toegekend op basis van de door de WHO opgestelde ICD-10 codeerregels. Hiertoe zijn compleet ingevulde formulieren deels automatisch en deels handmatig gecodeerd. Er is onderzocht hoeveel formulieren er automatisch gecodeerd konden worden. De uitkomsten zijn getabelleerd. De formulieren die niet automatisch gecodeerd konden worden, zijn geanalyseerd om mogelijke oorzaken van de belemmering bij het automatisch coderen te achterhalen. Deze resultaten zijn vervolgens beschreven en de betreffende formulieren zijn handmatig gecodeerd. Een deel van de formulieren wordt ook in het huidige productieproces voor Europees Nederland altijd handmatig gecodeerd; het gaat hierbij om niet-natuurlijke doodsoorzaken, doodgeborenen, neonatale en perinatale sterfte. Er is zowel een automatisch gecodeerd percentage berekend van formulieren inclusief en exclusief niet-natuurlijke doodsoorzaken, doodgeborenen, neonatale en perinatale sterfte .  

Op basis van de ICD-10 codes zijn doodsoorzaken gegroepeerd en zijn de volgende hoofdgroepen gevormd, gebaseerd op een clustering van de ICD-10 hoofdstukken: nieuwvormingen (ICD-10 codes: C00-C97 en D00-D48), hart- en vaatziekten (ICD-10 codes: I00-I99), psychische stoornissen en ziekten van het zenuwstelsel en zintuigen (ICD-10 codes: F00-F99), ziekten van de ademhalingsorganen (ICD-10 codes: J00-J99), COVID-19 (ICD-10 codes: U071-U072), niet-natuurlijke doodsoorzaken (ICD-10 codes V01-Y89) en overige doodsoorzaken. Deze clustering is aangehouden om toereikende aantallen te waarborgen. Vervolgens is het aandeel overlijdens aan de hoofdgroepen doodsoorzaken berekend.

2.4 Koppeling aan de sterftebestanden

Om de volledigheid en kwaliteit van de data te controleren is er een koppeling uitgevoerd tussen de doodsoorzakenformulieren en de sterfteberichten. De koppeling is uitgevoerd op overlijdensdatum, geboortedatum en geslacht. Omdat de populatie vrij klein is, kon er gekoppeld worden aan de hand van overlijdens- en geboortedatum zonder duplicaten te krijgen. Vervolgens is gekeken naar demografische karakteristieken van de overledenen waarbij de populatie waarvan wel een doodsoorzaakverklaring is ontvangen is vergeleken met de populatie waarvan geen doodsoorzaakverklaring is ontvangen. Specifiek is gekeken naar het geslacht, de leeftijd en in het geval van de wel-gekoppelde formulieren; het geboorteland. Bij de niet-gekoppelde formulieren moest de leeftijd worden uitgerekend o.b.v. de geboortedatum en sterftedatum, de wel-gekoppelde formulieren bevatten de leeftijd uit het sterftebericht. 

2.5 Bridge Coding studie

Om de kwaliteit van de automatische codering te verkennen, is een deel van de automatisch gecodeerde formulieren tevens handmatig gecodeerd waarna vervolgens een bridge coding studie is uitgevoerd. Een bridge coding studie onderzoekt het effect van het gebruik van twee verschillende methoden op dezelfde dataset. Data van doodsoorzaakverklaringen van alle willekeurig geselecteerde jaartallen zijn handmatig en automatisch gecodeerd en de uitkomsten zijn onderling vergeleken. Vervolgens is voor de dataset een ‘Perfect Comparability Ratio’ (PCP) berekend. De PCP is een maat voor de validiteit van het automatisch coderen. Het wordt gedefinieerd als het percentage doodsoorzaakverklaringen met een identieke ICD-10 code (x) wanneer manueel coderen wordt vergeleken met automatisch coderen. De formule om het te berekenen is:

Indien de PCP sterk afwijkt van 100 procent betekent dit dat het automatisch coderen sterk verschilt van manueel coderen, en zal dit dus verder onderzocht moeten worden. 

2) International Classification of Diseases, 10th revision (ICD-10). World Health Organization (WHO).