Pilotonderzoek codering doodsoorzaken Caribisch Nederland
Over deze publicatie
De directie Zorg en Jeugd Caribisch Nederland (ZJCN) van het Ministerie van Volksgezondheid, Welzijn en Sport (VWS) wil inventariseren of de doodsoorzakengegevens op Bonaire, Sint Eustatius en Saba (Caribisch Nederland) op structurele wijze kunnen worden ontsloten, om beleid op het gebied van de publieke gezondheid te ondersteunen. Deze pilotstudie is onderdeel daarvan en bevat een eerste verkenning van de beschikbare doodsoorzakendata uit Caribisch Nederland om te inventariseren wat er nodig is voor het genereren van doodsoorzakenstatistieken voor deze populatie en wat mogelijke knelpunten zouden kunnen zijn. Uit de verkennende analyse blijkt dat de data enkele onvolkomenheden kent waarvoor aanbevelingen worden gedaan voor verdere optimalisatie.
1. Inleiding
De directie Zorg en Jeugd Caribisch Nederland (ZJCN) van het Ministerie van Volksgezondheid, Welzijn en Sport (VWS) wil inventariseren of de doodsoorzakengegevens op Bonaire, Sint Eustatius en Saba (Caribisch Nederland) op structurele wijze kunnen worden ontsloten, om beleid op het gebied van de publieke gezondheid te ondersteunen. Bonaire, Sint Eustatius en Saba zijn bijzondere gemeenten van Nederland en de verwerking van de doodsoorzaakgegevens van deze gemeenten valt niet onder de Wet op de Lijkbezorging, maar onder de Wet verklaringen van overlijden BES en de Begrafeniswet BES1).
Het CBS is de enige organisatie in Nederland die over doodsoorzaakgegevens beschikt en wettelijke toestemming heeft om deze te verwerken. Daarom heeft VWS het CBS gevraagd om te onderzoeken of het mogelijk is statistische gegevens te publiceren over de doodsoorzakengegevens van deze bijzondere gemeenten, conform de methodiek die het CBS ook voor de doodsoorzakenstatistiek over Europees Nederland gebruikt.
2. Data en methode
2.1 Data en setting
Ruwe data voor deze pilotstudie zijn verkregen via informatie afkomstig van doodsoorzaakverklaringen uit Caribisch Nederland. De geneeskundige geeft een verklaring van overlijden af en doet daarnaast een afzonderlijke opgave van de doodsoorzaak. Beiden verklaringen worden overgedragen aan de ambtenaar van de burgerlijke stand. De verklaring met daarin de opgave van de doodsoorzaak wordt door de ambtenaar van de burgerlijke stand ongeopend verzonden naar het CBS (Bonaire). Voor deze pilotstudie zijn gegevens uit 758 doodsoorzaakverklaringen over de periode 2014-2023 ontvangen. De informatie die op de ontvangen doodsoorzaakverklaringen was ingevuld is voor de uitvoering van deze studie handmatig overgetypt. Op basis van de overgetypte formulieren zijn data verkregen over overlijdensdatum, geslacht, leeftijd (afgeleid van geboorte- en overlijdensdatum), geboorteland, nationaliteit, woonplaats en de doodsoorzaken. Daarnaast zijn openbaar beschikbare data geraadpleegd over het aantal overlijdens in Caribisch Nederland (StatLine - Caribisch Nederland;overledenen, geslacht, leeftijd en burgerlijke staat (cbs.nl)).
2.2 Bepaling van de doodsoorzaak
De doodsoorzaak is gecodeerd aan de hand van internationaal opgestelde richtlijnen van de Wereldgezondheidsorganisatie (WHO)2). Met ‘de doodsoorzaak’ wordt de onderliggende doodsoorzaak bedoeld. Het coderen volgens de richtlijnen van de WHO houdt in dat één ziekte of gebeurtenis als onderliggende doodsoorzaak kan worden aangemerkt. De onderliggende doodsoorzaak wordt gedefinieerd als (a) de ziekte of aandoening waarmee de reeks van gebeurtenissen die uiteindelijk het overlijden van de persoon veroorzaakte een aanvang nam of (b) de omstandigheden van het ongeval of geweld dat het letsel waardoor de persoon overleed veroorzaakte. Aan de hand van alle doodsoorzaken en bijkomende aandoeningen die hebben bijgedragen tot de dood, zoals vermeld op de doodsoorzaakverklaringen, is er dus per formulier één onderliggende doodsoorzaak bepaald. Deze doodsoorzaak is geclassificeerd volgens de International Statistical Classification of Diseases and Related Health Problems (ICD) van de World Health Organization (WHO).
In deze pilotstudie is eerst onderzocht in hoeverre de doodsoorzaak gecodeerd kon worden middels het automatische codeerprogramma Iris (BfArM). Deze Iris codeersoftware wordt in meerdere landen gebruikt voor het coderen van doodsoorzaken. Voor Europees Nederland werd in 2014-2023 ruim de helft van de formulieren automatisch gecodeerd. Om de mogelijkheid van automatische codering van doodsoorzaakverklaringen uit Caribisch Nederland te exploreren, zijn de compleet ingevulde formulieren met het automatische codeersysteem verwerkt. Hierna is geteld hoeveel formulieren er daadwerkelijk automatisch verwerkt konden worden. Vervolgens zijn formulieren die niet automatisch gecodeerd konden worden handmatig gecodeerd door medisch codeurs, onder supervisie van de medisch ambtenaar van het CBS. Dit is conform de werkwijze die nu gebruikt wordt voor het produceren van de doodsoorzakenstatistiek voor Europees Nederland.
2.3 Verkennende analyses
Er zijn een aantal verkennende en beschrijvende analyses uitgevoerd. Ten eerste zijn het aantal ontvangen doodsoorzaakverklaringen uit Caribisch Nederland en het aantal overlijdens getabelleerd, waarna het aandeel ontbrekende doodsoorzaakformulieren is geschat. Deze analyse is uitgesplitst naar jaartal. Vervolgens zijn de karakteristieken van de studiepopulatie getabelleerd waarbij een inventarisatie is gedaan van de compleetheid van de data. Aantallen kleiner dan vijf zijn aangegeven met ‘<5’.
Ten tweede zijn de doodsoorzaken in kaart gebracht. Voor elk formulier is er een onderliggende doodsoorzaakcode toegekend op basis van de door de WHO opgestelde ICD-10 codeerregels. Hiertoe zijn compleet ingevulde formulieren deels automatisch en deels handmatig gecodeerd. Er is onderzocht hoeveel formulieren er automatisch gecodeerd konden worden. De uitkomsten zijn getabelleerd. De formulieren die niet automatisch gecodeerd konden worden, zijn geanalyseerd om mogelijke oorzaken van de belemmering bij het automatisch coderen te achterhalen. Deze resultaten zijn vervolgens beschreven en de betreffende formulieren zijn handmatig gecodeerd. Een deel van de formulieren wordt ook in het huidige productieproces voor Europees Nederland altijd handmatig gecodeerd; het gaat hierbij om niet-natuurlijke doodsoorzaken, doodgeborenen, neonatale en perinatale sterfte. Er is zowel een automatisch gecodeerd percentage berekend van formulieren inclusief en exclusief niet-natuurlijke doodsoorzaken, doodgeborenen, neonatale en perinatale sterfte .
Op basis van de ICD-10 codes zijn doodsoorzaken gegroepeerd en zijn de volgende hoofdgroepen gevormd, gebaseerd op een clustering van de ICD-10 hoofdstukken: nieuwvormingen (ICD-10 codes: C00-C97 en D00-D48), hart- en vaatziekten (ICD-10 codes: I00-I99), psychische stoornissen en ziekten van het zenuwstelsel en zintuigen (ICD-10 codes: F00-F99), ziekten van de ademhalingsorganen (ICD-10 codes: J00-J99), COVID-19 (ICD-10 codes: U071-U072), niet-natuurlijke doodsoorzaken (ICD-10 codes V01-Y89) en overige doodsoorzaken. Deze clustering is aangehouden om toereikende aantallen te waarborgen. Vervolgens is het aandeel overlijdens aan de hoofdgroepen doodsoorzaken berekend.
2.4 Koppeling aan de sterftebestanden
Om de volledigheid en kwaliteit van de data te controleren is er een koppeling uitgevoerd tussen de doodsoorzakenformulieren en de sterfteberichten. De koppeling is uitgevoerd op overlijdensdatum, geboortedatum en geslacht. Omdat de populatie vrij klein is, kon er gekoppeld worden aan de hand van overlijdens- en geboortedatum zonder duplicaten te krijgen. Vervolgens is gekeken naar demografische karakteristieken van de overledenen waarbij de populatie waarvan wel een doodsoorzaakverklaring is ontvangen is vergeleken met de populatie waarvan geen doodsoorzaakverklaring is ontvangen. Specifiek is gekeken naar het geslacht, de leeftijd en in het geval van de wel-gekoppelde formulieren; het geboorteland. Bij de niet-gekoppelde formulieren moest de leeftijd worden uitgerekend o.b.v. de geboortedatum en sterftedatum, de wel-gekoppelde formulieren bevatten de leeftijd uit het sterftebericht.
2.5 Bridge Coding studie
Om de kwaliteit van de automatische codering te verkennen, is een deel van de automatisch gecodeerde formulieren tevens handmatig gecodeerd waarna vervolgens een bridge coding studie is uitgevoerd. Een bridge coding studie onderzoekt het effect van het gebruik van twee verschillende methoden op dezelfde dataset. Data van doodsoorzaakverklaringen van alle willekeurig geselecteerde jaartallen zijn handmatig en automatisch gecodeerd en de uitkomsten zijn onderling vergeleken. Vervolgens is voor de dataset een ‘Perfect Comparability Ratio’ (PCP) berekend. De PCP is een maat voor de validiteit van het automatisch coderen. Het wordt gedefinieerd als het percentage doodsoorzaakverklaringen met een identieke ICD-10 code (x) wanneer manueel coderen wordt vergeleken met automatisch coderen. De formule om het te berekenen is:

Indien de PCP sterk afwijkt van 100 procent betekent dit dat het automatisch coderen sterk verschilt van manueel coderen, en zal dit dus verder onderzocht moeten worden.
3. Resultaten
3.1 Studiepopulatie
Tabel 3.1.1 bevat informatie over het aantal doodsoorzaakverklaringen die beschikbaar waren in vergelijking met gegevens over het aantal overlijdens, uitgesplitst naar jaartal. Het jaartal 2023 (n=34 formulieren) is in deze tabel niet meegenomen, omdat een aanzienlijk deel van de doodsoorzaakverklaringen uit dit jaartal vermoedelijk nog niet ontvangen en verwerkt was en het aantal overlijdens nog niet definitief bekend was voor dit jaar, waardoor geen inzicht verkregen kon worden in de volledigheid van de registratie. Daarnaast zijn 35 formulieren waarvan het jaartal ontbrak niet meegenomen (zie flowchart, figuur 3.1.2). Het percentage ontvangen doodsoorzaakverklaringen van de overledenen varieerde per jaartal. Voor het jaar 2015 was het percentage het laagst; in dat jaar was slechts van één overledene (0,8 procent van alle overledenen) de doodsoorzaakverklaring ontvangen. In 2022 was het percentage ontvangen doodsoorzaakverklaringen het hoogst met 86,2 procent. Voor de overige jaren was van ongeveer 30 tot 70 procent van de overledenen de doodsoorzaakverklaring ontvangen (Tabel 3.1.1). Ter vergelijking, in Europees Nederland worden de cijfers gepubliceerd wanneer minimaal 95 procent van de doodsoorzaakverklaringen ontvangen zijn, om mogelijke vertekening door selectie te beperken.
| Jaar | Aantal doodsoorzaakverklaringen | Aantal overledenen1) | Percentage ontvangen |
|---|---|---|---|
| 2014 | 43 | 136 | 31,6 |
| 2015 | 1 | 122 | 0,8 |
| 2016 | 53 | 99 | 53,5 |
| 2017 | 73 | 134 | 54,5 |
| 2018 | 62 | 102 | 60,8 |
| 2019 | 88 | 125 | 70,4 |
| 2020 | 87 | 143 | 60,8 |
| 2021 | 113 | 162 | 69,8 |
| 2022 | 169 | 196 | 86,2 |
In totaal zijn er 758 formulieren ontvangen. Van 35 formulieren ontbrak de informatie over welk het jaartal het betrof en formulieren uit 2023 (n=34) zijn niet meegenomen in deze analyse, omdat deze data niet vergeleken konden worden met het aantal overlijdens uit 2023 (data nog niet definitief bekend). | |||
Tabel 3.1.3 bevat karakteristieken van de studiepopulatie. In totaal waren er 689 formulieren uit 2014-2022. Bij het analyseren van de karakteristieken van de studiepopulatie, viel op dat er meer doodsoorzaakverklaringen waren van mannen (406) dan van vrouwen (274). Van 9 doodsoorzaak-verklaringen was het geslacht onbekend. De mediane leeftijd (interkwartielafstand) was 76,0 (66,0-84,0). Voor vrouwen was dit 79,0 (68,0-88,0) en voor mannen 74,0 (63,0-82,0). De meeste mensen zaten in de leeftijdscategorie 70 tot 90 jaar en er waren relatief meer vrouwen dan mannen in de leeftijdscategorie van 90 jaar of ouder. Bij ruim 10 procent van de overledenen kon de leeftijd niet worden berekend door missende gegevens. Bijna 88 procent had Bonaire als woonplaats, terwijl ruim de helft was ook geboren in Bonaire.
| Totale studiepopulatie (N=689) | Vrouw (N=274) | Man (N=406) | ||
|---|---|---|---|---|
| Leeftijd (jaren)1), mediaan [IQR] | 76,0 [66,0-84,0] | 79,0 [68,0-88,0] | 74,0 [63,0-82,0] | |
| Leeftijdscategorieën1) | 0 tot 10 jaar | 8 | . | . |
| Leeftijdscategorieën1) | 10 tot 20 jaar | <5 | <5 | <5 |
| Leeftijdscategorieën1) | 20 tot 30 jaar | 10 | . | . |
| Leeftijdscategorieën1) | 30 tot 40 jaar | 9 | . | . |
| Leeftijdscategorieën1) | 40 tot 50 jaar | 25 | 8 | 17 |
| Leeftijdscategorieën1) | 50 tot 60 jaar | 48 | 21 | 27 |
| Leeftijdscategorieën1) | 60 tot 70 jaar | 120 | 38 | 82 |
| Leeftijdscategorieën1) | 70 tot 80 jaar | 168 | 63 | 104 |
| Leeftijdscategorieën1) | 80 tot 90 jaar | 168 | 74 | 93 |
| Leeftijdscategorieën1) | 90+ | 81 | 50 | 31 |
| Nationaliteit | Nederlands | 567 | 231 | 335 |
| Nationaliteit | Amerikaans | 29 | 9 | 20 |
| Nationaliteit | Overig2) | 33 | 11 | 18 |
| Nationaliteit | Onbekend | 60 | 23 | 33 |
| Geboorteplaatsland | Bonaire | 355 | 165 | 189 |
| Geboorteplaatsland | Verenigde Staten van Amerika | 29 | 9 | 20 |
| Geboorteplaatsland | Curacao | 76 | 23 | 53 |
| Geboorteplaatsland | Nederland | 74 | 25 | 49 |
| Geboorteplaatsland | Overig2) | 74 | 25 | 48 |
| Geboorteplaatsland | Onbekend | 81 | 27 | 47 |
| Woonplaats | Bonaire | 605 | 251 | 352 |
| Woonplaats | Europees Nederland | 11 | . | . |
| Woonplaats | Curacao | 6 | . | . |
| Woonplaats | Verenigde Staten van Amerika | 19 | 6 | 13 |
| Woonplaats | Overig2) | 6 | . | . |
| Woonplaats | Onbekend | 42 | 15 | 20 |
| Databron: ontvangen doodsoorzaakverklaringen uit Caribisch Nederland. Ontbrekende waarden zijn niet geimputeerd. Daardoor tellen niet alle waarden op tot het totaal aantal formulieren. Getallen kleiner dan 5 zijn aangeduid met '<5'. Waarden zijn weggepunt als een optelsom kan leiden tot onthulling van kleine getallen. 1) 50 formulieren zijn niet meegenomen in de berekening van leeftijd, omdat de geboortedatum danwel de overlijdensdatum onbekend (of onplausibel) waren. 2) Onder overig valt een grote verscheidenheid aan nationaliteiten en woonplaats/geboorteplaatslanden. | ||||
3.2 Koppeling sterfteberichten
In totaal waren er 1219 sterfteberichten waarbij het overlijdensjaar tussen 2014 en 2023 lag. Er waren 637 doodsoorzakenformulieren waarbij dit het geval was en waarbij tevens de geboorte-en sterftedatum bekend was. De koppeling leverde een set van 515 doodsoorzakenformulieren die ook gekoppeld waren aan een sterftebericht, de betekent dat 122 formulieren niet gekoppeld konden worden aan een sterftebericht. In de gekoppelde berichten is de data van het sterftebericht aangehouden, in de niet-gekoppelde formulieren was de data afkomstig van het doodsoorzakenformulier. In beide gevallen was de meerderheid van de overledenen man, 78 bij de niet-gekoppelde formulieren en 297 bij de wel-gekoppelde formulieren. De gekoppelde formulieren bevatte geen missende data wat betreft leeftijd en geboorteland. Bij de niet-gekoppelde formulieren ontbrak bij 3 gevallen het geslacht en bij 11 formulieren de leeftijd. Bij het berekenen van de leeftijd bij de niet-gekoppelde formulieren kwam er 1 leeftijd uit die groter was dan 150, deze leeftijd is wel meegenomen in de tabellen. Bij de gekoppelde populatie lag de mediaan op 76 jaar, terwijl die bij de niet-gekoppelde formulieren op 72 jaar lag. Dit werd ook teruggezien in het aantal overledenen per groep, het grootste aantal overledenen bij de wel-gekoppelde formulieren lag in de groep van personen tussen de 80 en 90 jaar, bij de niet-gekoppelde formulieren was dit in de groep tussen de 70 en 80 jaar.
Bij de gekoppelde formulieren is ook gekeken naar het geboorteland, het overgrote deel van de personen is geboren in de voormalig Nederlandse Antillen of Bonaire, gevolgd door Nederland en Curaçao. Deze verhouding is gelijk bij mannen en vrouwen. Zie Tabel 3.2.1 en 3.2.2 voor de karakteristieken uitgesplitst naar wel- en niet gekoppelde formulieren.
| Totale studiepopulatie (N=515) | Vrouw (N=217) | Man (N=297) | ||
|---|---|---|---|---|
| Leeftijd (jaren), mediaan [IQR] | 76,0 [67,0-85,0] | 79,0 [68,3-88,0] | 75,0 [65,0-83,0] | |
| Leeftijdscategorieën | 0 tot 10 jaar | . | <5 | <5 |
| Leeftijdscategorieën | 10 tot 20 jaar | <5 | <5 | <5 |
| Leeftijdscategorieën | 20 tot 30 jaar | 6 | <5 | . |
| Leeftijdscategorieën | 30 tot 40 jaar | 9 | <5 | . |
| Leeftijdscategorieën | 40 tot 50 jaar | 19 | 7 | 12 |
| Leeftijdscategorieën | 50 tot 60 jaar | 36 | 19 | 17 |
| Leeftijdscategorieën | 60 tot 70 jaar | 91 | 31 | 60 |
| Leeftijdscategorieën | 70 tot 80 jaar | 136 | 52 | 84 |
| Leeftijdscategorieën | 80 tot 90 jaar | 145 | 61 | 84 |
| Leeftijdscategorieën | 90+ | 67 | 44 | 23 |
| Geboorteland | Bonaire | 65 | 25 | 40 |
| Geboorteland | Verenigde Staten van Amerika | 10 | <5 | . |
| Geboorteland | Curacao | 23 | 5 | 18 |
| Geboorteland | Nederland | 56 | 21 | 35 |
| Geboorteland | Nederlandse Antillen | 315 | 140 | 175 |
| Geboorteland | Overig1) | 46 | 23 | 23 |
| Geboorteland | Onbekend | 0 | 0 | 0 |
| Databron: ontvangen sterfteberichten uit Caribisch Nederland Ontbrekende waarden zijn niet geimputeerd. Daardoor tellen niet alle waarden op tot het totaal aantal formulieren. Getallen kleiner dan 5 zijn aangeduid met '<5'. Waarden zijn weggepunt als een optelsom kan leiden tot onthulling van kleine getallen. 1) Onder overig valt een grote verscheidenheid aan nationaliteiten en woonplaats/geboorteplaatslanden. IQR: interkwartielafstand | ||||
| Totale studiepopulatie (N=122) | Vrouw (N=41) | Man (N=78) | ||
|---|---|---|---|---|
| Leeftijd (jaren), mediaan [IQR] | 72,0 [61,0-82,0] | 80,0 [72,0-85,5] | 68,0 [58,0-78,0] | |
| Leeftijdscategorieën | 0 tot 10 jaar | <5 | <5 | <5 |
| Leeftijdscategorieën | 10 tot 20 jaar | <5 | <5 | <5 |
| Leeftijdscategorieën | 20 tot 30 jaar | <5 | <5 | <5 |
| Leeftijdscategorieën | 30 tot 40 jaar | <5 | <5 | <5 |
| Leeftijdscategorieën | 40 tot 50 jaar | 6 | <5 | . |
| Leeftijdscategorieën | 50 tot 60 jaar | 10 | <5 | . |
| Leeftijdscategorieën | 60 tot 70 jaar | 24 | 5 | 19 |
| Leeftijdscategorieën | 70 tot 80 jaar | 27 | 10 | 16 |
| Leeftijdscategorieën | 80 tot 90 jaar | 20 | 12 | 7 |
| Leeftijdscategorieën | 90+ | 16 | 8 | 8 |
| Databron: ontvangen doodsoorzaakverklaringen uit Caribisch Nederland. Ontbrekende waarden zijn niet geimputeerd. Daardoor tellen niet alle waarden op tot het totaal aantal formulieren. Getallen kleiner dan 5 zijn aangeduid met '<5'. Waarden zijn weggepunt als een optelsom kan leiden tot onthulling van kleine getallen. IQR: interkwartielafstand | ||||
3.3 Codering doodsoorzaken
Er zijn in totaal 624 formulieren door het automatisch codeersysteem Iris gehaald. Hiervan konden er 264 automatisch gecodeerd worden, terwijl 360 formulieren niet automatisch gecodeerd konden worden. Dit betekent dat van alle geteste formulieren, 42,3 procent automatisch gecodeerd kon worden (Tabel 3.3.1). De formulieren waarbij de arts heeft aangegeven dat het een niet-natuurlijke doodsoorzaak betrof, worden standaard door Iris gemarkeerd en worden niet automatisch maar handmatig gecodeerd. Wanneer deze eruit gefilterd worden dan stijgt het percentage automatisch gecodeerde formulieren naar 48.2 procent (Tabel 3.3.2). Voor het Europese gedeelte van Nederland is dit ongeveer 60 procent.
| Jaar | Aantal formulieren getest in Iris | Automatisch Gecodeerd | Percentage Automatisch Gecodeerd |
|---|---|---|---|
| 2014 | 40 | 11 | 27,5 |
| 2016 | 51 | 17 | 33,3 |
| 2017 | 67 | 14 | 20,9 |
| 2018 | 54 | 26 | 48,1 |
| 2019 | 86 | 37 | 43,0 |
| 2020 | 78 | 38 | 48,7 |
| 2021 | 98 | 52 | 53,1 |
| 2022 | 150 | 69 | 46,0 |
| Totaal | 624 | 264 | 42,3 |
| Gezien slechts 1 doodsoorzaakverklaring is ontvangen in 2015, is dit jaartal niet meegenomen in deze analyse. | |||
| Jaar | Aantal formulieren getest in Iris | Automatisch Gecodeerd | Percentage Automatisch Gecodeerd |
|---|---|---|---|
| 2014 | 39 | 11 | 28,2 |
| 2016 | 44 | 17 | 38,6 |
| 2017 | 51 | 14 | 27,5 |
| 2018 | 47 | 26 | 55,3 |
| 2019 | 77 | 37 | 48,1 |
| 2020 | 69 | 38 | 55,1 |
| 2021 | 95 | 52 | 54,7 |
| 2022 | 130 | 69 | 53,1 |
| Totaal | 552 | 264 | 47,8 |
| Gezien slechts 1 doodsoorzaakverklaring is ontvangen in 2015, is dit jaartal niet meegenomen in deze analyse. | |||
Alle 360 formulieren die niet automatisch gecodeerd konden worden, zijn alsnog handmatig gecodeerd. De codeur constateerde dat 35 formulieren een onbekende term bevatten, terwijl 36 formulieren verkeerd gespelde termen bevatten. Op basis van de informatie die op het formulier stond, was de codeur in staat aan elk formulier een onderliggende doodsoorzaak toe te kennen.
In Tabel 3.3.3 is een overzicht te zien van het aantal automatisch en manueel gecodeerde formulieren per ICD-categorie. De meest voorkomende doodsoorzaken waren nieuwvormingen en hart- en vaatziekten, gevolgd door niet natuurlijke overlijdens. Ziekten van bloed en bloedvormende organen en bepaalde aandoeningen van het immuunsysteem en ziekten van het spijsverteringsstelsel moesten relatief het vaakst manueel gecodeerd worden.
| Aantal | Aandeel van totaal (%) | Automatisch gecodeerd | Manueel gecodeerd | |
|---|---|---|---|---|
| Infectieziekten en parasitaire aandoeningen (A00-B99) | 18 | 2,9 | 38,9 | 61,1 |
| Nieuwvormingen (C00-D48) | 163 | 26,1 | 44,8 | 55,2 |
| Maligne Neoplasmata (C00-C97) | 151 | 24,2 | 47,7 | 52,3 |
| Ziekten van bloed en bloedvormende organen en bepaalde aandoeningen van het immuunsysteem (D50-D89) | 5 | 0,8 | 20,0 | 80,0 |
| Endocriene ziekten en voedings- en stofwisselingsstoornissen (E00-E90) | 20 | 3,2 | 50,0 | 50,0 |
| Psychische stoornissen en gedragsstoornissen (F00-F99) | 35 | 5,6 | 62,9 | 37,1 |
| Ziekten van zenuwstelsel (G00-H95) | 18 | 2,9 | 50,0 | 50,0 |
| Ziekten van hart en vaatstelsel (I00-I99) | 151 | 24,2 | 46,4 | 53,6 |
| Ziekten van ademhalingsstelsel (J00-J99) | 39 | 6,3 | 56,4 | 43,6 |
| Ziekten van spijsverteringsstelsel (K00-K99) | 15 | 2,4 | 20,0 | 80,0 |
| Ziekten van huid en subcutis (L00-L99) | 5 | 0,8 | 60,0 | 40,0 |
| Ziekten van botspierstelsel en bindweefsel (M00-M99) | <5 | . | . | . |
| Ziekten van urogenitaal stelsel (N00-N99) | 16 | 2,6 | 50,0 | 50,0 |
| Congenitale afwijkingen, Misvormingen en Chromosoomafwijkingen (Q00-Q99) | 0 | 0,0 | 0,0 | 0,0 |
| Bepaalde aandoeningen die hun oorsprong hebben in perinatale periode (P00-P96) | <5 | . | . | . |
| Symptomen, afwijkende klinische bevindingen en laboratoriumuitslagen, niet elders geclassificeerd (R00-R99) | 31 | 5,0 | 61,3 | 38,7 |
| COVID-19 (U071-U072) | 25 | 4,0 | 64,0 | 36,0 |
| Niet-natuurlijke doodsoorzaken | 78 | 12,5 | 0,0 | 100,0 |
Van de 624 doodsoorzaakformulieren, zijn er 72 formulieren door de arts als niet-natuurlijke doodsoorzaak ingevuld. Alle niet-natuurlijke doodsoorzaakformulieren zijn handmatig gecodeerd. Van deze 72 niet-natuurlijke doodsoorzaken, is 68 uiteindelijk ook als niet-natuurlijk gecodeerd tijdens het handmatig coderen en 4 formulieren zijn alsnog als natuurlijke doodsoorzaak gecodeerd door de codeur. Tabel 3.3.4 laat het aantal niet-natuurlijke doodsoorzaken per jaartal zien. Er zijn ook formulieren gevonden die als natuurlijke dood zijn ingevuld door de arts, maar waarbij de codeur de onderliggende doodsoorzaak als niet-natuurlijk heeft gecodeerd. Dit waren in totaal 10 doodsoorzaakformulieren. Totaal zijn er 78 niet-natuurlijke doden gecodeerd. Dit betekent dat na handmatig coderen, uiteindelijk 14.3 procent van de geteste doodsoorzaakformulieren een niet-natuurlijke dood betrof. Tabel 3.3.5 laat een overzicht zien van het aantal niet-natuurlijke doden per ICD-10 categorie. De niet-natuurlijke doden omvatten met name vervoersongevallen, maar ook een groot gedeelte was te wijden aan ongelukken op het water zoals verdrinking of een blootstelling aan druk van omgevingslucht, bijvoorbeeld tijdens duiken (zie ook Tabel 3.3.5). Ongeveer 19 procent van de niet-natuurlijke doden hebben een onvolledig omschreven oorzaak.
| Jaar | Aantal natuurlijke doden | Aantal niet-natuurlijke doden | Percentage niet-natuurlijke doden |
|---|---|---|---|
| 2014 | 39 | <5 | . |
| 2016 | 44 | 7 | 15,9 |
| 2017 | 51 | 16 | 31,4 |
| 2018 | 45 | 9 | 20,0 |
| 2019 | 77 | 9 | 11,7 |
| 2020 | 68 | 10 | 14,7 |
| 2021 | 95 | <5 | . |
| 2022 | 127 | 23 | 18,1 |
| Gezien slechts 1 doodsoorzaakverklaring is ontvangen in 2015, is dit jaartal niet meegenomen in deze analyse. | |||
| ICD-10 Categorie | Aantal | Percentage (%) van totaal aantal NND1) |
|---|---|---|
| Vervoersongevallen (V01-V99) | 16 | 20,5 |
| Vallen (W00-W19) | 7 | 9,0 |
| Onopzettelijke Verdrinking en Onderdompeling (W65-W74) | 10 | 12,8 |
| Overige onopzettelijke belemmeringen van ademhaling (W75-W84) | <5 | . |
| Blootstelling aan elektrische stroom en straling en aan exterme temperatuur en druk van omgevingslucht (W85-W99) | 8 | 10,3 |
| Onopzettelijke vergiftiging door en blootstelling aan schadelijke stoffen (X40-X49) | <5 | . |
| Onopzettelijke blootstelling aan overige en niet-gespecificeerde factoren (X58-X59) | <5 | . |
| Opzettelijk zichzelf schade toebrengen (X60-X84) | 6 | 7,7 |
| Geweldpleging (X85-Y09) | 7 | 9,0 |
| Late gevolgen van uitwendige oorzaken van ziekte en sterfte (Y85-Y89) | <5 | . |
| Onvolledig omschreven oorzaak van sterfte (R99) | 15 | 19,2 |
| 1) Niet-natuurlijke doodsoorzaken. | ||
Tabel 3.3.6 bevat een overzicht van hoofdgroepen doodsoorzaken. Op hoofdgroepniveau waren nieuwvormingen en hart- en vaatziekten de meest voorkomende doodsoorzaken, net als in Europees Nederland. Daarop volgden de overige doodsoorzaken en ziekten van de ademhalingsorganen.
| Aantal | Percentage van totaal | |
|---|---|---|
| Nieuwvormingen | 163 | 26,1 |
| Ziekten van hart- en vaatstelsel | 151 | 24,2 |
| Psychische stoornissen en ziekten van zenuwstelsel en zintuigen | 53 | 8,5 |
| Ziekten van de ademhalingsorganen | 39 | 6,3 |
| COVID-19 | 25 | 4,0 |
| Niet-natuurlijke doodsoorzaken | 78 | 12,5 |
| Overige doodsoorzaken | 115 | 18,4 |
| Totaal | 624 | 100,0 |
Zie Toelichting Tabel 8 voor bijbehorende ICD-10 codes. | ||
3.4 Resultaten Bridge Coding Studie
De 264 formulieren die Iris automatisch heeft gecodeerd zijn opnieuw gecodeerd door een medische codeur. Van de 264 formulieren zijn 243 formulieren door de codeur handmatig gecodeerd met exact dezelfde ICD-10 code, tot op de 3 getallen nauwkeurig. Dit resulteerde in een PCP van 92 procent.
4. Discussie
In deze verkennende analyse is onderzocht of het mogelijk is statistische gegevens te publiceren over de doodsoorzakengegevens van de bijzondere gemeenten in Caribisch Nederland, conform de methodiek die het CBS ook voor de doodsoorzakenstatistiek over Europees Nederland gebruikt. In deze studie laten we zien dat het mogelijk is om:
- demografische gegevens van overlijdens in Caribisch Nederland te tonen
- formulieren handmatig te coderen en dat het automatische codeerprogramma Iris een rol kan spelen in een doodsoorzakenstatistiek over Caribisch Nederland.
Uit de verkennende analyse in deze pilot studie werd gevonden dat 48,2 procent van de geteste formulieren in Iris gecodeerd konden worden. Ondanks dat dit percentage lager is dan het percentage formulieren dat automatisch gecodeerd kan worden in Europees Nederland (ongeveer 60 procent), zijn er wel aanknopingspunten gevonden in deze analyse om dit percentage verder te verhogen.
Tijdens het analyseren van de ingevulde formulieren viel op dat er relatief veel spelfouten, schrijfvarianten en soms ook onjuiste medische termen ingevuld waren. Bovendien viel op dat sommige doodsoorzaakformulieren waren ingevuld met termen die mogelijk op specifieke locaties en/of door bepaalde groepen zorgverleners vaker gebruikt worden, evenals Engelse termen, wat de automatische verwerking gecompliceerder kan maken.
In Europees Nederland is ook sprake van een variatie bij de invulling, de afgelopen jaren zijn hiervoor regels ontwikkeld die de automatische verwerking vergemakkelijken, bijvoorbeeld door afkortingen en omdraaiingen automatisch om te zetten. Wanneer gewerkt zou worden aan een verdere optimalisatie van de registratie kan overwogen worden dit ook voor het Caribisch Nederland te verkennen.
Automatisch coderen is een essentieel onderdeel van de doodsoorzakenstatistiek: het vermindert arbeidsintensieve handelingen van medische codeurs en kan registratie van statistiek standaardiseren waardoor het bijdraagt aan goede vergelijkbaarheid in de tijd en met andere landen. In de huidige studie werd ruim 90 procent overeenstemming gevonden tussen automatisch coderen met Iris en handmatig coderen door de codeur. Dit suggereert dat ook in Caribisch Nederland Iris een bruikbaar hulpmiddel kan zijn bij het coderen van de doodsoorzaken.
Tijdens de koppelingsanalyse viel op dat er veel doodsoorzaakformulieren ontbraken. Een hoog percentage van onvolledigheid in ontvangen formulieren kan leiden tot een vertekening. Het is nog onduidelijk wat dit betekent voor de doodsoorzakenstatistiek. Voor toekomstige studies is het belangrijk om inzicht te krijgen waarom bepaalde formulieren ontbreken, en in hoeverre dit leidt tot een selectie bias. Het verder onderzoeken van de koppelmogelijkheden met het bevolkingsregister kan aanknopingspunten bieden.
In deze analyse viel het relatief hoge percentage van niet-natuurlijke overlijdens als gevolg van ongevallen in het water op. Van de 65 niet-natuurlijke doodsoorzaakformulieren zonder de code R99, waren er 10 gecodeerd als verdrinking en 8 in de categorie ‘blootstelling aan druk van omgevingslucht’ als gevolg van scubadiven, wat betekent dat bijna eenderde van het aantal niet-natuurlijke doden is toe te schrijven aan ongevallen op het water. Dit is een hoger percentage in vergelijking met Europees Nederland, wat mogelijk gerelateerd is aan het aantal duik- en snorkelactiviteiten dat op de eilanden plaatsvindt. Verder viel op dat de waterongevallen niet in het jaar 2021 hebben plaatsgevonden.
Tenslotte viel tijdens het analyseren van de doodsoorzakenformulieren op dat er geen doodsoorzaakformulieren zijn gevonden met doodgeborenen.
5. Conclusies en aanbevelingen
Het verwerken en analyseren van de formulieren voor deze pilotstudie was een arbeidsintensief proces. Idealiter kan er op termijn een deels geautomatiseerd productieproces bewerkstelligd worden van waaruit reguliere doodsoorzakenstatistieken voor het Caribisch deel van Nederland kunnen worden vervaardigd. Op basis van de gegevens die voor deze studie zijn ontvangen en verwerkt kunnen nog geen betrouwbare doodsoorzakenstatistieken worden geproduceerd.
Er zijn echter wel mogelijkheden om hier naartoe te werken: voor het inrichten van het productieproces kunnen in elke fase van de verwerking suggesties worden gedaan om dit proces te optimaliseren. Hieronder volgen voor elk onderdeel van het proces enkele aanbevelingen en overwegingen.
- Invulling van de formulieren
- Gesprekken met artsen om invulling nader toe te lichten, en belang van de statistiek te benadrukken conform de WHO-toelichting waarbij logica van invulling van het doodsoorzakenformulier niet altijd overeenkomt met hoe een medisch dossier wordt bijgehouden.
- Afstemming van de opmaak en inhoud van de formulieren zodat deze zo uniform mogelijk kunnen worden verwerkt, mogelijk is hiervoor wijziging van wet- en regelgeving nodig.
- Idealiter zou op termijn gekeken kunnen worden naar mogelijkheden voor digitale aanlevering vanuit de systemen die zorgverleners zelf gebruiken voor de patiëntenadministratie.
- Route en verwerking van de formulieren
- De route die wordt afgelegd voor ontvangst van formulieren en de tijd die hiermee samenhangt zou geoptimaliseerd kunnen worden.
- Voor vertoetsing van medische termen is borgen van basiskennis van de relevante medische terminologie noodzakelijk.
- Inventarisatie van veel voorkomende termen en het maken van een regelbestand en woordenboek voor Iris om de verwerking zo goed mogelijk te kunnen standaardiseren. Hierbij moet rekening gehouden worden met verschillende talen als ook formulieren geheel in het Engels worden ingevuld.
- Onderzoek mogelijkheden met koppelen aan sterftebestanden om de populatie af te bakenen.
- Statistische publicatie:
- Kleine en heterogene populatie in acht nemen en relateer de uitkomsten aan de andere statistische publicaties die voor Caribisch Nederland worden gemaakt.
- Kies voor tabellering uitsplitsingen met de belangrijkste informatie voor publieke gezondheidsdoeleinden na overleg met de beleidsmakers, onderzoekers en andere gebruikers van de data om zo goed mogelijk bij hun informatiebehoefte aan te sluiten. Onderzoek mogelijk koppelingen met medische informatie uit andere registraties om een completer beeld te verkrijgen.
Toelichting Tabel 8: Doodsoorzaken en bijbehorende ICD-10 codes
Nieuwvormingen
Met sterfte aan nieuwvormingen wordt bedoeld het totale aantal overlijdensgevallen aan kwaadaardige nieuwvormingen (kanker) en niet kwaadaardige nieuwvormingen geclassificeerd in C00-C97 en D00-D48 codes van de ICD-10. Het aandeel van kwaadaardige nieuwvormingen (kanker) omvat ongeveer 96 procent.
Ziekten van hart- en vaatstelsel
Met sterfte aan ziekten van hart- en vaatstelsel wordt bedoeld alle overlijdensgevallen geclassificeerd in I00-I99 codes van de ICD-10.
Psychische stoornissen en ziekten van zenuwstelsel en zintuigen
Met sterfte aan psychische stoornissen en ziekten van het zenuwstelsel wordt bedoeld alle overlijdensgevallen geclassificeerd in F00-F99 en G00-H95 codes van de ICD-10.
Psychische stoornissen en gedragsstoornissen. ICD-10 codes: F00-F99
w.o.
F00 Dementie bij ziekte van Alzheimer
F01 Vasculaire dementie
F02 Dementie bij elders geclassificeerde ziekten
F02 Dementie bij overige elders geclassificeerde ziekten
F03 Niet gespecificeerde dementie
Ziekten van zenuwstelsel. ICD-10 codes: G00-G99
w.o.
G20 Ziekte van Parkinson
G30 Ziekte van Alzheimer
Ziekten van de ademhalingsorganen
Met sterfte aan ziekten van de ademhalingsorganen wordt bedoeld alle overlijdensgevallen geclassificeerd in J00-J99 codes van de ICD-10.
COVID-19
Met de doodsoorzaak wordt de onderliggende doodsoorzaak bedoeld. De onderliggende doodsoorzaak is (a) de ziekte of aandoening waarmee de reeks van gebeurtenissen die uiteindelijk het overlijden van de persoon veroorzaakte een aanvang nam of (b) de omstandigheden van het ongeval of geweld dat het letsel waardoor de persoon overleed veroorzaakte. De doodsoorzaak wordt gecodeerd volgens internationaal afgesproken ICD-10 codes van de Wereldgezondheidsorganisatie (WHO).
Voor COVID-19 (Corona Virus ziekte 2019) zijn nieuwe codes uitgegeven.
De classificatie en ICD-10 codering COVID-19 volgens richtlijnen WHO:
- U07.1 COVID-19, virus geïdentificeerd
- U07.2 COVID-19, virus niet geïdentificeerd
- Klinisch-epidemiologisch gediagnosticeerde COVID-19
- Waarschijnlijk COVID-19
- Vermoedelijke COVID-19
- Klinisch-epidemiologisch gediagnosticeerde COVID-19
Hoewel beide categorieën, U07.1 (COVID-19, virus geïdentificeerd) en U07.2 (COVID-19, virus niet geïdentificeerd), geschikt zijn voor doodsoorzaakcodering, wordt erkend dat in veel landen de laboratoriumbevestiging van COVID-19 níét wordt vermeld op het doodsoorzaakformulier. Bij gebrek aan dit detail wordt aanbevolen, alleen voor gebruik in de doodsoorzaakregistratie, om COVID-19 voorlopig te coderen als U07.1, tenzij dit wordt vermeld als "waarschijnlijk" of "vermoedelijk". In dat geval wordt de doodsoorzaak gecodeerd als U07.2
Definitie overlijden aan COVID-19
Om COVID-19-sterfte goed in kaart te brengen wordt voor statistische doeleinden een overlijden als gevolg van COVID-19 gedefinieerd als een overlijden aan een klinisch compatibele ziekte, in het geval van bevestigde of vermoedelijke/waarschijnlijke COVID-19, tenzij er een duidelijke andere doodsoorzaak is die niet gerelateerd kan zijn aan COVID-19 (bv. lichamelijk letsel door een ongeluk). Er mag geen periode van volledig herstel van COVID-19 zijn tussen ziekte en overlijden.
NND –Niet-natuurlijke doodsoorzaken (ook uitwendige doodsoorzaken)
Hiertoe behoren de overlijdens ten gevolge van ongevallen, zelfdoding, moord en doodslag, gebeurtenissen waarvan opzet onbekend is en overige uitwendige oorzaken van sterfte, codes V01-Y89 van de ICD-10.
Overige doodsoorzaken
Zijn alle doodsoorzaken met uitzondering van nieuwvormingen, ziekten van hart- en vaatstelsel, ziekten van ademhalingsstelsel, psychische stoornissen en ziekten van het zenuwstelsel en zintuigen, COVID-19 en niet-natuurlijke doodsoorzaken. Volgens classificatielijst ICD-10: codes A00-Y89 met uitzondering van codes C00-D48,F00-F99, G00-H95, I00-I99, J00-J99, U071-U072 en V01-Y89.