Koppelen

Koppelen van bestanden is een operatie die regelmatig wordt toegepast binnen het statistisch proces. De eenvoudigste manier van koppelen is wat in databases gebeurt als twee bestanden (of tabellen) op een databasesleutel worden gematched. Dan worden records uit de beide bestanden (tabellen) bij elkaar gebracht als de databasesleutel exact gelijk is. Bij ingewikkeldere manieren van koppelen worden ook andere variabelen, zogenaamde secundaire sleutels, gebruikt om te koppelen, zoals namen en tijdvariabelen. Wat deze uitgebreidere vorm van koppelen lastig maakt is dat er fouten in de scores van de secundaire sleutels kunnen zitten, of dat de variabelen niet precies dezelfde betekenis hebben. Het stuk probeert een systematisch overzicht te geven van diverse koppelproblemen, gekenmerkt door de complicaties waar men rekening mee heeft te houden en de methoden die men kan gebruiken om ze te behandelen.