Tijdreeksanalyse van droogte-impact op de economie

5. Technische toelichting

Om te bepalen welke droogtetijdreeks een lineair verband heeft met welke economische reeks, proberen we de economische jaar-op-jaar groeireeksen te verklaren vanuit (1) de jaar-op-jaar groei in de vorige periode (een AR(1) term), (2) de sentimentvariabelen zoals hierboven beschreven (paragraaf 2.3), en (3) de verschillende droogtevariabelen. Dit laatste doen we door elke te onderzoeken droogtevariabele apart toe te voegen aan het (univariate) model, gecorrigeerd voor de seizoens- en lange-termijntrend. Voor een droogtevariabele (i) ziet een model er dan zo uit:

Jaar-op-jaar-groei economische reeks(t) =

 Jaar-op-jaar-groei economische reeks(t - 1) +

 Producentenvertrouwen(t) + Consumentenvertrouwen(t) + Consumentenprijsindex(t) +

 (Droogtevariabele(i, t) - seizoenstrend (i, t) – lange-termijntrend (i, t)) + .

De variabele ”Droogtevariabele(i) - seizoenstrend (i) – lange-termijntrend (i)” is een tijdreeks die, als in Parnaudeau & Bertrand (2018), is afgeleid van de droogtevariabele, waarbij de reeks is ontdaan is van zijn seizoens- en lange-termijntrends. Met behulp van de kleinste-kwadratenschatter kunnen de schattingen  t/m  voor  t/m  verkregen worden, waardoor de corresponderende schattingen voor de jaar-op-jaar-groei economische reeks zoveel mogelijk lijken op de echte waarden.

Als een droogtevariabele (i) een deel van het patroon in de economische tijdreeks lineair kan verklaren, dan zal dit zich vertalen in een waarde van . Omdat in de praktijk  altijd geldt, geldt er ook een tweede eis, namelijk dat statistisch significant afwijkt van 0. Of een afwijking statistisch significant is hangt af van de kans die we hanteren bij het bepalen of een schatting statistisch significant is, die ook wel de p-waarde wordt genoemd. Vaak wordt hierbij uitgegaan van een kans van 5 procent of 1 procent, maar hier kan ook voor een ander percentage gekozen worden. In deze analyse kiezen we voor het kleine percentage 1 procent, waarmee de kans op het vinden van een schijnrelatie heel klein is, maar waarbij het ook kan gebeuren dat bepaalde relaties over het hoofd worden gezien omdat ze niet duidelijk genoeg, ofwel niet statistisch significant genoeg, aanwezig waren in de data.

Nadat voor elke onderzochte droogtevariabele is bepaald of hij in het bovenstaande effect een statistisch significant verband laat zien, gaan we in stap 2 van de analyse kijken welke droogtevariabele de sterkste relatie laat zien of dat er misschien meerdere droogtereeksen een rol spelen. Dit pakken we als volgt aan. Voor elke economische reeks beginnen we nu met een uitgebreider (multivariaat) model, waarin voor elke economische reeks de droogtevariabelen worden meegenomen die in de eerste analyse statistisch significant waren. Ter illustratie geven we hieronder het model dat we krijgen als de droogtevariabelen (1), (2) en (3) statistisch significant waren. Dit model ziet er zo uit:

Jaar-op-jaar-groei economische reeks(t) =

 Jaar-op-jaar-groei economische reeks(t - 1) +

 Producentenvertrouwen(t) + Consumentenvertrouwen(t) + Consumentenprijsindex(t) +

 (Droogtevariabele(1, t) - seizoenstrend (1, t) – lange-termijntrend (1, t)) +

 (Droogtevariabele(2, t) - seizoenstrend (2, t) – lange-termijntrend (2, t)) +

 (Droogtevariabele(3, t) - seizoenstrend (3, t) – lange-termijntrend (3, t)) + .

Met behulp van de kleinste-kwadratenschatter krijgen we voor dit model schattingen  t/m  voor  t/m . Omdat droogtevariabelen (ook) met elkaar correleren, is het niet zeker dat de schattingen  t/m  die corresponderen met de droogtevariabelen, nog steeds statistisch significant afwijken van 0, ondanks dat dit wel zo was toen de corresponderende droogtevariabelen alleen in een model zaten. Het doel is nu een model over te houden waarin alle -schattingen die corresponderen met een droogtevariabele statistisch significant zijn. Dit wordt gedaan door een aanpak die ook wel bekend staat als de ‘general-to-specific approach’. Dit houdt in dat telkens de minst significante droogtevariabele met tevens een toevalskans groter dan 5 procent, ofwel de droogtevariabele die correspondeert met de  met de hoogste p-waarde (> 0,05), uit het model te halen en daarna het model opnieuw te schatten. Dit gaat door totdat alle p-waarden van de (één of meer) overblijvende droogtevariabelen kleiner zijn dan 0,05.