Correlatie gebruiken in SEM

Wat is correlatie? Correlatie betekent in feite samenhang. Het gaat hierbij om de samenhang tussen reeksen getallen of de waarden van toevalsvariabelen. Je kunt denken aan de samenhang tussen leeftijd en lengte of aan de samenhang tussen zon en de verkoop van ijsjes.

Voorbeeld betaalde advertentie Apple

De mate van correlatie tussen twee variabelen wordt uitgedrukt in de correlatiecoëfficiënt. De waarde daarvan kan variëren tussen –1 en +1. Daarbij betekent 0: geen lineaire samenhang, +1: een perfecte positieve lineaire samenhang (de variabelen bewegen naast elkaar) en –1: een perfecte negatieve lineaire samenhang (de variabelen bewegen dan in tegengestelde richting). Hoe verder de correlatiecoëfficiënt verwijderd is van 0, hoe sterker de correlatie.


In de onderstaande tabel is te zien hoe je de correlatiecoëfficiënt kunt interpreteren:

Gevaren Correlatie


Correlatie betekent dat er een verband is tussen 2 factoren, getallen of reeksen. Dat hoeft niet te betekenen dat er een causaal verband is. De ene gebeurtenis hoeft dus niet een direct gevolg te zijn van de andere gebeurtenis. 

Enkele voorbeelden:

  1. De correlatie tussen regen en het uitklappen van paraplu’s is groot. Het vertelt echter niet of het uitklappen van paraplu’s regen veroorzaakt of andersom. En verder kan regen wel tot gevolg hebben dat je meer paraplu’s ziet, maar de oorzaak is dat mensen niet nat willen worden. 
  2. Een heel mooi voorbeeld dat veel gebruikt wordt is de (positieve) correlatie tussen de verkoop van ijsjes en het aantal verdrinkingen. Wanneer er meer ijsjes worden verkocht stijgt ook het aantal verdrinkingen.
    Hier is natuurlijk geen causaal verband, maar is sprake van een derde variabele: een confounding variabele. Dat is een variabele buiten het bestaande model die correleert met de beide andere variabelen. In dit geval is het de (hoge) temperatuur. 

Correlatie vertelt ons dus niet of er een oorzaak- en gevolgrelatie tussen twee variabelen bestaat.



De correlatiecoëfficiënt wordt gemeten in Pearson’s r. Deze coëfficiënt is erg gevoelig voor extreme waarden. Daar moet men wel rekening mee houden. 

Bij een correlatieberekening zijn de volgende punten belangrijk:


  • Zijn er genoeg data? Bij te weinig data is het toeval te groot en kunnen de data verkeerd geïnterpreteerd worden. 
  • Is de correlatiecoëfficiënt groot genoeg?

Voorbeelden

Er zijn diverse voorbeelden in (online) marketing.


Houtgroothandel: wat is de correlatie tussen de weerdata (zonuren, uren neerslag en temperatuur) en de omzet?

Deze kan je per maand berekenen en wanneer de correlatie groot genoeg is kan daarop worden ingespeeld door de biedingen bij campagnes in b.v. een Google Ads account aan te passen. Wanneer de correlatie tussen de omzet en de hoeveelheid zon in de maand maart b.v. groot genoeg zou zijn (correlatiecoëfficiënt > 0.5) kan je de biedstrategie aanpassen wanneer er zonnige dagen voorspeld zijn. Ook bij een automatische biedstrategie is dit verstandig want Google heeft dit nog niet in zijn algoritme verwerkt. De ROAS zou je dan b.v. tijdelijk wat lager kunnen zetten. 


Een ander mooi voorbeeld is de reiswereld. Wanneer boeken mensen hun vakantie? Het is bekend dat wanneer het slecht weer is in Nederland er meer mensen naar het buitenland op vakantie gaan. Maar wanneer beslissen deze mensen dan wanneer het weer slecht genoeg is om te gaan boeken? Is dat na een week slecht weer of na 2 weken? Hangt het van de temperatuur af? Er zijn diverse berekeningen mogelijk om te kijken wanneer de correlatie het grootst is. 


Verder zijn er op het gebied van SEM ook veel toepassingen te verzinnen:

  • Hoe groot is de correlatie tussen het aantal verwijzende domeinen en de positie in Google?
  • Hoe groot is de correlatie tussen het aantal likes op een social media post en de positie in Google van een bepaalde url?
  • Hoe groot is de correlatie tussen de snelheid van de website en de top 10 bij          een bepaalde zoekopdracht in Google?
  • Hoe groot is de correlatie tussen het aantal woorden op een pagina en de positie in Google? 
  • Is er een correlatie tussen het bouncepercentage en de conversieratio van een pagina?
  • Correlatie marketingbudget en de omzet.



Er zijn in het verleden diverse correlatiestudies gedaan over de rankingfactoren in Google. Deze studies werden vaak verkeerd geïnterpreteerd (correlatie is geen causatie) en daardoor werden er diverse verkeerde beslissingen genomen. Enkele weken na deze studies werden er dan ook meerdere artikelen geschreven met daarin de nodige kritiek of waarschuwingen over deze onderzoeken.


Wil je meer weten over statistiek en correlatie in de online marketing? Neem dan contact met ons op via: info@semwerkt.nl of bel: 0229-763561.