Wat is een canonical URL?

Rel="canonical", of canonical URL, is een HTML element dat duplicate content voorkomt. De canonical URL geeft een signaal aan zoekmachines welke van de identieke of sterk op elkaar lijkende pagina’s zij moeten indexeren.

Met canonicalization wordt het proces bedoelt waarin één versie van een pagina wordt verkozen boven andere versies.

Synoniemen voor canonical URL

De canonical URL wordt ook wel canonical tag, rel canonical (of rel=”canonical”), canonieke URL of canonical link genoemd. Voor het gemak noemen wij het de canonical URL als we verwijzen naar het canonical link element in dit artikel.

Wat je kunt verwachten van dit artikel

Dit artikel legt uit wanneer en hoe je het beste gebruik kunt maken van de canonical URL. Het doel hiervan is het optimaliseren van de gebruikerservaring voor bezoekers en het minimaliseren van indexatieproblemen voor zoekmachines.

Waarom heb je een canonical URL nodig?

Met de canonical URL kun je zowel interne als externe duplicate content voorkomen. Interne duplicate content verwijst naar dubbele inhoud binnen je eigen website. Met externe duplicate content wordt inhoud op een ander domein bedoeld dat exact of in grote mate hetzelfde is.

De canonical URL geeft bij zoekmachines als Google, Bing en Yahoo aan welke pagina’s zij moeten tonen en verbergen in de zoekmachine resultaten pagina’s. Alhoewel zoekmachines er voor kunnen kiezen dit te negeren, geeft het jou als website eigenaar meer controle over de online aanwezigheid van jouw website.

Hoe ziet een canonical URL eruit?

Bezoekers van jouw website zien niks van de canonical URL, deze wordt namelijk gedefinieerd in de broncode van een webpagina of in de HTTP header.

Broncode

Neem de canonical URL op in de <HEAD>-sectie van de broncode. Onze homepagina bevat de volgende canonical URL:

<HTML>
<HEAD>
<link rel=”canonical” href=”https://www.contentking.nl/” />
</HEAD>

HTTP Header

De canonical URL wordt vaak gedefinieerd in de HTTP header als er sprake is van dubbele content voor een ander content type dan een pagina. Denk hierbij bijvoorbeeld aan een PDF document. In de HTTP header ziet dit er als volgt uit:

HTTP/1.1 200 OK
Server: nginx
Date: Thu, 28 Apr 2016 11:54:25 GMT
Content-Type: application/pdf
Content-Length: 23629
Last-Modified: Fri, 29 Apr 2016 17:47:17 GMT
Link: <http://www.voorbeeld.nl/downloads/whitepaper.pdf>;
rel=”canonical”

Indien bepaalde inhoud zowel beschikbaar is als een normale pagina (HTML document) en als een PDF document, dan is het gewenst om de canonical URL te definiëren in de HTTP header van het PDF document. Een voorbeeld van een situatie waarin het gebruik van de HTTP header gewenst is, is als bepaalde inhoud beschikbaar is als zowel een normaal pagina (HTML document) en als een PDF document.

Let op: momenteel ondersteunt alleen Google het definiëren van de canonical URL in de HTTP header. Voor afbeeldingen ondersteunt Google geen canonical URL die gedefinieerd is middels de HTTP header.

Wanneer heb je de canonical URL nodig?

Er is geen denkbaar scenario waarin het een slecht idee is om een canonical URL te gebruiken. Google, Bing en Yahoo hechten veel waarde aan de canonical URL om te kunnen bepalen welke pagina’s ze wel of niet tonen in de zoekmachine resultaten pagina’s. De canonical URL kan zowel naar zichzelf verwijzen als naar een andere pagina.

Zelfverwijzend canonical URL

Als er slechts één versie van een pagina bestaat, zorg er dan voor dat de canonical URL naar zichzelf verwijst. Dit noemen we een zelfverwijzend canonical URL.

Dit vertelt zoekmachines namelijk: “Ik ben de enige versie van deze pagina en daarom moet ik geïndexeerd worden.”

Canonical URL die verwijst naar een andere pagina

Het kan voorkomen dat er meerdere versies van een pagina zijn, of dat de inhoud op verschillende pagina’s sterk op elkaar lijkt. Zorg er in dit geval voor dat de canonical URL verwijst naar de pagina die geïndexeerd moet worden door zoekmachines.

Veelvoorkomende situaties waarin de canonical URL duplicate content problemen kan voorkomen zijn:

  • Wanneer er gebruik wordt gemaakt van query parameters in de URL.
  • Wanneer pagina’s sterk op elkaar lijken.
  • Wanneer er opzettelijk meerdere versies van een pagina’s gecreëerd zijn.

Query parameters in de URL

Het kan voorkomen dat URL’s query parameters bevatten. Query parameters worden gebruikt in URL’s om een specifiek soort content op de pagina op te vragen.

Bijvoorbeeld:

www.voorbeeld.nl/schoenen/nike?lang=nl&id=101

  • De variabele lang=nl geeft aan dat de taal op de opgevraagde pagina Nederlands is.
  • De variabele id=101 geeft aan dat pagina 101 opgevraagd moet worden.
  • Het & teken tussen de twee variabelen in geeft aan dat het gaat om de Nederlandse versie van pagina 101.

Alhoewel query parameters handig zijn, zijn URL’s die query parameters bevatten moeilijk te lezen en zorgen ze gemakkelijk voor duplicate content problemen. De URL www.voorbeeld.nl/schoenen/nike?id=101&lang=nl vraag exact dezelfde pagina op als www.voorbeeld.nl/schoenen/nike?lang=nl&id=101, maar beide pagina’s hebben een andere URL. Dit soort duplicate content kan gemakkelijk opgelost worden met een canonical URL.

Sterk op elkaar lijkende pagina’s

Als pagina’s slechts enigszins van elkaar verschillen, noemen we dit ook wel ‘near duplicate pages’ of ‘near duplicates’. Een goed voorbeeld hiervan is een e-commerce website die schoenen verkoopt. Stel je voor dat de Nike Air Max in maat 38 op deze website verkrijgbaar is in zowel het rood, blauw en zwart. Het kiezen van een andere kleur verandert de URL, terwijl 99% van de inhoud van de pagina hetzelfde blijft.

  • Overzicht Nike Air Max maat 38: www.voorbeeld.nl/schoenen/nike/heren-38/
  • Overzicht Nike Air Max maat 38 in het rood: www.voorbeeld.nl/schoenen/nike/heren-38-rood/
  • Overzicht Nike Air Max maat 38 in het blauw: www.voorbeeld.nl/schoenen/nike/heren-38-blauw/
  • Overzicht Nike Air Max maat 38 in het zwart: www.voorbeeld.nl/schoenen/nike/heren-38-zwart/

Aangezien de inhoud op deze vier pagina’s vergelijkbaar is, is het logisch om een canonical URL op te nemen van www.voorbeeld.nl/schoenen/nike/heren-38-rood/, www.voorbeeld.nl/schoenen/nike/heren-38-blauw/ en  www.voorbeeld.nl/schoenen/nike/heren-38-zwart/ naar www.voorbeeld.nl/schoenen/nike/heren-38/.

Meerdere versies van één pagina

Er kunnen meerdere redenen zijn voor het opzettelijk aanmaken van meerdere versies van een pagina. Twee voorbeelden:

  1. Gepersonaliseerde landingspagina’s voor campagnes
  2. Het testen van verschillende versies van een pagina (met bijna dezelfde inhoud) tijdens een conversie optimalisatie traject.

Indien er meerdere versies van een pagina zijn, zorg er dan voor dat de canonical URL verwijst naar de URL die je geïndexeerd wilt hebben. Als een canonical URL verwijst naar een andere URL, vertelt dit zoekmachines:

“Er zijn meerdere versies van mijn pagina die identiek zijn of sterk overeenkomen. Indexeer alleen de pagina waar ik naar verwijs om zo de index netjes en schoon te houden.”

Aparte desktop- en mobiele pagina’s

Maak gebruik van de canonical URL en de alternate URL als jouw website aparte desktop en mobiele versies bevat om zoekmachines te informeren over de relatie tussen de pagina’s. Op dit moment ondersteunt alleen Google deze specifieke implementatie.

Desktop

Neem op de desktop versie van de pagina de canonical tag en de alternate URL als volgt op in de <HEAD>-sectie:

<HTML>
<HEAD>
<link rel=”canonical” href=”https://www.voorbeeld.nl/” />
<link rel=”alternate” href=”https://m.voorbeeld.nl/” />
</HEAD>

Mobiel

Neem op de mobiele versie van de pagina de canonical tag als volgt op in de <HEAD>-sectie:

<HTML>
<HEAD>
<link rel=”canonical” href=”https://www.voorbeeld.nl/” />
</HEAD>

Op deze manier tonen zoekmachines de mobiele versie aan mobiele gebruikers en de desktop versie aan desktop gebruikers.

Cross-domain canonical tag

De canonical tag kan ook gebruikt worden om duplicate content over verschillende websites op te lossen. Als inhoud wordt gepubliceerd op verschillende pagina’s op verschillende domeinen kan de cross-domein canonical tag gebruikt worden om bij zoekmachines aan te geven welke versie geïndexeerd moet worden.

Onnodige pagina’s consolideren met redirects

Als het onnodig is dat meerdere versies van een pagina naast elkaar bestaan, is het verstandiger om de onnodige pagina’s naar de gewenste versie te redirecten. Een aantal voorbeelden van situaties waarin een redirect gepaster is:

  • De pagina is bereikbaar via zowel de HTTP en HTTPS protocollen.
  • De pagina is bereikbaar via meerdere domeinen (www.voorbeeld1.nl, www.voorbeeld2.nl, www.voorbeeld3.nl) of subdomeinen (www.voorbeeld.nl, www2.voorbeeld.nl, www3.voorbeeld.nl), en dit dient geen doel.

Houd er rekening mee dat in bovenstaande gevallen het aanbevolen is om alsnog een canonical URL te gebruiken, naast de redirects. Als de redirects niet meer werken, voorkomen de canonical URL’s nog steeds duplicate content problemen.

Wat zijn best practices voor canonical URL’s?

De canonical URL is een krachtige tool in de gereedschapskist van een webmaster. Juist om die reden is het essentieel om je aan de best practices te houden voor het gebruik van de canonical URL die hieronder geschetst worden:

  • Gebruik absolute URLs – er mag geen twijfel bestaan over welke pagina de zoekmachine moet indexeren. Gebruik daarom altijd de volledige URL, inclusief protocol (HTTP of HTTPS), subdomein en domein.
  • Gebruik slechts één canonical URL per pagina – er mag maar één canonical URL aanwezig zijn per pagina.
  • Plaatsing in de <HEAD>-sectie – de canonical URL mag enkel opgenomen worden in de <HEAD>-sectie of in de HTTP header.
  • Verwijs naar een indexeerbare pagina – de canonical URL moet altijd verwijzen naar een indexeerbare pagina.
  • Neem alleen de voorkeursversie van een pagina op – Neem alleen de geprefereerde versie van een pagina op in de XML sitemap.

Gebruik absolute URLs

Wij adviseren om enkel gebruik te maken van absolute URL als canonical URL’s, zoals bijvoorbeeld:

<link rel=”canonical” href=”https://www.voorbeeld.nl/diensten/reparaties/”>

Met deze URL als canonical URL is er geen twijfel over de exacte locatie van de URL.

Vergelijk de canonical URL hierboven nu eens met de onduidelijke versie hieronder:

<link rel=”canonical” href=”reparaties/”>

Sommige webservers zijn standaard verkeerd geconfigureerd is, waardoor elke pagina op jouw website toegankelijk is via alle domeinen en subdomeinen. Dit zorgt voor een enorme hoeveelheid duplicate content, die je natuurlijk wilt vermijden.

Het gebruiken van absolute URL’s als canonical URL’s voorkomt dit soort duplicate content problemen.

Gebruik slechts één canonical URL per pagina

Er mag maar één canonical tag per pagina aanwezig zijn. Als er meerdere canonical URL’s aanwezig zijn, kunnen zoekmachines in de war raken. Google geeft aan dat zij de canonical URL volledig negeren als ze meerdere canonical URL’s aantreffen op één pagina. Alhoewel we er niet zeker van zijn hoe Bing en Yahoo omgaan met meerdere canonical URL’s op één pagina, adviseren ze wel om slechts één canonical URL per pagina te gebruiken.

Plaatsing in de <HEAD>-sectie

De canonical URL mag enkel opgenomen zijn in de <HEAD>-sectie van een pagina. Als de canonical URL niet geplaatst is in de <HEAD>-sectie, kunnen zoekmachines deze niet vinden en verwerken. Dit kan vervolgens weer resulteren in duplicate content problemen.

Verwijs naar een indexeerbare pagina

De canonical URL moet altijd verwijzen naar een indexeerbare pagina. Zoekmachines kunnen in de war raken als de canonical URL verwijst naar een pagina die vervolgens 301 redirect of al gekanonikaliseerd is.

Neem alleen de voorkeursversie van een pagina op in de XML sitemap

Alle pagina’s in de XML sitemap van jouw website moeten indexeerbaar zijn. Daarom is het belangrijk dat als er meerdere versies van een pagina zijn, je alleen de geprefereerde versie opneemt in de XML sitemap.

Wat zijn de beperkingen van de canonical URL?

Alhoewel de canonical tag een erg handige tool in de gereedschapskist van een webmaster is, heeft het ook zijn tekortkomingen.

Voorbeeld: pagina A heeft een aantal extreem sterke externe links. Pagina A verwijst met een canonical URL naar pagina B. Zoekmachines zullen waarschijnlijk pagina B indexeren en pagina A uit de index en de zoekmachine resultaten pagina’s weglaten.

Iedere link geeft wat autoriteit door, dit noemen we link autoriteit. De link autoriteit die doorgegeven wordt aan pagina A middels de extreem sterke externe links wordt slechts gedeeltelijk doorgegeven aan pagina B. We zeggen hier slechts gedeeltelijk omdat dit een grijs gebied is waar zoekmachines niet erg duidelijk over zijn. Er is geen bewijs dat een canonical URL alle link autoriteit doorgeeft. Daarnaast is de canonical URL geïntroduceerd om bij zoekmachines aan te kunnen geven welke pagina’s ze moeten indexeren en welke niet. Daarom is ons standpunt over dit onderwerp: een canonical URL geeft niet alle link autoriteit door.

Matt Cutts, voormalige hoofd van het web spam team bij Google, zei hierover: “Er zitten eigenlijk niet zoveel verschillen tussen een 301 redirect en een canonical URL.”.

Als je zo veel mogelijk link autoriteit wilt doorgeven, adviseren wij je om een 301 redirect te gebruiken.

Canonical URLs voorkomen geen crawl optimalisatie problemen

Canonical URL’s zijn in het leven geroepen om duplicate content problemen op te lossen. Een canonical tag informeert zoekmachines over welke pagina’s ze moeten indexeren, maar niet over welke pagina’s ze moeten crawlen. Het is belangrijk hier onderscheid in te maken.

We spreken over crawl optimalisatie problemen wanneer zoekmachines hun tijd niet besteden aan het crawlen van de belangrijkste pagina’s binnen een website. Hiervoor kunnen verschillende redenen zijn. Zoekmachine crawlers kunnen vast komen te zitten in oneindige ‘redirect loops’, veel tijd besteden aan het crawlen van pagina’s die je niet geïndexeerd wilt hebben of tegen doodlopende paden in jouw website aanlopen (pagina’s zonder links naar andere pagina’s). Dit is zonde, omdat zoekmachines een zogenaamd ‘crawl budget’ (de beschikbare tijd voor het crawlen van een website) hebben voor iedere website.

Veelgestelde vragen over de canonical URL

  1. Geven canonical URLs link autoriteit door?
  2. Kan ik zoekmachines dwingen mijn canonical URL te gebruiken?
  3. Is een canonical URL beter dan een 301 redirect?
  4. Kan ik mijn website schaden met canonical URL’s?
  5. Ondersteunen alle zoekmachines de canonical tag?
  6. Hoe gaan zoekmachines om met meerdere canonical URL’s op één pagina?
  7. Kan een canonical URL voorkomen dat een pagina wordt gecrawld?
  8. Moet ik de canonical tag gebruiken voor gepagineerde resultaten?

Wij vermoeden dat een deel van de link autoriteit wordt doorgegeven bij het kanonikaliseren van een URL.

Zoals beschreven in de sectie “Slechts gedeeltelijke consolidatie van link autoriteit”, kunnen we niet met zekerheid zeggen dat een canonical URL link autoriteit doorgeeft. Wat we wel zeker weten is dat een canonical URL niet bedoeld is om link autoriteit door te geven, hier zijn 301 redirects voor.

2. Kan ik zoekmachines dwingen mijn canonical URL te gebruiken?

Nee, de canonical URL is eerder een advies dan een richtlijn voor zoekmachines.

3. Is een canonical URL beter dan een 301 redirect?

De canonical URL en 301 redirect zijn beide in het leven geroepen voor compleet verschillende doeleinden.

Een canonical URL wordt gebruikt als meerdere versies van een pagina toegankelijk moeten zijn voor bezoekers maar slechts één van de versies geïndexeerd moet worden door zoekmachines.

Een 301 redirect daarentegen stuurt zowel bezoekers als zoekmachines door van URL naar URL. De URL die redirect is niet toegankelijk voor bezoekers en zoekmachines.

4. Kan ik mijn website schaden met canonical URL’s?

Canonical URL’s kunnen enorme indexatie problemen veroorzaken als ze niet op de juiste manier gebruikt worden.

Stel je voor dat, op de één of andere manier, alle pagina’s op jouw website een canonical tag hebben naar de homepagina. Omdat de canonical URL een sterk signaal is voor zoekmachines is er een grote kans dat de gekanonikaliseerde pagina’s niet geïndexeerd zullen worden.

Alhoewel je voorzichtig moet zijn met canonical URL’s, adviseren wij de canonical tag te gebruiken om bij zoekmachines aan te geven welke pagina’s je geïndexeerd wilt hebben, en welke niet.

5. Ondersteunen alle zoekmachines de canonical tag?

We weten zeker dat Google, Bing en Yahoo de canonical tag ondersteunen.

Yandex and Baidu lijken de canonical URL eveneens te ondersteunen. Het is onduidelijk of DuckDuckGo de canonical tag ook ondersteunt.

6. Hoe gaan zoekmachines om met meerdere canonical URL’s op één pagina?

Google heeft aangegeven dat zij de canonical URL volledig zullen negeren als ze meerdere canonical URL’s aantreffen op één pagina.

Alhoewel we er niet zeker van zijn hoe andere zoekmachines omgaan met meerdere canonical URL’s op één pagina, adviseren we om slechts één canonical URL per pagina te gebruiken.

7. Kan een canonical URL voorkomen dat een pagina wordt gecrawld?

Nee, zoekmachines zullen pagina’s die een canonical URL die verwijst naar een andere pagina nog steeds crawlen. Een canonical URL is enkel een sterk signaal aan zoekmachines met betrekking tot de gewenste pagina die getoond moet worden in de zoekmachine resultaten pagina’s. Zie ook de sectie “Canonical URL’s voorkomen geen crawl optimalisatie problemen

8. Moet ik de canonical tag gebruiken voor gepagineerde resultaten?

Over het algemeen is het niet aanbevolen om de canonical URL te gebruiken voor gepagineerde content, omdat gepagineerde pagina’s vaak niet dezelfde inhoud tonen. In plaats daarvan raden we aan gebruik te maken van de rel="next" and rel="prev" link elementen. Dit is een geschiktere manier om aan zoekmachines uit te leggen dat de gepagineerde content bestaat uit een reeks pagina’s die een logische volgorde hebben.

Je kunt een canonical URL enkel gebruiken voor gepagineerde content als jouw website een ‘Toon Alles” pagina heeft die snel laadt. In dit geval verwijs je naar de Toon Alles pagina met de canonical URL in alle andere gepagineerde pagina’s. Zie ook Google’s documentatie over gepagineerde content voor meer informatie.

Waarom wachten? Probeer het direct.

Eindelijk doorhebben wat er werkelijk gebeurt op jouw website.
Gelieve een geldige domeinnaam (www.voorbeeld.nl) op te geven.