Duplicate content

Inleiding

Een van de irritante dingen waar je mee te maken gaat hebben als je zelf een website opzet met een CMS is duplicate content. In dit artikel ga ik het hebben over duplicate content in wordpress.

Wat is duplicate content?

Duplicate content zijn is content die ook al op een andere pagina van je website te vinden is. Vaak onstaat deze duplicate content zonder dat je het door hebt.

Nadelen

Het nadeel van duplicate content is dat google bepaalde pagina's niet gaat weergeven in de zoekresultaten omdat ze volgens google te hard lijken op andere pagina's die al geîndexeerd zijn. Het probleem is dat het kan voorvallen dat pagina's die eigenlijk niet zo gunstig zijn voor je weergegeven worden en dat je belangrijkste pagina's waar je geld mee verdient als affiliate of adsense niet te vinden zijn in de normale zoekresultaten.

Duplicate content ontdekken

Om duplicate content te ontdekken moet je de volgende zoekparameters gebruiken site:http://www.site.nl. Het voorgaande command geeft alle resultaten van je website weer die in de index van google zijn opgenomen. Ga naar de laatste pagina waar je de volgende tekst vindt,Om de meest relevante resultaten te tonen, hebben we er een aantal weggelaten die heel sterk lijken op de reeds weergegeven x. Indien gewenst kunt u de zoekbewerking herhalen met de weggelaten resultaten.Als je op die link klikt worden alle resultaten weergegeven, ook duplicate content.

Duplicate content vermijden in wordpress

er zijn een aantal bronnen van duplicate content, namelijk


  • Artikels die volledig worden weergegeven op de index pagina
  • Artikels die volledig worden weergegeven op de maand/jaar archief pagina
  • Artikels die volledig worden weergegeven op de categorie pagina
  • Volledige artikels op de pagina’s van je blog /page1, /page2, …
  • Meta description die exact hetzelfde is op elke pagina
  • Feeds die volledige artikels tonen
  • Gebruik en indexering van Tag pagina’s
  • Trackback URL

Om de deze te vermijden moet je:


  • Enkel een inleiding van artikels weergeven op de index en de categoriepagina
  • Geen gebruik maken van het maand/jaar archief
  • Je pagina's van je blog niet indexeerbaar maken door een robots.txt bestand
  • Unieke Meta description maken voor elke pagina
  • Feeds blokkeren via robots.txt
  • Tag pagina’s uitschakelen of blokkeren met robots.txt
  • Trackback URL blokkeren met robots.txt

Om enkel een inleiding weer te geven van artikels maak je gebruik van de more funcite van wordpress (). Alles onder de more functie wordt dan niet weergegeven op de index of de categorie pagina.Om de bovenstaande bronnen van duplicate content te vermijden met een robots.txt kopieer je de volgende regels en slaat ze op als robots.txt in de public_html map van je webhost.User-agent:


  • Disallow: /wp-
  • Disallow: /tag
  • Disallow: /feed
  • Disallow: /comments/feed
  • Disallow: /feed/$
  • Disallow: /*/feed/$
  • Disallow: /*/feed/rss/$
  • Disallow: /*/trackback/$
  • Disallow: /*/*/feed/$
  • Disallow: /*/*/feed/rss/$
  • Disallow: /*/*/trackback/$
  • Disallow: /*/*/*/feed/$
  • Disallow: /*/*/*/feed/rss/$
  • Disallow: /*/*/*/trackback/$