XML sitemaps, robots txts and html sitemaps
Wel eens gehoord van een sitemap? Of van robots txt?
Geen idee wat een robot txt of sitemaps zijn? Geen zorgen! Ik leg het je hier onder haarfijn uit!
Wat is een sitemap?
Daar zit je dan: je hebt allerlei diepzinnige en grensverleggende artikelen geschreven, maar de enigen die je blog bezoeken zijn je moeder en jijzelf. Om meer bezoekers te krijgen is het belangrijk dat Google je blog ook leest! Wanneer Google je blog kent, kom je namelijk in de zoekresultaten.
Een sitemap kan helpen om beter gevonden te worden door zoekmachines.
Eigenlijk zegt het woord het al: een sitemap is een kaart van je site on in ons geval ons blog! Op die kaart staat wat er allemaal te vinden is op ons blog. Een sitemap bevat links naar alle posts en pagina’s op een blog. Je kunt het zien als een inhoudsopgave van je blog. Met een sitemap laat je Google weten dat je blog bestaat.
XML sitemap? Wat is dát nou weer!
XML staat voor Extensible Markup Language.
Een XML sitemap is simpelweg een sitemap in de XML taal.
Je kunt ook een sitemap hebben in RSS, Atom 1.0 of text.
Een xml-sitemap is fijn en overzichtelijk voor de robots van zoekmachines. Hij zorgt ervoor dat zoekmachines ook de pagina’s vinden die ze anders misschien zouden missen!Eigenlijk is een sitemap het tegenovergestelde van een robots.txt: hij vertelt zoekmachines waar ze van harte welkom zijn. Terwijl een robots.txt juist aangeeft waar ze niet welkom zijn. SEOQuake zegt:
‘An XML sitemap lists URLs that can be crawled and may offer other information such as how often you update, when your last update occurred and importance.’
Let op: niet iedere blogger heeft een sitemap nodig!
Let op: in theorie ontdekt de Google bot jouw blog ook wel vanzelf. Als er tenminste links naar toe wijzen. In die zin is het dus niet persé nodig om een sitemap te maken. De bots van de zoekmachines kunnen dat ook zelf ook heel goed. Heb jij een kleine blog, en ben je al een tijdje bezig? Dan is het niet persé nodig om een sitemap te maken.
Wanneer is het wel slim om een sitemap te maken?
- Als je echt heel veel blogposts hebt
- Als je net bent begonnen met bloggen.
Maak een sitemap
Er zijn verschillende methodes om een sitemap te maken
- Gebruik Google’s instructies om een sitemap te maken (persoonlijk snapte ik daar weinig van…)
- Gebruik een sitemap generator zoals de XML Sitemaps Generator. Heb je een Blogger blog?*
- Als je een WordPress blog hebt, dan kun je met een plugin een sitemap maken. Ik heb de Google XML Sitemaps v3 for qTranslate gebruikt.
Dien je sitemap in bij Google
Als je sitemap klaar is, dien je hem in bij Google’s Webmaster Tools.
-
- Ga naar de Webmaster Tools Home page en kies het blog waarvoor je een sitemap wilt indienen. Heb je nog geen blog opgegeven bij Webmaster tools, klik dan op de rode knop ‘add a site’
- Onder ‘Optimization’ vind je een link ‘Sitemaps’. Klik daar op.
- Kies de sitemap die je wilt indienen en klik op ‘resubmit’
Hoe weet je of jouw blog een sitemap heeft?
Dat is eigenlijk supermakkelijk! Je typt gewoon je blog url in, in je browser en zet er vervolgens sitemap.xml achter. Hieronder zie je de sitemap van Bloggen en loggen:
En hieronder zie je een sitemap van één van mijn Blogspot blogs:
Zoals je ziet is zo’n sitemap niet erg interessant voor ons mensen. Zeker niet de Blogspot sitemap!
Je kunt ook SEOQuake gebruiken om te kijken of je blog een sitemap heeft.
Je ziet dat mijn Engelstalige blog Momfever een robots.txt heeft en een xml sitemap.
Robot txt: wat is het?
Een robot txt vertelt zoekmachines waar ze mogen komen. En ook waar ze níét mogen komen. Er zijn misschien posts waarvan je niet wilt dat die in de zoekmachine resultaten komen. bijvoorbeeld een blogpost die niet meer is dan een foto, of eentje die eigenlijk niet past bij je blog niche. Met behulp van een robot txt laat je dit weten aan zoekmachines.
Een robot txt is een simpel tekstbestand. Er staan meestal maar een paar regels in. Als zoekmachines op je blog komen, lezen ze eerst altijd eerst even je robot txt. En als daarin staat: ‘Ga niet naar post over mijn advertorials’ dan doen ze dat ook niet.
Maar dan in robot taal natuurlijk ; )
Hoe weet je of je een robots.txt hebt?
Je kunt SeoQuake gebruiken om te kijken of je blog een robots.txt heeft. Maar als je die liever niet wilt installeren kan het ook op een andere manier.
Type: domain.com/robots.txt in de adresbalk.
Vul bij domain.com je blog adres in. Voor Momfever wordt dit: momfever.com/robots.txt. Als je een robots.txt hebt dan krijg je een korte tekst te zien. Bijvoorbeeld:
User-agent: *
Disallow:
Heb je geen robots.txt? Dan gaan de robots van de zoekmachine ervan uit dat ze overal op je blog moeten komen.
Automatische robot txt van Blogger blogs
Blogger blogs hebben automatisch een robot txt. Die ziet er bijvoorbeeld zo uit:
User-agent: Mediapartners-Google
Disallow:User-agent: *
Disallow: /search
Disallow: /User-Agent: googlebot
Disallow: /search
Allow: /
WordPress blogs hebben trouwens ook een automatische robots.txt.
HTML sitemap: huh?
Om het nog wat ingewikkelder te maken, heb je ook nog html sitemaps. Eigenlijk horen die niet in het rijtje van de xml sitemap en de robots.txt thuis. Want de xml sitemap en de robots.txt zijn voor zoekmachines. Een html sitemap is vooral voor de bezoekers van je blog. Het heeft verder niks te maken met de vindbaarheid van je blog.
Ben je wel eens op een groot blog gekomen, en kon je niet vinden wat je zocht? Wat ik dan altijd doe is kijken of er een sitemap is. Zo’n sitemap is een overzicht op 1 pagina van alle onderwerpen, rubrieken van een blog. Met links! Zo kan ik snel vinden wat ik zoek. Je hoeft er geen te hebben, maar als je een groot blog hebt, kan het fijn zijn voor je bezoekers.
Ik heb een html sitemap gemaakt voor Momfever. Wil je een html sitemap op jouw Blogger blog? Dan vind je hier de code die je nodig hebt! Het is supermakkelijk. Ook Bloggen en loggen heeft een html sitemap. Kijk maar in de menu balk rechtsboven!
Samenvattend
- XML-sitemap: is voor robots. Zorgt ervoor dat al je pagina’s worden gevonden door zoekmachines.
- Robots.txt: is ook voor robots. Vertelt robots welke pagina’s ze niet mogen.
- Html sitemap: is voor je bezoekers! Biedt ze een handig overzicht van alles op je blog. Vergelijkbaar met de index van een boek.
Blogger blogs maken automatisch xml-sitemaps en robots.txt aan. Je hoeft hiervoor dus niets te doen. Maar het nadeel van de automatische xml-sitemaps is dat ze alleen de meest recente 26 posts laten zien.
Voor WordPress blogs maak je heel eenvoudig een xml sitemap met bijvoorbeeld de Yoast plugin! Een Robot.txt wordt automatisch gemaakt.
Het is belangrijk om een xml-sitemap op te geven in Google Webmaster Tools. Maar als je hem in je Blogger blog robots.txt hebt gezet is dit niet nodig.
Deze post werd eerder gepubliceerd in 2015, maar is helemaal bijgewerkt en ge-update met de nieuwste inzichten!
Dag Bloggelientje,
Dank weer voor de handige uitleg. Ik heb volgens jouw aanwijzingen zowel een XML sitemap als een HTML sitemap gemaakt. Ik zie in die laatste dat ik wel erg veel labels heb; misschien moet ik dat maar eens opschonen.
Wel gek vind ik het dat de labels Italië (en de sublabels daarvan in verschillende posts) en die van Griekenland niet in de HTML-sitemap verschijnen. In totaal heb ik van alle reizen 185 berichten; waarvan van Italië en Griekenland ieder ongeveer 15. Heb jij enig idee waarom die uit 2010 en 2011 daterende berichten niet in de sitemap verschijnen? Ik heb die van Italië inmiddels een datum uit 2012 gegeven maar dat heeft ook niet geholpen. Raadselachtig, he.
Ook bij de xml-sitemap had ik volgens Search Console maar 150 berichten. Zoeken op Engelstalige sites heeft mij geleerd dat Google in een nieuw systeem via de XML-sitemap met de atom code maar 150 berichten weergeeft. Het advies was om een sitemap te installeren via http://www.blognaam.nl/sitemap.xml. Dat heb ik gedaan, zowel in het robot.txt. vak als aangemeld bij Search Console. En hoera, dat werkt. Al mijn berichten zijn nu gevonden en geindexeerd.