Site in verschillende talen (google)
Ik ben bezig aan een taal module voor een site, nu werkt dit allemaal prima. Ik heb het zo gebouwd dat het met cookies werkt, en als er geen cookie bestaat de site default in het nederlands is.
Nu zat ik te denken dat dit misschien niet echt google friendly is, ik wil namelijk ook dat de site in de andere talen ge-indexeerd word. (weet niet of de google-bot, en andere search engiens cookies ondersteunen)
Kan ik de werking laten voor wat ie is, of is er misschien een (google-friendly) oplossing voor.
Alvast bedankt voor het medenken en de tips
Gewijzigd op 01/01/1970 01:00:00 door The Beeding Clown
Bestaat die niet (wat zo zal zijn bij een eerste bezoek of door een crawler bot), dan kan je kijken naar welke taal de gebruikte browser verkiest.
Tip: $_SERVER['HTTP_ACCEPT_LANGUAGE'] eens bekijken.
Edit: Ik zag net dit op php.net
Code (php)
Gewijzigd op 01/01/1970 01:00:00 door Hipska BE
Maar is het wel zo dat de site dan door de bots in de verschillende talen ge-indexeerd word? Dat is mijn uiteindelijke doel :)
edit:
ik kwam dit nog tegen op internet
Quote:
Here are my findings for the interest of others who find this topic:
googlebot (not being a browser) does not reliably understand/process "Content Negotiation" and therefore thinks all these sites are identical (English version), and therefore may be subject to a duplicate content penalty and at the very least fewer pages indexed by google. Technically, googlebot crawls without a preferred language setting and ignores "Accept-language" which causes only the English page to be served when a specific URL is requested by googlebot.
Short term solution:
. publish this tag <HTML lang="XX"> as part of every site. Replace the XX with the appropriate language code (fr, de, es etc.)
. have your server send this header: Content-language: XX (again, replace the XX with the appropriate language)
googlebot (not being a browser) does not reliably understand/process "Content Negotiation" and therefore thinks all these sites are identical (English version), and therefore may be subject to a duplicate content penalty and at the very least fewer pages indexed by google. Technically, googlebot crawls without a preferred language setting and ignores "Accept-language" which causes only the English page to be served when a specific URL is requested by googlebot.
Short term solution:
. publish this tag <HTML lang="XX"> as part of every site. Replace the XX with the appropriate language code (fr, de, es etc.)
. have your server send this header: Content-language: XX (again, replace the XX with the appropriate language)
Gewijzigd op 01/01/1970 01:00:00 door The Beeding Clown