Van iso-8859-1 naar UTF-8
Ik ben bezig een website te herontwikkelen. De oude versie maakt gebruik van iso-8859-1. De nieuwe website wil ik hebben in UTF-8 (door de vele voordelen).
Je begrijpt het al. De oude nieuwsartikelen bevatten tekens die wel door iso-8859-1 ondersteunt worden, maar die er lelijk uitzien in UTF-8. UTF-8 maakt er bijvoorbeeld vraagtekens van.
Bestaat er een soort "convert to UTF-8" in PHP? Ik heb via Google en PHP.net al uitvoerig gekeken, maar zonder resultaat.
Alvast bedankt.
Is er een manier om deze rare tekens (gekopieerd van Word), om te zetten naar leesbare tekens?
Ik heb nu
Code (php)
1
2
3
4
5
6
7
8
9
10
11
12
13
2
3
4
5
6
7
8
9
10
11
12
13
<?php
$content = strtr(
$content,
array(
'“' => '"',
'”' => '"',
'’' => '\'',
'`' => '\''
)
);
$content = utf8_encode($content)
?>
$content = strtr(
$content,
array(
'“' => '"',
'”' => '"',
'’' => '\'',
'`' => '\''
)
);
$content = utf8_encode($content)
?>
Kan dit makkelijker?
Gewijzigd op 01/01/1970 01:00:00 door Barman V
Gebruik htmlentities :) Die lost een hoop op :)
Schrijven gebeurt via een UTF8 Pagina en gaat door een HTMLSpecialChars heen alvorens hij in een MySQL Karakterset / Collatie: UTF-8 Unicode (utf8) / Latin1_Swedish_ci (beide getest) terecht komt.
Uitlezen gebeurt plane vanuit de database maar ook met UTF8_Decode blijft het hetzelfde als onderstaande, UTF8_Encode maakt van de vraagtekens Blokjes maar doet nog niet wat het moet doen.
Resulteert in
Quote:
Dit was tevens Matjeâ??s laatste wedstrijd omdat hij voor een half jaar op huurbasis naar het Spaanse zaalvoetbalteam â??ZV Lanzaroteâ?? gaat. Wij van ZV. The Incredibles wensen hem daar alle sterkte en plezier toe.
Waar ga ik de fout in en wat moet ik hieraan wijzigen om het wel goed te krijgen...bij het wegschrijven al Coderen?
Helaas veranderd htmlentities niks aan de situatie, hij blijft immers vraagtekens tonen.
Gewijzigd op 01/01/1970 01:00:00 door Barman V