(PHP 4 >= 4.3.0, PHP 5)
html_entity_decode — Konvertiert alle benannten HTML-Zeichen in ihre entsprechenden Ursprungszeichen
$string
[, int $flags
= ENT_COMPAT | ENT_HTML401
[, string $encoding
= 'UTF-8'
]] )
html_entity_decode() ist das Gegenstück zu
htmlentities(), welches alle HTML-Entities
innerhalb von string
in ihre entsprechenden
Ursprungszeichen zurückwandelt.
string
Die Eingabezeichenkette.
flags
Eine Bitmaske von einem oder mehreren der folgenden Flags, die die Behandlung von Anführungszeichen, sowie den zu nutzenden Dokumententyp festlegen. Der Standardwert ist ENT_COMPAT | ENT_HTML401.
Konstantenname | Beschreibung |
---|---|
ENT_COMPAT |
Konvertiert doppelte Anführungszeichen und lässt einfache Anführungszeichen unberührt. |
ENT_QUOTES |
Konvertiert sowohl doppelte als auch einfache Anführungszeichen. |
ENT_NOQUOTES |
Lässt sowohl doppelte als auch einfache Anführungszeichen unberührt. |
ENT_HTML401 |
Behandle Code als HTML 4.01. |
ENT_XML1 |
Behandle Code als XML 1. |
ENT_XHTML |
Behandle Code als XHTML. |
ENT_HTML5 |
Behandle Code als HTML 5. |
encoding
Zu verwendende Zeichenkodierung. Standardwert ist ISO-8859-1 in PHP Versionen vor 5.4.0 und UTF-8 in PHP 5.4.0 und neuer.
Die folgenden Zeichensätze werden mit PHP 4.3.0 und höher unterstützt:
Zeichensatz | Alias | Beschreibung |
---|---|---|
ISO-8859-1 | ISO8859-1 | Westeuropäisch, Latin-1 |
ISO-8859-15 | ISO8859-15 | Westeuropäisch, Latin-9. Enthält das Euro-Zeichen sowie französische und finnische Buchstaben, die in Latin-1(ISO-8859-1) fehlen. |
UTF-8 | ASCII-kompatibles Multi-Byte 8-Bit Unicode. | |
cp866 | ibm866, 866 | DOS-spezifischer Kyrillischer Zeichensatz. Dieser Zeichensatz wird ab PHP Version 4.3.2 unterstützt. |
cp1251 | Windows-1251, win-1251, 1251 | Windows-spezifischer Kyrillischer Zeichensatz. Dieser Zeichensatz wird ab PHP Version 4.3.2 unterstützt. |
cp1252 | Windows-1252, 1252 | Windows spezifischer Zeichensatz für westeuropäische Sprachen. |
KOI8-R | koi8-ru, koi8r | Russisch. Dieser Zeichensatz wird ab PHP Version 4.3.2 unterstützt. |
BIG5 | 950 | Traditionelles Chinesisch, hauptsächlich in Taiwan verwendet. |
GB2312 | 936 | Vereinfachtes Chinesisch, nationaler Standard-Zeichensatz. |
BIG5-HKSCS | Big5 mit Hongkong-spezifischen Erweiterungen; traditionelles Chinesisch. | |
Shift_JIS | SJIS, 932 | Japanisch |
EUC-JP | EUCJP | Japanisch |
Hinweis: Weitere Zeichensätze sind nicht implementiert, an ihrer Stelle wird ISO-8859-1 verwendet.
Gibt die dekodierte Zeichenkette zurück.
Version | Beschreibung |
---|---|
5.4.0 | Die Standardkodierung wurde von ISO-8859-1 auf UTF-8 geändert. |
5.4.0 |
Die Optionen ENT_HTML401 , ENT_XML1 ,
ENT_XHTML und ENT_HTML5 wurden
hinzugefügt.
|
5.0.0 | Die Unterstützung für Multibyte-Kodierungen wurde hinzugefügt. |
Beispiel #1 Dekodieren benannter HTML-Zeichen
<?php
$orig = "I'll \"walk\" the <b>dog</b> now";
$a = htmlentities($orig);
$b = html_entity_decode($a);
echo $a; // I'll "walk" the <b>dog</b> now
echo $b; // I'll "walk" the <b>dog</b> now
?>
Hinweis:
Sie wundern sich vielleicht, warum trim(html_entity_decode(' ')); den String nicht zu einem leeren Sting reduziert. Der Grund dafür ist, dass ' ' in der Standard-Kodierung nicht dem Zeichen mit ASCII-Code 32 entspricht (dieses wird von trim() entfernt), sondern dem Zeichen mit ASCII-Code 160 (0xa0).