(PHP 4 >= 4.3.0, PHP 5)
html_entity_decode — Converte le entità HTML nei corrispondenti caratteri
$string
[, int $quote_style
[, string $charset
]] )
La funzione html_entity_decode() è l'opposto di
htmlentities() converte tutte le entità HTML presenti
nel parametro string nel corrispondente carattere.
Il secondo parametro,
quote_style, opzionale, indica cosa occorre fare per gli apici
'singoli' e "doppi". Sono possibili tre scelte indicate da tre
costanti con default ENT_COMPAT:
| Nome della costante | Descrizione |
|---|---|
ENT_COMPAT |
Converte gli apici doppi e lascia inalterati gli apici singoli. |
ENT_QUOTES |
Converte sia gli apici doppi sia gli apici singoli. |
ENT_NOQUOTES |
Lascia entrambi i tipi di apici inalterati. |
Per il terzo parametro opzionale, charset, si utilizza
come default il set di caratteri ISO-8859-1. Questo parametro indica quale
set di caratteri utilizzare per la conversione.
Elenco dei set di caratteri supportati:
| Set di caratteri | Alias | Descrizione |
|---|---|---|
| ISO-8859-1 | ISO8859-1 | Western European, Latin-1. |
| ISO-8859-5 | ISO8859-5 | Il charset cirillico poco utilizzato (Latin/Cyrillic). |
| ISO-8859-15 | ISO8859-15 | Western European, Latin-9. Con in più il simbolo dell'Euro e i caratteri francesi e finnici mancanti in Latin-1 (ISO-8859-1). |
| UTF-8 | Set ASCII compatibile con il set multi-byte Unicode su 8-bit. | |
| cp866 | ibm866, 866 | Set di caratteri cirillico specifico del Dos. |
| cp1251 | Windows-1251, win-1251, 1251 | Set di caratteri cirillico specifico di Windows. |
| cp1252 | Windows-1252, 1252 | Set di caratteri specifico di Windows per l'Europa occidentale. |
| KOI8-R | koi8-ru, koi8r | Russo. |
| BIG5 | 950 | Cinese tradizionale, usato principalmente a Taiwan. |
| GB2312 | 936 | Cinese semplificato, set di caratteri nazionale standard. |
| BIG5-HKSCS | Big5 con estensioni per Hong Kong, cinese tradizionale. | |
| Shift_JIS | SJIS, SJIS-win, cp932, 932 | Giapponese. |
| EUC-JP | EUCJP, eucJP-win | Giapponese. |
| MacRoman | Charset che veniva utilizzato dal Mac OS. | |
| '' | Una stringa vuota attiva il rilevamento della codifica dallo script (Zend multibyte), default_charset e l'attuale locale (guarda nl_langinfo() e setlocale()), in quest'ordine. Non consigliato. |
Nota: Ogni altro set di caratteri non è riconosciuto. Sarà invece utilizzata la codifica predefinita e verrà mostrato un avviso.
Example #1 Decodifica delle entità HTML
<?php
$orig = "I'll \"walk\" the <b>dog</b> now";
$a = htmlentities($orig);
$b = html_entity_decode($a);
echo $a; // I'll "walk" the <b>dog</b> now
echo $b; // I'll "walk" the <b>dog</b> now
// Per utilizzatori di versioni di PHP antecedenti alla 4.3.0:
function unhtmlentities($string)
{
$trans_tbl = get_html_translation_table(HTML_ENTITIES);
$trans_tbl = array_flip($trans_tbl);
return strtr($string, $trans_tbl);
}
$c = unhtmlentities($a);
echo $c; // I'll "walk" the <b>dog</b> now
?>
Nota:
Ci si può chiedere come mai la sequenza trim(html_entity_decode(' ')); non produca una stringa vuota; questo accade perché l'intità ' ' non corrisponde al codice ASCII 32 (che verrebbe rimosso da trim()), ma, nella codifica di default ISO-8859-1, corrisponde al carattere ASCII 160 (0xa0).
Vedere anche htmlentities(), htmlspecialchars(), get_html_translation_table(), and urldecode().