(PHP 4, PHP 5)
get_html_translation_table — Devuelve la tabla de traducción utilizada por htmlspecialchars() y htmlentities()
$table = HTML_SPECIALCHARS
[, int $flags = ENT_COMPAT | ENT_HTML401
[, string $encoding = 'UTF-8'
]]] )get_html_translation_table() devolverá la tabla de traducción que es utilizada internamente para htmlspecialchars() y htmlentities().
Nota:
Los caracteres especiales se pueden codificar de varias maneras. Por ejemplo " puede ser codificado como ", " o ". get_html_translation_table() devuelve sólo la forma utilizada por htmlspecialchars() y htmlentities().
table
Cual tabla devolver. EntreHTML_ENTITIES o
HTML_SPECIALCHARS).
flags
Una máscara de bits de uno o más de los siguientes indicadores, que especifican que comillas contendrá la tabla, así como para qué tipo de documento es la tabla. El valor por defecto es ENT_COMPAT | ENT_HTML401.
| Nombre de la constante | Descripción |
|---|---|
ENT_COMPAT |
La tabla contendrá entidades para comillas dobles, pero no por comillas simples. |
ENT_QUOTES |
La tabla contendrá entidades para ambas comillas dobles y simples. |
ENT_NOQUOTES |
La tabla no contendrá entidades de comillas simples ni las de comillas dobles. |
ENT_HTML401 |
Tabla para HTML 4.01. |
ENT_XML1 |
Tabla para XML 1. |
ENT_XHTML |
Tabla para XHTML. |
ENT_HTML5 |
Tabla para HTML 5. |
encoding
La codificación a usar. Si se omite, el valor por defecto para este argumento es ISO-8859-1 en versiones de PHP anteriores a 5.4.0, y es UTF-8 a partir de PHP 5.4.0 en adelante.
Los siguientes juegos de caracteres están soportados:
| Juego de caracteres | Alias | Descripción |
|---|---|---|
| ISO-8859-1 | ISO8859-1 | Europeo Occidental, Latin-1. |
| ISO-8859-5 | ISO8859-5 | Juego de caracteres cirílicos poco usado (Latin/Cyrillic). |
| ISO-8859-15 | ISO8859-15 | Europeo Occidental, Latin-9. Añade el signo de Euro, y letras del Francés y Finlandés que hacián falta en Latin-1 (ISO-8859-1). |
| UTF-8 | Multi-byte Unicode de 8-bits compatible con ASCII. | |
| cp866 | ibm866, 866 | Juego de caracteres Cirílico específico de DOS. |
| cp1251 | Windows-1251, win-1251, 1251 | Juego de caracteres Cirílicos específico de Windows. |
| cp1252 | Windows-1252, 1252 | Juego de caracteres específico de Windows para Europa Occidental. |
| KOI8-R | koi8-ru, koi8r | Ruso. |
| BIG5 | 950 | Chino Tradicional, usado principalmente en Taiwán. |
| GB2312 | 936 | Chino Simplificado, juego de caracteres estándar nacional. |
| BIG5-HKSCS | Big5 con extensiones de Hong Kong, Chino Tradicional. | |
| Shift_JIS | SJIS, SJIS-win, cp932, 932 | Japonés |
| EUC-JP | EUCJP, eucJP-win | Japonés |
| MacRoman | Juego de caracteres que fue utilizado por Mac OS. | |
| '' | Un string vacío activa la detección desde la codificación del script (Zend multibyte), default_charset y la actual configuración regional (ver nl_langinfo() y setlocale()), en este orden. No se recomienda. |
Nota: Cualquier otro juego de caracteres no es reconocido. La codificación por defecto será utilizada en su lugar y se emitirá una advertencia.
Devuelve la tabla de traducción como un array, con los caracteres originales como claves y las entidades como valores.
| Versión | Descripción |
|---|---|
| 5.4.0 |
El valor por defecto para el parámetro encoding fue
cambiado a UTF-8.
|
| 5.4.0 |
Fueron agregadas las constantes ENT_HTML401, ENT_XML1,
ENT_XHTML y ENT_HTML5.
|
| 5.3.4 |
Fue agregado el parámetro encoding.
|
Ejemplo #1 Ejemplo de tabla de traducción
<?php
var_dump(get_html_translation_table(HTML_ENTITIES, ENT_QUOTES | ENT_HTML5));
?>
El resultado del ejemplo sería algo similar a:
array(1510) {
[""]=>
string(5) "	"
["
"]=>
string(9) "
"
["!"]=>
string(6) "!"
["""]=>
string(6) """
["#"]=>
string(5) "#"
["$"]=>
string(8) "$"
["%"]=>
string(8) "%"
["&"]=>
string(5) "&"
["'"]=>
string(6) "'"
// ...
}