(PHP 4, PHP 5)
get_html_translation_table — Возвращает таблицу преобразований, используемую функциями htmlspecialchars() и htmlentities()
$table
= HTML_SPECIALCHARS
[, int $flags
= ENT_COMPAT | ENT_HTML401
[, string $encoding
= 'UTF-8'
]]] )get_html_translation_table() возвращает таблицу преобразований, используемую функциями htmlspecialchars() и htmlentities().
Замечание:
Специальные символы могут быть закодированы разными способами. Например, " может быть закодирован как ", " или ". get_html_translation_table() возвращает только формы, используемые функциями htmlspecialchars() и htmlentities().
table
Указывает, какую таблицу использовать для преобразований. Либо HTML_ENTITIES
, либо
HTML_SPECIALCHARS
.
flags
Битовая маска, состоящая из одного или нескольких перечисленных ниже флагов, которые указывают какие кавычки будет содержать таблица, а также для какого документа таблица предназначена. Значение по умолчанию ENT_COMPAT | ENT_HTML401.
Имя константы | Описание |
---|---|
ENT_COMPAT |
Таблица будет содержать сущности для двойных кавычек, но не будет для одинарных. |
ENT_QUOTES |
Таблица будет содержать сущности как для двойных кавычек, так и для одинарных. |
ENT_NOQUOTES |
Таблица не будет содержать сущности ни для двойных кавычек, ни для одинарных. |
ENT_HTML401 |
Таблица для HTML 4.01. |
ENT_XML1 |
Таблица для XML 1. |
ENT_XHTML |
Таблица для XHTML. |
ENT_HTML5 |
Таблица для HTML 5. |
encoding
Используемая кодировка. Если не указана, то значением по умолчанию для этого аргумента является ISO-8859-1 в версиях PHP до 5.4.0 и UTF-8, начиная с версии 5.4.0 и далее.
Поддерживаются следующие кодировки:
Кодировка | Псевдонимы | Описание |
---|---|---|
ISO-8859-1 | ISO8859-1 | Западно-европейская Latin-1. |
ISO-8859-5 | ISO8859-5 | Редкоиспользуемая кириллическая кодировка (Latin/Cyrillic). |
ISO-8859-15 | ISO8859-15 | Западно-европейская Latin-9. Добавляет знак евро, французские и финские буквы к кодировке Latin-1(ISO-8859-1). |
UTF-8 | 8-битная Unicode, совместимая с ASCII. | |
cp866 | ibm866, 866 | Кириллическая кодировка, применяемая в DOS. |
cp1251 | Windows-1251, win-1251, 1251 | Кириллическая кодировка, применяемая в Windows. |
cp1252 | Windows-1252, 1252 | Западно-европейская кодировка, применяемая в Windows. |
KOI8-R | koi8-ru, koi8r | Русская кодировка. |
BIG5 | 950 | Традиционный китайский, применяется в основном на Тайване. |
GB2312 | 936 | Упрощенный китайский, стандартная национальная кодировка. |
BIG5-HKSCS | Расширенная Big5, применяемая в Гонг-Конге. | |
Shift_JIS | SJIS, SJIS-win, cp932, 932 | Японская кодировка. |
EUC-JP | EUCJP, eucJP-win | Японская кодировка. |
MacRoman | Кодировка, используемая в Mac OS. | |
'' | Пустая строка активирует режим определения кодировки из файла скрипта (Zend multibyte), default_charset и текущей локали (см. nl_langinfo() и setlocale()), в указанном порядке. Не рекомендуется к использованию. |
Замечание: Остальные кодировки не поддерживаются, вместо них будет применена кодировка по умолчанию и сгенерировано предупреждение.
Возвращает таблицу преобразований в виде массива с оригинальными символами в качестве ключей и сущностями в качестве значений.
Версия | Описание |
---|---|
5.4.0 |
Значение по умолчанию для параметра encoding было
изменено на UTF-8.
|
5.4.0 |
Были добавлены константы ENT_HTML401 , ENT_XML1 ,
ENT_XHTML и ENT_HTML5 .
|
5.3.4 |
Добавлен параметр encoding .
|
Пример #1 Пример таблицы преобразований
<?php
var_dump(get_html_translation_table(HTML_ENTITIES, ENT_QUOTES | ENT_HTML5));
?>
Результатом выполнения данного примера будет что-то подобное:
array(1510) { [" "]=> string(5) "	" [" "]=> string(9) "
" ["!"]=> string(6) "!" ["""]=> string(6) """ ["#"]=> string(5) "#" ["$"]=> string(8) "$" ["%"]=> string(8) "%" ["&"]=> string(5) "&" ["'"]=> string(6) "'" // ... }