Расшировка юникодных букв

1. ‮PLATINUM (03.08.2014 / 18:14)
На некоторых сайтах в исходном коде в место текста встречается вот это(отрывок из исохдника)

<p>&#x41E;&#x43F;&#x438;&#x441;&#x430;&#x43D;&#x438;&#x435; &#x434;&#x43B;&#x44F; &#x434;&#x430;&#x43D;&#x43D;&#x43E;&#x433;&#x43E; &#x43A;&#x43B;&#x430;&#x43D;&#x430; &#x43E;&#x442;&#x441;&#x443;&#x442;&#x441;&#x442;&#x432;&#x443;&#x435;&#x442;<br/>
Вместо символов текста мы видим их записанные коды. Что интересно, при обработке этой страницы парсером XML показываются уже нормальные русские буквы. Теперь два вопроса - как эти буквы расшифровать(очевидно, это коды символов, но в каком они формате), и второе - как можно с помощью php выводить все русские буквы в таком вот виде.

2. KpuTuK (03.08.2014 / 18:31)
http://web-data-extractor.net/parser-forum/showthread.php?t=199

3. &#x202E;PLATINUM (03.08.2014 / 18:34)
2. KpuTuK, жаль скачать нельзя, а вот таблица кодов полезная

4. Алексей (03.08.2014 / 18:49)
как то так:
<?php
function replace($text){
$array = array(
"А"=>"&#x410","а"=>"&#x430","Б"=>"&#x411","б"=>"&#x431","В"=>"&#x412","в"=>"&#x432","Г"=>"&#x413","г"=>"&#x433",
"Д"=>"&#x414","д"=>"&#x434","Е"=>"&#x415","е"=>"&#x435","Ё"=>"&#x401","ё"=>"&#x451","Ж"=>"&#x416","ж"=>"&#x436",
"З"=>"&#x417","з"=>"&#x437","И"=>"&#x418","и"=>"&#x438","Й"=>"&#x419","й"=>"&#x439","К"=>"&#x41A","к"=>"&#x43A",
"Л"=>"&#x41B","л"=>"&#x43B","М"=>"&#x41C","м"=>"&#x43C","Н"=>"&#x41D","н"=>"&#x43D","О"=>"&#x41E","о"=>"&#x43E",
"П"=>"&#x41F","п"=>"&#x43F","Р"=>"&#x420","р"=>"&#x440","С"=>"&#x421","с"=>"&#x441","Т"=>"&#x422","т"=>"&#x442",
"У"=>"&#x423","у"=>"&#x443","Ф"=>"&#x424","ф"=>"&#x444","Х"=>"&#x425","х"=>"&#x445","Ц"=>"&#x426","ц"=>"&#x446",
"Ч"=>"&#x427","ч"=>"&#x447","Ш"=>"&#x428","ш"=>"&#x448","Щ"=>"&#x429","щ"=>"&#x449","Ъ"=>"&#x42A","ъ"=>"&#x44A",
"Ы"=>"&#x42B","ы"=>"&#x44B","Ь"=>"&#x42C","ь"=>"&#x44C","Э"=>"&#x42D","э"=>"&#x44D","Ю"=>"&#x42E","ю"=>"&#x44E",
"Я"=>"&#x42F","я"=>"&#x44F");
return strtr($text, $array);
}
echo replace('Кириллический текст');
?>


5. KpuTuK (03.08.2014 / 18:50)
3. platinum дамаль, тебе скриптик надо?
<?php
function encode_sym($data) {
$encode = array(
'&#x410' => 'А',
'&#x430' => 'а',
// и так далее
);
return preg_replace(array_keys($encode), array_values($encode), $str)
}


6. karpov-ml (03.08.2014 / 22:15)
http://forall.ru-board.com/Svarga/cyr_letters_gen.html

7. Алексей (04.08.2014 / 06:52)
мы не ищем легких путей D

8. &#x202E;PLATINUM (04.08.2014 / 14:18)
мне один фиг нужно было на Java эту вещь закодить

но за Php-код спасибо

9. Станислав (04.08.2014 / 15:57)
platinum дамаль (4 Августа 2014 / 16:18)
мне один фиг нужно было на Java эту вещь закодить
А, ну да, чего ж никто не догадался-то? Глупцы.

10. &#x202E;PLATINUM (04.08.2014 / 17:20)
да мне алгоритм и нужен был. Для Java, кстати, нашёлся apache common lang, готовая библиотека

URL: https://visavi.net/topics/41096