Расшировка юникодных букв
1.
‮PLATINUM (03.08.2014 / 18:14)
На некоторых сайтах в исходном коде в место текста встречается вот это(отрывок из исохдника)
<p>Описание для данного клана отсутствует<br/>
Вместо символов текста мы видим их записанные коды. Что интересно, при обработке этой страницы парсером XML показываются уже нормальные русские буквы. Теперь два вопроса - как эти буквы расшифровать(очевидно, это коды символов, но в каком они формате), и второе - как можно с помощью php выводить все русские буквы в таком вот виде.
2.
KpuTuK (03.08.2014 / 18:31)
http://web-data-extractor.net/parser-forum/showthread.php?t=199
3.
‮PLATINUM (03.08.2014 / 18:34)
2.
KpuTuK, жаль скачать нельзя, а вот таблица кодов полезная
4.
Алексей (03.08.2014 / 18:49)
как то так:
<?php
function replace($text){
$array = array(
"А"=>"А","а"=>"а","Б"=>"Б","б"=>"б","В"=>"В","в"=>"в","Г"=>"Г","г"=>"г",
"Д"=>"Д","д"=>"д","Е"=>"Е","е"=>"е","Ё"=>"Ё","ё"=>"ё","Ж"=>"Ж","ж"=>"ж",
"З"=>"З","з"=>"з","И"=>"И","и"=>"и","Й"=>"Й","й"=>"й","К"=>"К","к"=>"к",
"Л"=>"Л","л"=>"л","М"=>"М","м"=>"м","Н"=>"Н","н"=>"н","О"=>"О","о"=>"о",
"П"=>"П","п"=>"п","Р"=>"Р","р"=>"р","С"=>"С","с"=>"с","Т"=>"Т","т"=>"т",
"У"=>"У","у"=>"у","Ф"=>"Ф","ф"=>"ф","Х"=>"Х","х"=>"х","Ц"=>"Ц","ц"=>"ц",
"Ч"=>"Ч","ч"=>"ч","Ш"=>"Ш","ш"=>"ш","Щ"=>"Щ","щ"=>"щ","Ъ"=>"Ъ","ъ"=>"ъ",
"Ы"=>"Ы","ы"=>"ы","Ь"=>"Ь","ь"=>"ь","Э"=>"Э","э"=>"э","Ю"=>"Ю","ю"=>"ю",
"Я"=>"Я","я"=>"я");
return strtr($text, $array);
}
echo replace('Кириллический текст');
?>
5.
KpuTuK (03.08.2014 / 18:50)
3.
platinum дамаль, тебе скриптик надо?
<?php
function encode_sym($data) {
$encode = array(
'А' => 'А',
'а' => 'а',
// и так далее
);
return preg_replace(array_keys($encode), array_values($encode), $str)
}
6.
karpov-ml (03.08.2014 / 22:15)
http://forall.ru-board.com/Svarga/cyr_letters_gen.html
7.
Алексей (04.08.2014 / 06:52)
мы не ищем легких путей
8.
‮PLATINUM (04.08.2014 / 14:18)
мне один фиг нужно было на Java эту вещь закодить
но за Php-код спасибо
9.
Станислав (04.08.2014 / 15:57)
platinum дамаль (4 Августа 2014 / 16:18)
мне один фиг нужно было на Java эту вещь закодить
А, ну да, чего ж никто не догадался-то? Глупцы.
10.
‮PLATINUM (04.08.2014 / 17:20)
да мне алгоритм и нужен был. Для Java, кстати, нашёлся apache common lang, готовая библиотека
URL:
https://visavi.net/topics/41096