мне кажется нужно копать в сторону chr()
наверняка эти символы начинаются с chr() больше какого - то числа (например,500)
значит нужно все символы из строки перевести в chr() формат, и вырезать все, которые больше 500.
что - то в этом роде однозначно
Добавлено через 01:06 сек.
P.S: может лучше оставлять только нужные символы (A-z0-9_-), нежели вырезать все остальное?
Добавлено через 00:55 сек.
FILTER_FLAG_STRIP_LOW — вырезает все символы, код которых меньше 32 (ASCII)
FILTER_FLAG_STRIP_HIGH — вырезает все символы с кодами больше 127 (ASCII)
вот эти посмотреть
Добавлено через 01:33 сек.
FILTER_SANITIZE_URL — оставляет только a-zA-Z0-9`~!@#$%^&*()-_=+[{]};:'"<,>.?/|
и возможно вот эту, хотя это для url и оставляет ли русские символы - под вопросом