Убираем дубликаты страниц

1. CROWS (22.02.2011 / 09:38)
Дубликаты страниц не нужны в индексах поисковых систем, они вредят сайту и от них нужно избавляться полностью. Но на многих сайтах могут быть ссылки с идентификаторами сессий и обойтись без них нельзя. Как быть с ними?

Код должен быть установлен на всех страницах сайта (Реализован на PHP):
$se_mask = "(Yandex|Googlebot|StackRambler|Yahoo Slurp|WebAlta|msnbot)";
if (preg_match($se_mask,$_SERVER['HTTP_USER_AGENT'])) {
  if (!empty($_GET['PHPSESSID'])) {
    header($_SERVER['SERVER_PROTOCOL']." 404 Not Found");
    exit();
  }
} else {
  session_start();
}


2. Валерий (22.02.2011 / 20:50)
Почему нельзя обойтись без идентификаторов сессий? Я обхожусь..
Те у кого куки не работают - обламываются.. Но таких не больше 2х процентов. Зато никаких дубликатов страниц.

3. Сааааа-нёёёёё-к (22.02.2011 / 20:56)
Мне кажеться вы голову ломаете.
Не уже ли гугл и яша не позаботились зная что миллионы сайтов в той или иной степени работают с сессиями?

Добавлено через 01:06 сек.
Да и намногих страницах есть такие ссылки как назад, вперед и т.д.

4. CROWS (22.02.2011 / 22:02)
StingerIce (22 Февраля 2011 / 20:56)
Мне кажеться вы голову ломаете.
Не уже ли гугл и яша не позаботились зная что миллионы сайтов в той или иной степени работают с сессиями?

Добавлено через 01:06 сек.
Да и намногих страницах есть такие ссылки как назад, вперед и т.д.


При каждом новом заходе поискового бота он видет что-то еа подобии

1.php?PHPSESSID=123
1.php?PHPSESSID=456

Хоть контент на этих страницах одинаковый, страницы воспринимаются именно как РАЗНЫЕ страницы. Таких страниц с одним и тем же контентом, как вы поняли, может быть куча.

Добавлено через 01:38 сек.
valerik (22 Февраля 2011 / 20:50)
Почему нельзя обойтись без идентификаторов сессий? Я обхожусь..
Те у кого куки не работают - обламываются.. Но таких не больше 2х процентов. Зато никаких дубликатов страниц.
При первом заходе cookies не помогут убрать идентификатор с url.

5. Иван (22.02.2011 / 22:09)
Спасибо + 1

6. CROWS (22.02.2011 / 22:27)
Fantik (22 Февраля 2011 / 22:09)
Спасибо + 1
Пжлст.

Добавлено через 01:14 сек.
2. valerik, вы когда нибудь замечали, например на wap-motor, что при первом заходе, независимо от того, что вы авторизовались по кукам, есть приставки PHPSESSID?

7. ramzes (22.02.2011 / 22:37)
Хуже всего не незание, хуже всего илющия знания, понимайте как хотитете, кто захочет тот найдет

8. Tony V (22.02.2011 / 22:39)
Извращение. Это всё делается строкой
Clean-param: PHPSESSID
в robots.txt для яндекса и в центре веб мастеров у гугла

9. CROWS (22.02.2011 / 22:59)
anton.vanin (22 Февраля 2011 / 22:39)
Извращение. Это всё делается строкой
Clean-param: PHPSESSID
в robots.txt для яндекса и в центре веб мастеров у гугла
Извращение, когда нужно по-разному подстраиваться под разные поисковики... Разместить код в header гораздо проще предложенного варианта. SE не заканчивается на гугле с яндексом. Вот так вот...

URL: https://visavi.net/topics/19009