Google стал плевать на robots.txt!?

Дата публикации: 03.04.2010 | Рубрики: Google, Новости | Теги: ,
Автор: Радкевич С.

Если честно, то вначале хотел обозвать google, «тихим матерным» словом, но так как эти самые тихие словечки я не употребляю, то обойдусь тем заголовком что есть. Но гугл меня сегодня по настоящему задел за живое, добавив не только адреналина, но и заставил изрядно поднапрячься и заерзать на стульчике.

А началось с того, что сев писать статью по результатам за март, стал подбивать заодно всякие показатели, ну и проверил сколько страниц блога в основном индексе google. Увиденное ввергло меня в глубой шок:
Сведиения об индексированности в гугл

Капец! Откуда в индексе взялось 3200 страниц, если за недельку до того их было в 10 раз меньше?. Ну думаю, грядет апп PR и гугл полностью переиндексировал сайт, но потом прикинул, что даже со всеми тегами, категориями, архивами и страницами, ну никак не должно столько набраться. Тем более, что в последнее время я старался уменьшить количестов «левых» страничек в индексе, чтобы увеличить соотношение основного индекса к дополнительному. Надо сказать, это соотношение росло с каждым месяцем, а тут как серпом по одному месту.

Полез в яндекс, все вроде нормально, у того никаких подобных «ляпов» не наблюдается. Стал проверять блог на взлом, да и всякие другие варианты, мало ли действительно кто дор прицепил. Как оказалось решение лежало несколько в иной плоскости, но почему так произошло, до сих пор не могу въехать. Вот такая картинка наблюдается в индексе:
kaptcha и индескированность

И таких вот страничек в индексе насчиталось 2800. Стал проверять куда ведут подобные странички и оказалось, что гугл щедро проиндексировал все рисунки каптчи, которая стояла у меня на блоге — Not Captcha. Перейдя по ссылке в индексе гугла, естественно дополнительном, наблюдал примерно следующее:
kaptcha1
И какого спрашивается, эти картинки вообще попали в индекс, если в файле robots было черным по белому прописано: Disallow: /wp-content/
Теперь поменял на Disallow: /wp-content/plugins, для особо не понятливых поисковиков. Но не думаю, что это что-то изменит, здается мне, что гугл стал плевать на всякие robots :)

Короче вопросов у меня появилась уйма, но в одном можно быть почти уверенным, что апп у гугла будет со дня на день. Хотя, кто его знает, я теперь ничему уже не удивляюсь.

Ну а с итогами разберусь чуть позже, скажу лишь, что результаты есть там, где что-то делаешь. Как только меня озадачил вопрос, как увеличить заработок с Adsense, он почему-то стал расти, да и блогун радует глаз, хотя вроде как и ленюсь переодически. Хочу еще немного прокачать несколько твитеров и тоже добавить их в эту системку, а там посмотрим, что из этого выйдет.

Знаете ли вы, что много полезной информации можно из почерпнуть из Google Cache, если нет, то прогуляйтесь по ссылке.
Олег Маркарьян, написал отличную статью про то, как правильно составить на работу резюме, очень дельные советы.

Похожие записи

Спасибо за добавление этой статьи в
Если Вам понравилась статья, то вы можете подписаться на RSS (что это такое?). А также бесплатно подписаться по E-mail и получать актуальную информацию в числе первых.

21 комментарий: Google стал плевать на robots.txt!?

  1. proekt-gaz говорит:

    Думаю ни чего страшного не произошло, гугл же различает картинки и html страницы. На PR в худшую сторону это не должно сказаться.

  2. Руслан говорит:

    Глюки бывают у любой поисковой системы! Будем надеяться что это только некорректные формы поиска, которые в последствии будут устранены :)

  3. Sarg говорит:

    Тоже заметил, у меня категории индексирует несмотря на запрет в роботс

  4. ingram говорит:

    Ну а реальный негатив кроме циферок в панели вебмастера гугли есть с этого?

  5. Could говорит:

    И да, действительно, 4 апреля уже был ап PR :) Предугадали.

  6. Could говорит:

    У меня гугл тоже за несколько дней до ап всё проиндексировал.

  7. Рома говорит:

    Да уж, гугл приподнес сюрприз, а насчет контекстной рекламы от него же, клики последнее время вообще по центу или два в основном идут

  8. Rapid говорит:

    Сдается мне это частный случай с глюком ПС, у себя такого незамечал вроде. Единственное чего немогу понять, так что гугл страницы кидает то в основной, то в дополнительный, такая свистопляска примерно 700-800 страниц скачут туда сюда…

  9. carerakjan говорит:

    Увлекательная история получилась!-)
    Интересно вышло с выдачей… про всякое читал, а про такое первый раз…-))

  10. yuriy88 говорит:

    Возможно Гугль что то ищет… вот и плюет на робота, или же изменился алгоритм и робота не учли или же просто он не нужен.

  11. Ляйсан говорит:

    Я не очень понимаю в файлах robots.txt, нашла в сети готовый шаблон и сунула себе такую же, подскажите, пожалуйста, я правильно ее составила, с точки зрения улучшения продвижения —
    User-agent: *
    Disallow: /wp-login.php
    Disallow: /wp-register.php
    Disallow: /xmlrpc.php
    Disallow: /wp-admin
    Disallow: /wp-includes
    Disallow: /wp-content
    Disallow: /trackback/
    Disallow: /feed/
    Disallow: /comments/
    Disallow: */trackback/
    Disallow: */feed/
    Disallow: */comments/
    Disallow: /?feed=
    Disallow: /?s=
    Allow: /wp-content/uploads/

  12. Радкевич С. говорит:

    Ляйсан, файл то неплохой, только у вас комменты закрыты от индексации. Если вы хотите развитию своему блогу, я бы этого не делал.

  13. Патифонов говорит:

    Та забей, у всех поисковиков бывают случаются подобные ляпы, думаю что через неделю другую все вернется на круги своя и эти странички выпадут с индекса.

  14. Эдуард говорит:

    У меня такая же история сначала индексации, все что можно Гугл в индекс впихнул. Я и robots.txt переписывал, пытаясь закрыть-перезакрыть, но бесполезно, чем дальше, тем больше ссылок в заблоченные зоны.

  15. strikestar говорит:

    а чем плохо если поисковики будут индексировать все страницы, включая со счетчиками, капчами и т.д. и т.п.??? Объясните пожалуйста!

  16. Радкевич С. говорит:

    strikestar, а Вы может еще хотите чтобы он проиндексировал движок сайта в котором пароли храняться? :) Лишний индекс тоже не к чему.

  17. strikestar говорит:

    Радкевич С., все понял, спасибо

  18. Александр Кардинал говорит:

    Серёж, микросовет: пиши инфы на стр. поменьше — лучше разбивй на куски…
    И читателям бут время анализить, и тупым поисковикам — «обмозговать»…

  19. Радкевич С. говорит:

    Александр, большое спасибо за совет! Но есть одно но. Гугл ну очень любит когда на странице много контекста и я иногда в угоду ему его и увеличиваю :) , что в основном индексе было статей побольше. И надо сказать, гугл значительно поднял мои позиции.

  20. qua12345 говорит:

    Я думаю, это временные неполадки и скоро все вернется на место!

  21. Sergio говорит:

    Конечно же ничего страшного, но WTF? xD
    Не понимаю… как он их обнаружил…

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

*

*

Можно использовать следующие HTML-теги и атрибуты: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre lang="" line="" escaped="">