МГТУГА

Категории раздела

История воздухоплавания [31]
Системное программное обеспечение [55]
Сети 3-4 курс [41]
Методы и средства защиты информации [17]
Вычислительный системы [42]
про САПР [41]
Безопасность жизнедеятельности. БЖД. [46]
Интернет-технологии ГА [49]

Статистика


Онлайн всего: 9
Гостей: 9
Пользователей: 0

Форма входа

Каталог статей

Главная » Статьи » Интернет-технологии ГА

50. Robots TXT
50. Robots TXT
Файл robots.txt – это текстовый файл,
находящийся в корневой директории
сайта, в котором записываются
специальные инструкции для поисковых
роботов. Эти инструкции могут запрещать
к индексации некоторые разделы или
страницы на сайте, указывать на
правильное «зеркалирование» домена,
рекомендовать поисковому роботу
соблюдать определенный временной
интервал между скачиванием документов
с сервера и т.д.
Создание robots.txt Чтобы создать файл
robotx.txt, нужен простой текстовый файл.
Если вы не собираетесь создавать запреты
к индексации, можно сделать пустой файл
robots.txt.
Для Рунета самой часто встречающейся
задачей является создание файла robots.txt
для Яндекса, так как сейчас Яндекс –
самая популярная поисковая система.
Важно уметь правильно использовать
директиву host, которую соблюдает этот
поисковик.
Что писать в файл robots.txt
В файл robots.txt обычно пишут нечто
вроде:
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /~joe/
В этом примере запрещена индексация
трех директорий.
Затметьте, что каждая директория указана
на отдельной строке – нельзя написать
«Disallow: /cgi-bin/ /tmp/». Нельзя также
разбивать одну инструкцию Disallow или
User-agent на несколько строк, т.к. перенос
строки используется для отделения
инструкций друг от друга.
Регулярные выражения и символы
подстановки так же нельзя использовать.
«Звездочка» (*) в инструкции User-agent
означает «любой робот». Инструкции вида
«Disallow: *.gif» или «User-agent: Ya*" не
поддерживаются.
Конкретные инструкции в robots.txt
зависят от вашего сайта и того, что вы
захотите закрыть от индексации. Вот
несколько примеров:
Запретить весь сайт для индексации всеми
роботами
User-agent: *
Disallow: /
Категория: Интернет-технологии ГА | Добавил: mgtuga (28.12.2010)
Просмотров: 807 | Рейтинг: 0.0/0
Всего комментариев: 0
Имя *:
Email *:
Код *:

Поиск

Дисциплины