Мы провели большое исследование по огромному количеству сайтов и проектов, просматривая, какие ошибки чаще всего присутствуют на сайтах вследствии ошибок при разработке, и выстроили их в структурированные по блокам таблицы. Имейте их ввиду при разработке и старайтесь не допускать на своих сайтах!
| 100% дублирование контента страниц; | 88% |
| Тестовый сайт на поддомене/другом домене/ip-адресе индексируется | 88% |
| URL могут содержать переменные, никак не меняющие контент, но создающие дубликаты | 68% |
| Ссылки на дубли страниц, например site.ru/ и site.ru/index.php | 62% |
| Сессия или ref-параметр в URL страницы с кодом ответа 200 | 58% |
| Страницы сайта доступны по адресам /dir1/dir2/ и /dir2/dir1/ | 56% |
| Страницы сайта доступны по адресам /dir/page.html и /page.htm | 56% |
| Версия для печати открыта для индексации | 56% |
| Технические страницы доступны для индексации | 54% |
| Страницы доступны по адресу /index.php и по / | 52% |
| Многие страницы доступны как с / на конце, так и без (site.ru vs site.ru/) | 46% |
| Не «склеен» домен с www и без www | 44% |
| На всех страницах выводится одинаковый текстовый блок | 38% |
| Наличие «пустых страниц», например, незаполненные профили на форуме | 38% |
| Сайт доступен с http:// и с https:// | 4% |
| На страницах пустые <TITLE> | 80% |
| Важный контент выполнен в AJAX | 74% |
| Навигация сделана через JavaScript/FLASH, ссылки оформлены не через <A HREF=> | 68% |
| <TITLE> нескольких страниц дублируются | 50% |
| Меню и сквозные заголовки оформлены через <H1-H6>, например заголовок «контакты» | 48% |
| Картинки в <H1-H6> | 42% |
| Несколько <H1> | 42% |
| <TITLE> и <H1> состоит из ключевых слов, перечисленных через запятую | 40% |
| Слишком много заголовков <H1-H6> на странице | 36% |
| Текст страницы полностью попадает в тэг description | 34% |
| Обилие <STRONG>, <B>, <EM> на странице | 30% |
| Description некоторых страниц дублируется | 26% |
| Корявый код от внутреннего редактора (например разрыв строки - <P></P>) | 20% |
| <TITLE> = <H1> | 18% |
| Верстка не валидная | 12% |
| Пустые Description | 6% |
| Keywords некоторых страниц дублируется | 2% |
| Пустые Keywords | 2% |
| Размещение на сайте "помоек" для обмена ссылками | 100% |
| По одному URL разный контент, зависимость от пути попадания на страницу | 68% |
| Множество внешних ссылок, доступных для индексации | 66% |
| Беспорядочная автоматизируемая внутренняя перелинковка | 64% |
| Содержимое контента на странице может передаваться через URL | 54% |
| Неоправданно высокий уровень вложенности страниц | 50% |
| Бедный анкор-лист, например только 1 вхождение при перелинковке | 44% |
| Большое количество исходящих внутренних ссылок | 42% |
| Динамическая внутренняя перелинковка | 40% |
| Битые ссылки на внешние сайты | 38% |
| Ссылки в меню сделаны картинками | 36% |
| Отсутсвует смена URL после сабмита форм (нет возможности настроить цели в GA) | 36% |
| Существуют страницы, на которые не стоят индексируемые ссылки | 34% |
| Не ЧПУ URLы | 34% |
| С одной страницы на другую стоит сразу несколько ссылок | 12% |
| Хостинг не выдерживает нагрузки, возникает 503 ошибка | 92% |
| Существующие страницы отдают код ответа 404 | 92% |
| Несуществующие страницы вместо 404 отдают код 302, 301, 200 и т.д. | 78% |
| При 404 ошибке уводит на другой сайт (хостинг и т.п.) | 76% |
| Непонимание, чем 302 отличается от 301 | 74% |
| Редирект в несколько шагов (302->302->301) | 74% |
| Низкая скорость загрузки страниц | 68% |
| Ошибки в идентификации кодировки сайта | 66% |
| Внутренние ссылки ведут на страницы с 302 редиректом | 56% |
| Страницы имеют слишком большой вес | 40% |
| На сайте не пишутся логи посещений | 2% |
| Клоакинг | 94% |
| Контент не уникален | 88% |
| Скрытый текст | 82% |
| Контент, добавляемый пользователями, не модерируется | 82% |
| Слишком большая плотность ключевых слов | 74% |
| Наличие важных элементов страницы в <IFRAME> | 64% |
| Описание/телефон/цена представлены изображением, а не текстом | 62% |
| Большие "простыни" текста | 56% |
| В robots.txt случайно закрыты важные страницы | 100% |
| Disallow: / в robots.txt | 92% |
| Meta-noindex, nofollow ошибочно на важных страницах | 86% |
| <noindex> открыли, но не закрыли | 82% |
| Robots.txt на основном зеркале отдает код ответа отличный от 200 | 68% |
| Открыты для индексации результаты поиска на сайте | 58% |
| Ссылки на несуществующие страницы в sitemap.xml | 40% |
| Инструкции даны только для одной поисковой системы | 34% |
| Отсутствие файла sitemap.xml | 20% |
| В sitemap.xml содержатся страницы, запрещенные в robots.txt | 14% |
| Sitemap.xml не обновляется | 12% |
| Все страницы имеют одинаковый приоритет в sitemap.xml | 8% |
| В robots.txt нет ссылки на sitemap.xml | 8% |
| Ссылки на картинки в sitemap.xml | 4% |
| В sitemap.xml неверно проставлена дата обновления страницы | 4% |
| В sitemap.xml неверно проставлена частота обновления страницы | 4% |
| Нельзя редактировать мета-теги отдельно друг от друга, только пачкой по одному шаблону | 70% |
| Жесткие ограничения на редактирование страниц | 68% |
| Нельзя редактировать меню на отдельной странице | 54% |
| XSS-уязвимость поиска по сайту | 88% |
| Разделение сайта на страницы для людей и страницы для SEO | 76% |
| Объем неуникального контента на странице больше, чем уникального | 64% |
| Результаты поиска по сайту не закрыты от индексации | 60% |
| Страница заказа имеет свой URL для каждого товара | 36% |
| Календарь событий не лимитирован и может прокручиваться бесконечно в любую сторону | 22% |
| Несколько сайтов одной фирмы, у которых совпадают данные в справочниках и на сайте | 94% |
| Несколько сайтов одной фирмы с одинаковым контентом; | 76% |
| Несколько сайтов одной фирмы с одинаковыми контактными данными; | 64% |
| Несколько сайтов одной фирмы с одинаковым названием организации; | 60% |
| Несколько сайтов одной фирмы, зарегистрированных на одного человека | 36% |