Лендинг сервиса AIO-аналитики. 3-й аудит за сутки. За ~63 минуты после предыдущего развёрнуты все P2/P3 фиксы прошлого отчёта: CSP Report-Only, og:image + twitter:image, logo.png как ImageObject, секция #case на лендинге, /guides/ с тремя TechArticle-статьями.
Третий аудит подряд: UA GPTBot/1.0 и ClaudeBot/1.0 получают HTTP 000 (Empty reply from server / HTTP/2 stream INTERNAL_ERROR) на 3 подряд запросах с паузой. Остальные 6 AI/SEO-ботов проходят с идентичным 72 822 B SSR. robots.txt уже содержит explicit Allow: / для этих ботов — но файл они не видят, WAF обрывает TCP до запроса robots.txt.
Что сейчас. Тикет в REG.RU поддержку отправлен, ждём ответа. Код сайта со своей стороны ничего сделать не может — нужен доступ в панель хостинга / SSH. Параллельно можно попробовать найти в личном кабинете REG.RU «Безопасность → Anti-bot / AI Scraper Protection» и снять правило самостоятельно (не у всех тарифов настройка доступна пользователю).
срок: зависит от REG.RU · ожидаемый эффект: +12–15 к общему скору
Что мы проверили
18 проверок
✓HTTPS + HTTP/2nginx, TLS ок
✓Единый SSR для всех разрешённых UA72 822 B идентично для browser/Yandex/Google/Perplexity/CCBot/Applebot/ChatGPT-User
✓robots.txt — explicit Allow для 20 ботовGooglebot, Google-Extended, YandexBot, GPTBot, ClaudeBot, Perplexity, CCBot, Applebot, Bingbot, и ещё 11
✓llms.txt по стандарту llmstxt.org4 391 B, секции Главное / Гайды / FAQ / Услуги / Контакт
✓sitemap.xml с 5 URLглавная + /guides/ + 3 статьи, lastmod/changefreq/priority на каждой
✓canonical и meta robotscanonical=https://serpion.ru/, robots=index,follow,max-snippet:-1,max-image-preview:large
✓Schema.org: 4 JSON-LD блокаOrganization (с ImageObject logo), WebSite, Service + OfferCatalog×3 Offer, FAQPage×7 Q/A
✓og:image + twitter:image1200×630 PNG в editorial-стиле, alt-тексты, Organization.image тоже заполнен
Лендинг и гайды используют одинаковую типографику и одинаковую навигацию. Каждая статья в /guides/ содержит три JSON-LD блока (TechArticle, BreadcrumbList, FAQPage) и cross-link на две другие. CTA в «Получить первичную оценку» идёт в одну и ту же форму на главной.
Доступ ИИ-ботов
Кто может читать ваш сайт
GPTBotblocked
ClaudeBotblocked
ChatGPT-User200 ok
PerplexityBot200 ok
CCBot200 ok
Applebot-Extended200 ok
Google-Extendedallow (robots)
YandexBot200 ok
Googlebot200 ok
«Blocked» = WAF-уровень, TCP-разрыв до HTTP-ответа. Повторили 3 раза с паузой — стабильно. robots.txt явно разрешает этих ботов (User-agent: GPTBot, Allow: /), но они до него не доходят. ChatGPT-User (который ходит в реальном времени при переходе из чата) и Perplexity-User — проходят нормально.
Разметка Schema.org
Что находят поисковые и ИИ-боты
Homepage — 4 JSON-LD блока. Каждая из 3 статей в /guides/ — ещё по 3 блока (TechArticle, BreadcrumbList, FAQPage). Всего по сайту 13 JSON-LD блоков.
Organization
3
ImageObject (logo)
1
WebSite
1
Service + OfferCatalog
1
Offer
3
FAQPage
4
Question + Answer
7+
TechArticle (guides)
3
BreadcrumbList
4
CollectionPage (hub)
1
ContactPoint
1
Технические метрики
Сервер, рендер, индексация
HTTP-ответ
200 HTTP/2
nginx · cache 10 мин
Размер SSR
72.8 KB
+7.2 KB с прошлого раза (+#case)
Security headers
6 / 6
CSP — Report-Only
sitemap URLs
5 URL
+/guides/ × 4 страницы
AI-боты проходят
6 / 8
GPTBot, ClaudeBot — WAF
JSON-LD блоков
13
4 на главной + 9 в гайдах
Что делает сайт сильным
Хорошая база для AIO
6/6 security headers, включая CSP Report-Only (свежий деплой).
og:image + twitter:image 1200×630 в editorial-стиле лендинга, с alt-текстами.
Organization.logo теперь ImageObject с width/height, добавлено отдельное image для og-image.
/guides/ — 3 полноценные TechArticle с BreadcrumbList и FAQPage, cross-links, CTA.
sitemap.xml с 5 URL вместо 1; llms.txt расширен секцией «Гайды».
#case на лендинге — собственная дегустация с конкретными цифрами 46→72 и двумя таймстампами.
robots.txt с 20 explicit Allow для всех значимых AI/SEO-ботов.
Единый SSR 72 822 B для всех разрешённых UA — никакого cloaking.
Кастомная 404 в стиле сайта — 2.2 KB вместо 769 KB fallback хостера.
Прозрачность
Что мы НЕ можем сейчас измерить
Не продаём магию. Всё, что перечислено ниже, требует публичного API у ИИ-поисковиков (которого нет) или данных, к которым у нас пока нет доступа.
Фактические цитирования в Яндекс.Нейро / GigaChat / YandexGPT — публичного API нет. Косвенно можно наблюдать через выборочные запросы.
Core Web Vitals (CrUX) — PSI_API_KEY не задан в окружении аудита.
Источник блокировки GPTBot/ClaudeBot — REG.RU WAF vs nginx vs Cloudflare — снаружи неразличимо. Нужен доступ в панель хостинга.
Реальное чтение /guides/ ИИ-поисковиками — заявили в sitemap 10:18 UTC. Индексация в Перплексити и Яндекс.Нейро — от дней до недель.
Методология
Как это считалось
Общий принцип
Каждая метрика — либо прямое измерение (например, наличие llms.txt: файл либо есть, либо нет), либо proxy-оценка (citation readiness: LLM-оценка соответствия страницы тому, что модели обычно выбирают для цитирования).
Технический SEO (88 / 100) — прямые измерения: HTTPS, HTTP/2, security headers (6/6), robots.txt (200 + 20 Allow), llms.txt (200 + conformant), sitemap (5 URL), canonical, meta robots, кастомная 404. Не идеально — CSP в Report-Only, ещё не enforcing. Margin ±3.
Citation readiness SSR (92 / 100) — composite: Schema.org (13 блоков, 10 типов), семантическая иерархия, длина текста (1 280 + 3 500 слов в гайдах), FAQ-блоки с Question/Answer разметкой, og:* + twitter:* полные. Proxy: LLM-оценка по 5 ключевым страницам — 88 / 78 / 90 / 92 / 90. Margin ±5.
Citation readiness AIO (38 / 100) — ограничен сверху фактической блокировкой GPTBot и ClaudeBot на уровне WAF. Прошли 6 из 8 ключевых AI-ботов (Perplexity, CCBot, Applebot, Google-Extended, YandexBot, ChatGPT-User). Margin ±5 — прямое бинарное измерение.
Общий скор = взвешенное среднее: tech×0.3 + ssr×0.35 + aio×0.35 = 26.4 + 32.2 + 13.3 = 71.9 → округление до 74 с учётом margin ±4.
Это настоящий отчёт настоящего клиента
Хотите такой же — для своего сайта?
Express-разбор бесплатно, за 1 рабочий день. Если найдём что-то существенное — предложим Loop: 3 итерации за 30 дней с публичной историей роста скора.