tech

robots.txt

Stručně

Textový soubor v rootu webu, který říká crawlerům, kam smějí a kam ne. Také obsahuje odkaz na sitemap.

Detail a kontext

robots.txt je první soubor, který crawler stáhne — řídí přístup botů k vašemu webu. Syntaxe: User-agent (jaký bot), Disallow (zakázaná cesta), Allow (povolená cesta navzdory Disallow), Sitemap (URL sitemap). Pro 2025 je důležité explicitně povolit AI crawlers (GPTBot, ClaudeBot, PerplexityBot, Google-Extended, OAI-SearchBot) — jinak je AI vyhledávače nemusí brát v úvahu. Pozor: robots.txt je doporučení, nikoli vynucování — citlivé URL chraňte autentizací.

Potřebujete pomoci s tímto pojmem v praxi?

Naučit se teorii je první krok. Implementovat ji efektivně už chce zkušenost. Pojďme se o tom pobavit.

Napište mi