·

Web Crawler TombaPublicWebCrawler

Informações sobre TombaPublicWebCrawler, nosso robô de indexação web que coleta dados de contato comercial públicos respeitando robots.txt.

TombaPublicWebCrawler

Nosso web crawler indexa informações de contato comercial publicamente disponíveis de sites em toda a Internet.

Detalhes Técnicos

robots.textile
Version: 3.0
Obeys Robots.txt: Yes
User-Agent: Mozilla/5.0 (compatible; TombaPublicWebCrawler/3.0; +https://tomba.io)

O que é TombaPublicWebCrawler?

TombaPublicWebCrawler é um robô de indexação para nosso mecanismo de busca de contatos comerciais. Semelhante a como o Google indexa páginas da web, nosso crawler varre fontes online publicamente disponíveis para descobrir informações de contato profissionais.

Nossa tecnologia processa:

  • Sites corporativos
  • Comunicados de imprensa
  • Serviços de notícias eletrônicas
  • Diretórios comerciais públicos
  • Perfis profissionais

Usando processamento avançado de linguagem natural, construímos um banco de dados abrangente de profissionais de negócios e suas informações de contato.

O que o Crawler Faz?

O crawler:

  • Visita apenas páginas da web publicamente acessíveis
  • Extrai informações de contato comercial
  • Indexa endereços de e-mail profissionais
  • Respeita todas as restrições de acesso

Importante: Analisamos apenas páginas da web públicas. Nenhum conteúdo privado ou autenticado é acessado.

Conformidade com Robots.txt

Sim, respeitamos rigorosamente robots.txt.

Honramos as diretivas Disallow e Allow. Nosso crawler lê o arquivo robots.txt antes de acessar qualquer página do seu site.

Controlando o Crawler

Ajustar a Frequência de Crawling

Para definir um atraso mínimo entre solicitações, adicione ao seu robots.txt:

robots.textile
User-agent: TombaPublicWebCrawler
Crawl-Delay: [segundos]

Substitua [segundos] pelo tempo de atraso preferido.

Bloquear o Crawler

Para impedir que o TombaPublicWebCrawler visite seu site completamente:

robots.textile
User-agent: TombaPublicWebCrawler
Disallow: /

Notas Importantes

  • As alterações no robots.txt podem levar tempo para serem detectadas
  • Erros de sintaxe no robots.txt podem impedir a análise correta
  • O crawler continuará o comportamento anterior se as diretivas não forem reconhecíveis

Saiba Mais

Para mais informações sobre formato e uso de robots.txt:

Perguntas ou Preocupações?

Se você acredita que o TombaPublicWebCrawler está se comportando mal no seu site, ou se tiver perguntas:

E-mail: support@tomba.io

Levamos todos os relatórios a sério e investigaremos prontamente.

Comece a encontrar emails verificados hoje

Junte-se a mais de 150.000 profissionais que confiam na Tomba para dados de contato precisos. Sem cartão de crédito.