·

Rastreador Web TombaPublicWebCrawler

Información sobre TombaPublicWebCrawler, nuestro robot de indexación web que recopila datos de contacto empresarial públicos respetando robots.txt.

TombaPublicWebCrawler

Nuestro rastreador web indexa información de contacto empresarial públicamente disponible de sitios web en todo Internet.

Detalles Técnicos

robots.textile
Version: 3.0
Obeys Robots.txt: Yes
User-Agent: Mozilla/5.0 (compatible; TombaPublicWebCrawler/3.0; +https://tomba.io)

¿Qué es TombaPublicWebCrawler?

TombaPublicWebCrawler es un robot de indexación para nuestro motor de búsqueda de contactos empresariales. Similar a cómo Google indexa páginas web, nuestro rastreador escanea fuentes en línea públicamente disponibles para descubrir información de contacto profesional.

Nuestra tecnología procesa:

  • Sitios web corporativos
  • Comunicados de prensa
  • Servicios de noticias electrónicas
  • Directorios empresariales públicos
  • Perfiles profesionales

Utilizando procesamiento avanzado de lenguaje natural, construimos una base de datos completa de profesionales de negocios y su información de contacto.

¿Qué Hace el Rastreador?

El rastreador:

  • Visita solo páginas web públicamente accesibles
  • Extrae información de contacto empresarial
  • Indexa direcciones de correo electrónico profesionales
  • Respeta todas las restricciones de acceso

Importante: Solo analizamos páginas web públicas. No se accede a contenido privado o autenticado.

Cumplimiento de Robots.txt

Sí, respetamos estrictamente robots.txt.

Honramos las directivas Disallow y Allow. Nuestro rastreador lee el archivo robots.txt antes de acceder a cualquier página de su sitio web.

Controlar el Rastreador

Ajustar la Frecuencia de Rastreo

Para establecer un retraso mínimo entre solicitudes, agregue a su robots.txt:

robots.textile
User-agent: TombaPublicWebCrawler
Crawl-Delay: [segundos]

Reemplace [segundos] con su tiempo de retraso preferido.

Bloquear el Rastreador

Para evitar que TombaPublicWebCrawler visite su sitio completamente:

robots.textile
User-agent: TombaPublicWebCrawler
Disallow: /

Notas Importantes

  • Los cambios en robots.txt pueden tardar en ser detectados
  • Los errores de sintaxis en robots.txt pueden impedir el análisis correcto
  • El rastreador continuará el comportamiento anterior si las directivas no son reconocibles

Más Información

Para más información sobre el formato y uso de robots.txt:

¿Preguntas o Inquietudes?

Si cree que TombaPublicWebCrawler se comporta mal en su sitio web, o si tiene preguntas:

Correo electrónico: support@tomba.io

Tomamos todos los informes en serio e investigaremos de inmediato.

Empieza a encontrar emails verificados hoy

Únete a más de 150.000 profesionales que confían en Tomba para datos de contacto precisos. Sin tarjeta de crédito.