Respuestas de Google: ¿Es posible controlar el rastreo a través de solicitudes de API?

Un profesional de SEO le preguntó a John Mueller durante una reunión sobre cómo controlar el rastreo de Google de su sitio mediante solicitudes de API.

Su pregunta fue: Entonces, tienen una plataforma de compras en vivo como su sitio web, y su sitio actualmente gasta alrededor del 20 por ciento del presupuesto de rastreo en el subdominio API y otro 20 por ciento en miniaturas de imágenes de videos.

Ninguno de los subdominios tiene contenidos que formen parte de su estrategia SEO. ¿Deberían impedir que estos subdominios se rastreen más?

¿Cómo se descubren y/o utilizan los puntos finales de API?

John explicó que los puntos finales de API terminan siendo utilizados por JavaScript en Google y representarán sus páginas.

Y si acceden a una API que está en un sitio, Google intentará cargar el contenido de esa API y usarlo para representar la página.

Además, dependiendo de cómo esté configurada su API y cómo esté configurado su JavaScript, puede ser difícil para Google almacenar en caché los resultados de la API. Esto significa que tal vez Google rastrea muchas de estas solicitudes de API para intentar obtener una versión renderizada de sus páginas para poder usarlas para la indexación.

Así que este suele ser el lugar donde se descubre esto. Y eso es algo en lo que usted puede ayudar, asegurándose de que los resultados de la API también se puedan almacenar en caché.

Leer:  Errores críticos en los informes de SEO que debes evitar

Por lo tanto, no inyecta ninguna marca de tiempo en las URL.

Por ejemplo, cuando usas JavaScript para la API, todas esas cosas están ahí. Si no le importa el contenido que se devuelve con estos puntos finales de API, entonces, por supuesto, puede bloquear este subdominio para que no se rastree con robots.txt.

Y eso bloqueará todas esas solicitudes de API. Entonces, eso es algo en lo que, en primer lugar, debe determinar si estos resultados de API son parte del contenido principal o es contenido crítico importante que desea que Google indexe.

Y si es así, quizás no deberías bloquear el rastreo. Pero si esto es algo que genera algo que es casi secundario para sus páginas, o cualquier cosa que no sea crítica para sus páginas en sí, entonces podría valer la pena volver a verificar cómo se ve cuando están bloqueadas.

Transcripción del Hangout de John Mueller

Juan (pregunta)
Bien, la siguiente pregunta que tengo aquí es de Van Song. Nuestro sitio es una plataforma de compras en vivo. Nuestro sitio actualmente gasta alrededor del 20% del presupuesto de rastreo en el subdominio API y otro 20% en miniaturas de imágenes de videos. Ninguno de estos subdominios tiene contenido que forme parte de nuestra estrategia SEO. ¿Deberíamos impedir el rastreo de estos subdominios? ¿O cómo se descubren o utilizan los puntos finales de la API?

Leer:  Usando formularios de Google con WordPress

Juan (Respuesta)
Entonces, tal vez la última pregunta sea la primera. En muchos casos, los puntos finales API terminan siendo utilizados por JavaScript en nuestro sitio web y representaremos sus páginas. Y si acceden a una API que está en su sitio web, intentaremos cargar el contenido de esa API y usarlo para representar la página. Y dependiendo de cómo esté configurada su API y de cómo esté configurado su JavaScript, es posible que nos resulte difícil almacenar en caché esos resultados de la API, lo que significa que tal vez rastreemos muchas de estas solicitudes de API para intentar obtener una representación. versión de sus páginas para que podamos utilizarlas para la indexación. Así que ese suele ser el lugar donde se descubre esto.

Y eso es algo en lo que puede ayudar asegurándose de que los resultados de la API también se puedan almacenar en caché correctamente, de que no inyecte ninguna marca de tiempo en las URL. Por ejemplo, cuando usas JavaScript para la API, todas esas cosas están ahí. Si no le importa el contenido que se devuelve con estos puntos finales de API. Luego, por supuesto, puede bloquear todo este subdominio para que no sea rastreado con el archivo robots.txt. Y eso esencialmente bloqueará todas esas solicitudes de API. Entonces, eso es algo en lo que, primero que nada, debes averiguar si estos resultados de API son realmente, como parte del contenido principal o contenido crítico importante que quiero que Google indexe.

Leer:  Cómo eliminar su información personal de la Búsqueda de Google

Y si es así, probablemente no deberías bloquear el rastreo. Pero si esto es algo que esencialmente genera algo que es casi secundario para sus páginas, o cualquier cosa que no sea crítica para sus páginas en sí, entonces podría valer la pena volver a verificar cómo se ve cuando están bloqueadas. Y una forma de verificar esto es si pudiera crear una página de prueba separada que no llame a la API o que use una URL rota para el punto final de la API. Y con eso puedes ver cómo se representa realmente esta página en mi navegador. ¿Cómo se representa para Google? Entonces esas son las cosas que miraría allí.

Nuevas Publicaciones:

Recomendamos