¿Cómo se puede bloquear contenido de la Búsqueda de Google?

En este episodio del podcast Off The Record de la Búsqueda de Google, los empleados de Google John Mueller, Gary Illyes y Lizzi Sassman analizan cómo se puede bloquear contenido de la Búsqueda de Google.

Lizzi 0:10
Hola, hola y bienvenido a otro episodio de Search Off the Record, un podcast del equipo de Búsqueda de Google en el que se analiza todo lo relacionado con la búsqueda y tal vez se divierte un poco a lo largo del camino. Mi nombre es Lizzie. Y hoy me acompañan otras personas del equipo de Búsqueda de Google, Gary y John. Hola gary. No. Hola, John.

Juan 0:28
Hola Lizzie. Genial estar aquí.

Lizzi 0:30
Gracias. Vaya, que bienvenida. Así que hoy pensé que podríamos hablar sobre bloquear contenido de la búsqueda. Porque sabes qué, publiqué este sitio web, es posible que hayas oído hablar de él, tal vez en el último episodio, machoguy.com. Se lo pedí a otra persona aquí. Y ahí está.

Gary 0:50
Oye, espera, espera, espera, ¿qué? Ese es mi sitio web.

Lizzi 0:53
No, es mi sitio web.

Gary 0:55
No, estoy más seguro. Ese es mi sitio web.

Lizzi 0:56
Estoy bastante seguro de que soy el macho. Sí. Porque yo… ¿sabes qué? Busqué esta receta que publiqué. Y aparece en la búsqueda. Y en realidad no quiero que otras personas lo vean. Y me preguntaba qué debería hacer.

Gary 1:13
¿Qué, por qué lo publicaste?

Lizzi 1:14
Bueno, quería que algunas personas lo vieran. Quizás solo los súper seguidores, como un pequeño grupo de personas porque es la receta secreta y no quiero que se corra la voz ampliamente. Quizás sólo 20 personas deberían verlo.

Gary 1:25
Qué, pero soy tu súper seguidor. Bueno, estoy súper.

Lizzi 1:29
Oh, pero no eres mi seguidor.

Juan 1:30
Me gusta la sopa.

Gary 1:31
A veces.

Lizzi 1:33
Esto va bien.

Gary 1:35
Bien bien. Bueno. Entonces, ¿has considerado eliminar la página?

Lizzi 1:39
Bueno, no quiero eliminarlo. Es una receta importante sobre cómo hacer una taza de matcha realmente deliciosa. Así que realmente no quiero eliminarlo por completo. ¿Hay algo más que pueda hacer?

Gary 1:48
Pig Latin, escríbelo en Pig Latin. Escribir la receta en Pig Latin y así…?

Lizzi 1:55
¿Escribir la receta en cerdo latino? Pero mis súper seguidores no conocen Pig Latin, lamentablemente.

Gary 1:56
Espera, ¿cómo sabes eso?

Lizzi 1:57
Ah, porque hice una encuesta.

Gary 1:58
Interesante.

Lizzi 1:59
Sí.

Gary 2:00
Tienes encuestas interesantes. ¿Cómo es que no recibí esa encuesta?

Lizzi 2:03
Bueno, tal vez no seas mi súper seguidor.

Gary 2:05
Bueno, eso ya lo establecimos. Soy super.

Lizzi 2:06
Eso es cierto. Pero no necesariamente mi seguidor.

Gary 2:09
Oh eso. Sí es cierto. Me olvidé de esa parte.

Juan 2:12
Eso es complicado, hombre. ¿Bien? No sé.

Gary 2:15
¿Qué tal cómo, espera, espera, espera, qué tal si son tan súper tus seguidores? Quiero decir, tal vez puedan recordar una contraseña. Y luego puedes poner todo detrás de una contraseña.

Lizzi 2:26
Eso suena como una buena idea. ¿Pero qué pasa si no recuerdan la contraseña? O realmente no tengo esa página, como una especie de configuración de página de inicio de sesión. ¿Existe otra opción que pueda considerar?

Juan 2:37
Las contraseñas son muy molestas, como si alguien pudiera estar engañando al súper seguidor y luego mirar en secreto tu receta de matcha.

Lizzi 2:47
Además, estoy de acuerdo con que si mis súper seguidores se lo envían a su familia, estaría bien. Por lo tanto, deberían poder compartir el enlace sin que los miembros de su familia inicien sesión. Entonces habrá una manera de que tal vez no esté protegido con contraseña, pero no aparezca en la búsqueda. No quiero a cualquiera.
Gary 3:06
Espera, espera, espera, espera, tuve una idea. Bueno. ¿Qué tal robots.txt? ¿Qué es eso? Tuvimos un episodio sobre Oh, tienes razón…

Lizzi 3:13
Estuve en ese episodio. No sé por qué hice esa pregunta.

Juan 3:17
Dios mío. Bueno. Así que cuéntanos más. Gary, ¿qué haces? ¿Te gusta robots.txt en todo el sitio y luego esa página desaparece?

Gary 3:25
¿De qué están hablando ustedes dos? ¿Qué está pasando? Como si uno estuviera escribiendo documentación. El otro estaba escribiendo documentación sobre robots.txt. Y ahora me haces estas preguntas raras. No me gusta estar aquí. Quiero irme.

Juan 3:39
Vaya, tenemos suerte de que estés aquí.

Gary 3:42
Bueno, entonces, ¿qué haces con robots.txt? Limitas lo que los rastreadores pueden hacer en tu sitio web, ¿verdad?
Entonces podrías poner algo como, hola, robot de Google, no rastrees esta URL. Y luego el robot de Google no rastreará esa URL. Entonces definitivamente podrías hacer eso en tu archivo robots.txt, como no permitir dos puntos y luego la ruta a la URL. ¿O esa es la mejor parte de la URL donde publicas esa receta que me robaste? Sí, es una historia real. Era 1897. Y hice esta receta, este matcha latte.

Lizzi 4:16
Quizás por eso no quiero que lo encuentren en la búsqueda. No quería que descubrieras que robé tu receta, ¿verdad?

Gary 4:22
Sí. Y acabas de admitirlo. De todos modos, entonces robots.txt.

Lizzi 4:27
Bueno. Bien, simplemente subiría robots.txt a mi sitio y no permitiría el rastreo de esta página web para la receta en mi sitio, y eso estaría perfectamente bien. ¿Existe algún escenario en el que no quisiera hacer esto, como si me estuviera perdiendo algo?

Gary 4:42
Quiero decir, con robots.txt limitas el rastreo, no limitas la indexación. Pero en la gran mayoría de los casos eso será suficiente. Pero entonces, si su receta se vuelve muy popular, por ejemplo, y muchas personas se vinculan a ella, es posible que aún indexemos la URL, pero no el contenido de la página. Y en esos casos, esa receta aún podría aparecer en la búsqueda sin descripción, por ejemplo, sin el fragmento web. Google deduciría un enlace de título a partir de los textos de anclaje que apuntan a su página, por ejemplo.

Lizzi 5:20
Veo. Bien, si mi página se volvió muy popular, el resultado seguirá apareciendo. Eso no significa que no se bloqueará en la búsqueda de Google. Si no permito esta receta en mi archivo robots.txt, no es a prueba de fallos.

Gary 5:33
No es completamente seguro, pero nuevamente, en la gran mayoría de los casos, simplemente funcionará.

Lizzi 5:38
Bueno. Entonces, si quisiera un método a prueba de fallos, ¿hay algo más que podría considerar?

Juan 5:42
¿Metaetiquetas de robots? Sí.

Lizzi 5:46
Sí. ¿Existe una metaetiqueta que pueda poner en mi página?

Juan 5:48
Ninguno, en realidad. Lo siento mucho.

Gary 5:54
Vaya, eso fue tan nerd. Ay dios mío. Oh, eso fue genial.

Juan 5:58
Básicamente, podrías usar la metaetiqueta robots noindex, pero también existe la metaetiqueta none robots, que es básicamente noindex más nofollow. Entonces…

Lizzi 6:09
Ah, entonces no puedes usar ninguno. Y eso es lo mismo que hacer noindex. Y no seguir. Interesante. Bueno. Entonces, ¿por qué querría utilizar noindex y nofollow?

Juan 6:19
No sé. Pero esa fue solo la abreviatura que se les ocurrió al principio, porque en algún momento, debieron haber pensado que HTML es un lenguaje de página tan conciso que debes guardar cada carácter. Entonces, en lugar de escribir noindex y nofollow, podrías simplemente escribir none. Y sería lo mismo.

Gary 6:40
Interesante. ¿Por qué no harían algo como el noveno? ¿Noveno noveno?

Juan 6:45
No sé. ¿Quizás deberíamos preguntarle a Larry o Sergey, o quién inventó eso?

Gary 6:51
Yo… probablemente Jeff, Jeff Dean, uno de los primeros ingenieros de Google.

Juan 6:54
Quiero decir, es un poco extraño, porque las páginas HTML son tan desordenadas y grandes en general, que ahorran un par de caracteres. ¿Qué va a cambiar eso? Pero de todos modos

Lizzi 7:06
¿La gente todavía usa la etiqueta none hoy en día?

Juan 7:09
¿Probablemente? No tengo ni idea. ¿Tienes algún número, Gary? ¿Más de siete?

Leer:  Cómo ver mensajes eliminados en Discord en 2024

Gary 7:14
Quiero decir, tengo números. Siete es uno de ellos. Pero dudo que la mayoría de ellos estén relacionados con esta pregunta.

Lizzi 7:21
Bueno. Así que déjame plantearte otra pregunta. Digamos que tengo muchas recetas en matchaguy.com. Y quiero asegurarme de que todos sean no indexados. ¿Hay alguna manera de hacer esto, a escala, como un generador o algo así?

Gary 7:38
Bien, ante todo. ¿Has considerado que estás publicando mal?

Lizzi 7:43
Potencialmente, pero esto es para este escenario real, muy real, del podcast.

Juan 7:50
Entonces, ¿no quieres que la mayoría de tus páginas se muestren en la búsqueda? O…

Lizzi 7:54
Supongo que esto es como un mal ejemplo. Crees que sí.

Juan 7:58
¿O tal vez simplemente no? Muy bien. Conocemos nuestro–

Lizzi 8:02
Muy bien, ¿me dijiste que querías que te preguntara sobre los generadores? ¿En qué caso la gente querría generar metaetiquetas para ellos? Oh. Supongo.

Juan 8:09
Bueno. Sí. Entonces, especialmente en los primeros días, cuando la gente escribía HTML ellos mismos, en muchos casos, no sabías realmente qué metaetiquetas usar. Entonces es algo así como que estos extraños motores de búsqueda no tenían documentación fantástica en ese momento. Y varios blogs estaban interpretando las posibles metaetiquetas que había. Y todo el mundo era como copiar cosas de otras personas. Solía ​​haber, y probablemente todavía los hay, estos sitios que generarían metaetiquetas para usted. Básicamente, vas allí, ingresas las palabras clave que están en tu página y luego se creará un conjunto de metaetiquetas que puedes simplemente copiar y pegar en tus páginas. Entonces, incluso si no supieras realmente qué hacen todas estas metaetiquetas, podrías colocar varias en tus páginas. Y creo que lo extraño es que probablemente la mayoría de las metaetiquetas mencionadas allí podrían ser técnicamente correctas, pero no tienen ninguna funcionalidad. Entonces, cosas como que podrías mencionar la ubicación de tu servidor web en una metaetiqueta, o podrías mencionar el nombre del autor de la página en una metaetiqueta, pero no sale nada útil de ello. Entonces, irás a los sitios y los generadores de metaetiquetas dirán, oh, sí, tengo 27 metaetiquetas que puedo generar para ti. Y, por supuesto, eso sería mejor que el generador de metaetiquetas que acaba de generar cinco metaetiquetas. Así que copias esas 27 metaetiquetas en tus páginas y esperas que no causen ningún problema, porque realmente no sabes lo que están haciendo.

Gary 9:46
Sí, creo que en aquellos casos en los que desea que una gran parte de su sitio no se indexe y realmente desea seguir el camino de proteger con contraseña esos directorios, por ejemplo, u organizar su sitio en una estructura más lógica donde puedes poner cosas que no quieras indexar en un directorio específico. Y luego puedes usar, por ejemplo, módulos Apigee o módulos edgings. No creo que sean módulos, no sé como se llaman. Para diseñar estas configuraciones, se aplicará noindex a cada URL bajo un patrón o bajo un prefijo como el prefijo de URL. Sin embargo, eso es muy técnico, mucho más técnico que HTML o robots.txt, los cuales están bien, especialmente robots.txt, que tiene una sintaxis extremadamente simple. Pero en la gran mayoría de los casos, probablemente puedas obtener ayuda de tu proveedor de alojamiento, como contactar al soporte y simplemente preguntarles cómo hacerlo. Además, si está utilizando una plataforma de alojamiento, como la que utiliza el software Administrador de servidores como cPanel, puede establecer estas configuraciones allí.

Juan 10:53
Eso suena muy complicado. Es como. Lo hace. Simplemente haz todo esto. No sé física complicada, que en realidad es bastante fácil.

Gary 11:02
Comparado con la mecánica cuántica, por ejemplo, es súper sencillo.

Juan 11:06
Bueno, para ti, tal vez. Muy bien, todos, si tienen preguntas sobre cómo bloquear la mitad de su sitio web, comuníquese con Gary.

Gary 11:14
Sí, estoy en Twitter en el método e. Supongo,

Juan 11:17
Hoy en día, para muchos sitios, usarías tu CMS, como WordPress, o cualquier plataforma de alojamiento que tengas. Y supongo que solo tienes una opción para proteger con contraseña páginas individuales. Quizás eso sería suficiente.

Lizzi 11:35
¿Y luego CMS se asegura de que esas páginas de inicio de sesión no aparezcan en la búsqueda? ¿O cómo funcionaría eso? ¿Todavía tienes que preocuparte de que no aparezca la página de inicio de sesión real?

Juan 11:44
No he visto ningún problema por eso. Así que supongo que probablemente simplemente funcione. Pero ni idea. Quiero decir, una cosa que puedes hacer para verificarlo es abrirlo en una ventana de incógnito y luego mirar el código fuente. Y no es 100% exactamente lo que el robot de Google podría ver en algunos casos, pero al menos puedes verificar para ver si hay una metaetiqueta de robots allí o no. ¿Y dice noindex o none?

Gary 12:09
Entonces, en el tema de la página de inicio de sesión, a veces realmente desea que se indexe una página de inicio de sesión, porque, por ejemplo, si tiene un portal de banca en línea y tiene una página donde los clientes pueden iniciar sesión, es muy probable que la gente De hecho, busque esa página, como cómo iniciar sesión en mi banca electrónica o lo que sea. Y en esos casos, definitivamente no desea que la página de inicio de sesión no esté indexada. Entonces quieres que esté indexado. Para que la gente pueda encontrar la página de inicio de sesión. Recuerdo que hace unos años, el banco local, o el banco que uso, por cualquier motivo, decidieron que querían poner un noindex en su página de inicio de sesión. Y luego tenías que pasar por estos obstáculos para llegar a la página de inicio de sesión, como ir a la página de inicio, y luego hacer clic en otro enlace que te lleva al portal de banca electrónica. Y luego, desde el portal de banca electrónica, hace clic en otra cosa que abrirá el cuadro de diálogo modal de inicio de sesión. Y eso se sintió simplemente mal. Porque en realidad sólo quiero iniciar sesión en mi cuenta bancaria. Y no necesariamente quiero ver la mitad de su sitio web para hacer eso. Entonces, en esos casos, probablemente desee permitir el índice de páginas de inicio de sesión. Además, si tienes seguidores de retiro o como se llamen, es posible que quieran lo mismo, básicamente, cómo o dónde puedo iniciar sesión, para poder ir a mi perfil de miembro o lo que sea.

Juan 13:32
Entonces, supongo que si la mayor parte de su contenido está detrás de un inicio de sesión, entonces al menos algo debería estar indexado. Sería incómodo si todo lo relacionado con matchaguy no estuviera indexado, porque entonces la gente no podría encontrarlo en absoluto en la búsqueda.

Lizzi 13:48
Bueno, supongo que tengo otro escenario que puede ser más relevante. Tenemos en una Z, nuestro sitio central de búsqueda de Google, el nombre con el que llamamos a ese sitio una Z. Tenemos muchas publicaciones de blog allí, que se remontan a 2007. Lo cual pensé que tal vez sería una buena idea. a no indexar algunas de las páginas de forma selectiva si pensara que, oye, esta página está desactualizada, realmente no queremos que las personas encuentren eso en la búsqueda, cuando busquen, digan Contenido duplicado o algo como “¿qué hace Google?”. ¿La búsqueda dice sobre contenido duplicado? Y podríamos tener 15 páginas sobre este tema. ¿Sería una buena idea no indexar selectivamente esas páginas realmente antiguas que tal vez deberían poder encontrarse con fines históricos, pero no son necesariamente la respuesta más actualizada sobre un tema determinado?

Gary 14:46
Creo que esto me trae pesadillas. Recuerdo nuestra discusión sobre este tema tan largo, demasiado largo, así que nunca quiero… no, eso es demasiado duro. ¿Rara vez quiero contenido fuera de la búsqueda? Por ejemplo, si tuviéramos un blog, por ejemplo, y en 2001 publicáramos buen contenido allí, entonces esperaría que eso existiera prácticamente para siempre. Y esto resulta útil cuando, como en este podcast, por ejemplo, hacemos bastante arqueología en Internet, donde intentamos encontrar, por ejemplo, cuándo fue el primer encuentro con la herramienta X o lo que sea. Y para ese propósito, creo que es excelente. Lo que nos gustaría hacer en un Z con un blog es usar rel canonical básicamente para crear un grupo y apuntar a una página canónica, como administrar contenido duplicado o lo que sea de las publicaciones del blog que tal vez ya no sean tan relevantes. Incluso en esos casos, a veces es complicado, porque con una publicación de blog, podemos ser mucho más detallados y conversadores que con la documentación de búsqueda. Y a veces, eso también significa que podemos dar más ejemplos, podemos ser más o menos corporativos, incluso, especialmente en los primeros días, podemos ser mucho más o menos corporativos, lo que significa que algunas personas pueden entender las cosas mejor o más fácilmente. Y para ese propósito, realmente me gustaría que las cosas estuvieran en el índice, pero tal vez señalar con un banner a la página canónica.

Leer:  Google explica qué pueden hacer los profesionales de SEO si pierden la clasificación de su marca

Juan 16:29
De modo que podríamos aprovechar las sinergias del contenido del archivo.

Lizzi 16:33
Sinergias…

Gary 16:35
¡Hablado como un verdadero gerente!

Lizzi 16:37
Archivo, esa es otra palabra que está en la documentación de la metaetiqueta, sin archivo, ¿cuándo usaría esa metaetiqueta?

Gary 16:45
Sí. Juan, ¿cuándo? Vaya, ¿archivo?

Juan 16:48
Sí, realmente no sé de dónde viene específicamente el nombre. Porque no lo es, en realidad no se refiere al archivo en sí ni a realizar un proceso de archivo, es más bien que no mostraríamos una página de caché en los resultados de búsqueda. Y me imagino que los otros motores de búsqueda también lo llamaron de manera similar, es decir, la página de caché que a veces mostraban con ese pequeño enlace almacenado en caché en los resultados de búsqueda. Y con la metaetiqueta sin archivo, básicamente bloqueaste su aparición. Porque los motores de búsqueda para realmente indexar el contenido, tienen que mantener un archivo de la página internamente, sólo que no lo muestran externamente en casos como ese. Entonces está bien. Es casi como, no sé, algo así como una metaetiqueta de control de fragmentos, bloqueas la aparición de una parte específica del fragmento.

Lizzi 17:44
Interesante, ¿sería esto para páginas que son súper nuevas, como si solo queremos la versión más actualizada de esta página, como si el archivo no fuera útil para las personas? ¿Entonces solo el nuevo? ¿O eso no es correcto?

Juan 17:57
Creo que es solo para lo que la gente quiera hacer, ya sea si no quieren que se muestre una página de caché, por cualquier motivo, pueden bloquearla. He visto casos en los que eso sucede, cuando realmente quieren que la gente vaya al sitio web por cualquier motivo, o cuando tal vez el contenido en sí está detrás de un muro de pago o de inicio de sesión o algo así, donde tradicionalmente, los usuarios Tendría que pasar por algún tipo de proceso de inicio de sesión en el sitio web para obtener el contenido. Y solo quieren asegurarse de que la gente realmente cumpla con eso y no tenga este tipo de solución mirando la página de caché.

Lizzi 18:39
Mencionaste también nosnippet, que sería, supongo, otra forma de bloquear contenido cuando no necesariamente quieras bloquear toda la página. Pero tal vez quieras tener algún otro nivel de control de afinación.

Juan 18:54
Sí, supongo que es como en el caso de un sitio web de cocina o de recetas. Podrías, por ejemplo, tener algo en tu página que sea realmente exclusivo de una receta y que simplemente no quieras contarle a la gente con anticipación. Es como si tuvieras este ingrediente súper secreto que le pones al matcha, que podría ser, no sé, jengibre, pimienta o algo así. No lo sé, no sé qué ingredientes secretos pone la gente en el matcha. Pero podrías tener algo así. Y luego aún podrías tener mi receta secreta de matcha como título de una página. Y dentro del texto de la página, podrías mencionar, como los ingredientes secretos. Y si bloqueas la visualización de un fragmento, puedes evitar que Google muestre parte de la página como un fragmento en los resultados de búsqueda, lo que podría ayudarte a mantener tu secreto bajo las sábanas hasta que las personas hagan clic en tu sitio. sitio web. No lo sé, depende de lo que quieras hacer con él.

Gary 20:01
Y luego también tienes más control con los fragmentos, porque tienes, olvidé cómo se llama. Pero me gusta cuántos personajes quieres. El fragmento máximo. También para la imagen, creo que hay algo, la imagen de Max es algo.

Lizzi 20:15
Sí, tamaño máximo de imagen o algo así como una vista previa, como el tamaño que puede tener la imagen en la vista previa. Eso es algo interesante, porque no es como si estuviera impidiendo que Google indexe esa imagen. Es más como impedir que Google muestre el tamaño de la imagen o algo así.

Juan 20:31
Es, creo que es más bien algo en Google Discover donde verías eso, donde a veces tienes entradas que tienen esta imagen gigante en la parte superior. Y a veces tienes las miniaturas más pequeñas. Y si, por alguna razón, piensas que no quiero que se muestre una imagen grande porque la gente debería ir a mi página para ver mis imágenes grandes, entonces eso es algo que puedes configurar allí.

Gary 20:53
¿Qué más tenemos? ¿Tenemos nofollow? Por supuesto, por razones.

Juan 20:58
¿Qué hace bien el nofollow? ¿Dónde lo usarías en matchaguy, Gary?

Gary 21:02
Sí. Cuéntanos sobre los enlaces que compraste. ¿Qué? Lo sé, vi, vi el intercambio, había una persona sospechosa y ¿estabas intercambiando moneda con esa persona? Y sé que te dieron enlaces a cambio de esa moneda.

Juan 21:24
Bueno.

Gary 21:25
Cuéntanos sobre ello.

Juan 21:26
Entonces no seguiría a esa persona. Es como si en lugar de un súper seguimiento, no siguiera a la persona.

Gary 21:31
Ah, seguirá.

Juan 21:34
Oh sí sí.

Gary 21:33
No seguir.

Juan 21:34
Como puedes registrarte.

Gary 21:35
Obliterar seguir. De ninguna manera.

Lizzi 21:38
Entonces, ¿no seguir solo por esto, los enlaces que salen fuera de mi sitio?

Juan 21:43
Es para todos los enlaces de una página. Por ejemplo, supongo que la parte complicada es que la metaetiqueta de robots nofollow sería para todo lo que hay en la página. Y a nivel individual, no puedes seguir enlaces individuales.

Lizzi 21:56
Bueno. Pero, ¿qué pasa si me gusta vincularlo a otras recetas o algo así dentro de mi receta de matcha?

Juan 22:02
Está bien, así es la web. Como si vincularas otras recetas a sitios de otras personas. Creo que el problema sería que si alguien se acercara a usted y le dijera: Me gustaría comprar un anuncio en su sitio web, y usted lo vincula a su sitio web y lo intercambia como un anuncio, entonces agregaría un nofollow allí, y eso es algo así. esa situación turbia que Gary estaba insinuando.

Lizzi 22:28
En el que nunca participaría.

Gary 22:30
Sí, no estaba insinuando.

Lizzi 22:31
Estaba acusando. ¡Absolutamente, acusando!

Gary 22:35
Sólo estaba aludiendo a eso.

Juan 22:37
Bien, ¿entonces estás vendiendo enlaces? Entonces es…

Gary 22:39
Vale, espera, espera, espera, espera, espera, espera, espera, espera. Entonces, ¿puedo combinar noindex? ¿Sin seguimiento? ¿Y luego agregar un fragmento de información también? ¿Y un no archivo? ¿Y vista previa máxima de la imagen?

Juan 22:53
Seguro.

Gary 22:54
¿Y el tamaño máximo del fragmento? ¿Siete?

Juan 22:56
Por supuesto que puede. Pero quiero decir, no vas a ver nada. Entonces…

Gary 23:00
¿Puedo hacer una vista previa máxima de la imagen sin seguir? ¿Sin archivo y sin código?

Juan 23:06
Probablemente. Quiero decir, puedes hacer lo que quieras en tu último día.

Lizzi 23:10
Esto suena como un cuestionario.

Juan 23:14
Puedes hacer lo que quieras en tu sitio web. Es como la pregunta ¿qué hacen los motores de búsqueda?

Leer:  Cómo hackear el Instagram de alguien en 2024

Gary 23:19
Esperar. Ahora entiendo ¿por qué programaste ese uno a uno? ¿Conmigo? Estoy nervioso. Me callaré. ¿Cuántas combinaciones crees que podemos tener, John?

Juan 23:29
¿Todas las metaetiquetas de robots? Yo diría que más de siete.

Lizzi 23:32
¿Mas que 100?

Gary 23:33
Yo se la respuesta.

Lizzi 23:35
Tu sabes la respuesta. Esta es una pregunta con trampa.

Gary 23:38
Sé que conozco la respuesta. Porque John olvidó borrar esa línea de nuestro documento de planificación.

Lizzi 23:44
Oh sí.

Juan 23:45
Oh, no.

Lizzi 23:46
También puso la respuesta directamente en el texto. Ni siquiera tenías que hacer clic en el enlace para ver la respuesta John…

Juan 23:51
¿Puse la respuesta?

Gary 23:52
Y básicamente, está grabado en mi retina. 869 más uno más uno.

Juan 24:03
Bueno. Combinaciones de metaetiquetas de robots. Entonces, si quisiera utilizar todas las metaetiquetas de robots en un sitio web, tendría que crear al menos 870 páginas. Bueno. ¿Qué tienes planeado para el fin de semana?

Gary 24:17
Oh, tengo acceso a GPT-3. Así que lleva literalmente unos minutos.

Juan 24:22
Literalmente minutos para crear tantas metaetiquetas. Fresco.

Lizzi 24:26
¿Pero por qué? ¿Qué pasa si creamos nuevas metaetiquetas? ¿O qué pasa si se crean otros nuevos? ¿Es esto en el futuro?

Gary 24:32
Sí, John, cuéntanos sobre el futuro.

Lizzi 24:36
¿Se agregarán nuevas metaetiquetas?

Juan 24:38
Creo que eso siempre es complicado, porque entonces tendríamos que tener más combinaciones. Y luego Gary tendría que crear más páginas para su sitio de prueba.

Lizzi 24:49
No, pero eso es fácil. Cubrimos eso. ¿Unos minutos más? Sí.

Juan 24:54
Creo que sí. Al menos en el pasado, lo que he visto al hablar con los clientes potenciales en la búsqueda de Google es que a ellos realmente no les gusta tener nuevas metaetiquetas, porque hay muchos gastos generales con todo lo relacionado con las metaetiquetas. Entonces, tan pronto como agregamos algo nuevo, tenemos que prometer que lo respaldaremos durante un período de tiempo razonable. Tenemos que hacer toda la documentación, tenemos que hacer todas las implementaciones internamente. Y si es algo que está vinculado a una característica específica, donde no sabemos cuánto tiempo estará disponible esa característica, entonces es mucho… hay tantas dependencias allí que decimos, bueno, preferimos no tener nuevas metaetiquetas de robots.

Gary 25:38
Hola, John, John John. Sí. ¿Recuerdas rel=autor?

Juan 25:42
Rel=autor? Bueno, esa no es una metaetiqueta de robots. ¿Qué pasa con rel=siguiente? En general, todos estos mecanismos de control son súper útiles cuando son relevantes y cuando siguen siendo válidos por un período de tiempo más largo. Pero tan pronto como no puedes garantizar eso, o si haces algo que está vinculado a un conjunto de características muy, muy pequeño, entonces es muy complicado justificar todo el esfuerzo de hacer el trabajo de nuestra parte, la documentación. , explicándolo a todos externamente. Todos externamente se van y dicen, oh, sí, tal vez deberíamos implementar esto. Y planifican la implementación durante meses y meses. Y luego, si después de un par de años volvemos y decimos, bueno, en realidad desactivamos esa función, ahora también podemos desactivar la metaetiqueta robots, entonces se invierte mucho tiempo y esfuerzo en hacer algo que termine sin tener valor a largo plazo. Y eso es algo que tratamos de evitar; realmente queremos ayudar a la gente a hacer algo a largo plazo. Y obviamente nada es para siempre. Así que no es que podamos garantizar que las cosas vayan a durar para siempre. Pero debería ser algo autónomo y válido durante un período de tiempo más largo.

Lizzi 26:57
Bien, eso tiene sentido. Entonces podríamos, pero tal vez no, las puertas se abren, si el caso de uso demuestra que será útil durante un largo período de tiempo.

Juan 27:07
Sí, supongo que intentamos evitarlo. Pero no es que garanticemos que nunca fabricaremos otros nuevos porque estoy seguro de que los habrá. Algo así como el reciente, que olvidé, como un índice incrustado, creo, donde es un caso de uso especial. Pero es un caso de uso muy importante y que hemos visto mucho. Entonces es razonable hacer algo al respecto.

Gary 27:33
Sí, en general. Nosotros, nosotros, como en el equipo de relaciones de búsqueda, intentamos rechazar nuevas metaetiquetas, pero de vez en cuando recibimos sorpresas como el índice si está integrado porque tenía sentido para algo muy específico, pero importante. Pero claro. Además, no vemos cómo o no vamos a ver una nueva forma de implementar videos, por ejemplo, básicamente en ese caso específico, en el caso de indexifembedded, hay al menos dos formas de proporcionar videos. Pero cuando se trata de incrustar, siempre es un marco. Y no vemos que eso cambie. Como si hubiera existido desde siempre. No hay una nueva forma de hacer eso. Básicamente, teníamos que idear algo que tuviera sentido para ese propósito en particular.

Juan 28:25
Entonces, ¿qué pasa con otros tipos de archivos? ¿Como un PDF? ¿Y si ponemos todas las recetas en un PDF? ¿Hay alguna manera de bloquearlos?

Gary 28:35
Quiero decir, tienes el encabezado robots, como el encabezado HTTP.

Juan 28:39
Oh sí. Bueno.

Lizzi 28:41
Pero, ¿qué pasa si subo el PDF, como en mi sitio CMS, y no tengo acceso a él? Difícil. Oh.

Gary 28:47
Puede utilizar la herramienta de eliminación. Pero en realidad, en esos casos, si no tienes acceso a los encabezados, como si pudieras cambiarlos, entonces probablemente no quieras cargar eso. El PDF.

Juan 29:01
Supongo que robots.txt también funcionaría. Pero es así, entonces tienes la dificultad de que tal vez si alguien lo vinculara, podría indexarse ​​como una URL.

Gary 29:12
Quiero decir, robots.txt definitivamente funciona para imágenes, por ejemplo, o videos.

Juan 29:16
¿Por qué funciona allí?

Lizzi 29:16
¿Funcionaría para PDF? Entonces, ¿funcionaría para una imagen o un vídeo, pero no necesariamente para un PDF?

Gary 29:22
Bien. Por eso indexamos vídeos e imágenes de forma muy diferente al contenido web. Como por ejemplo, incluso en el caso de PDF, el primer paso que damos cuando intentamos indexarlo es convertirlo a HTML. Y a partir de ahí lo tratamos como HTML. Entonces, en esos casos, lo indexamos para web. Al igual que la pestaña web, ya no se llama pestaña web, sino pestaña antigua o lo que sea. Si bien las imágenes y los videos están indexados para una pestaña diferente, más modo o como quieras llamarlo, tal vez deberíamos estandarizar los nombres para esto. Y sí, es completamente diferente, como diferentes tipos de contenido.

Juan 30:09
Entonces, ¿por qué funcionaría robots.txt para imágenes?

Gary 30:13
Buena pregunta. Quizás no debería.

Juan 30:14
¿Será porque en la búsqueda de imágenes mostraríamos la imagen? ¿Qué mostraremos con una imagen de robot?

Gary 30:21
Ah, sí, exactamente. Exactamente. Sí.

Juan 30:28
Bueno.

Lizzi 30:26
John, viene a salvar el día.

Gary 30:30
Sí, no tendríamos nada que mostrar como fragmento. Bueno, fragmento virtual. Pseudo fragmento.

Lizzi 30:35
Creo que podríamos encontrar el final de este episodio, tal vez ahora mismo.

Lizzi 30:44
Y eso es todo por este episodio. La próxima vez en Search Off the Record continuaremos nuestra serie In the Spotlight donde hablamos con alguien que nos inspira en la comunidad de SEO. Barry Schwartz. Nos hemos estado divirtiendo con este podcast. Y espero que usted, el oyente, también lo haya encontrado entretenido y revelador. No dude en enviarnos una nota en Twitter en la búsqueda de Google C, o chatear con nosotros y en uno de los próximos eventos a los que asistiremos si tiene alguna idea. Y por supuesto no olvides darle me gusta y suscribirte. Gracias y adiós.

Nuevas Publicaciones:

Recomendamos