Seguridad Informática. Optimización de PDFs en buscadores

INBIOSYS - Ingeniería y Sistemas Biométricos

Mejora tu información acerca de las mejores prácticas SEO para posicionar un archivo PDF en los resultados de búsqueda de Google.

Uno de los objetivos de Google es organizar la mayor cantidad de información posible y hacer que esta sea accesible para cualquier usuario. Para lograr este fin, el buscador líder de Internet se encuentra con archivos que no son HTML, entre los que destacan los documentos PDF.

Huella digital - Optimización de PDFs en buscadores

Los algoritmos de Google no se detienen ante formatos de archivo diferentes., por ello desde 2001, fecha en que comenzó el indexado de archivos PDF, ya cuenta con cientos de millones de archivos PDFs indexados.

Google ha presentado una recopilación de las preguntas más frecuentes sobre la indexación de archivos en formato PDF:

¿Google puede indexar cualquier tipo de archivo PDF?

Normalmente, se puede indexar contenido escrito en cualquier idioma, de los archivos PDF que utilizan diferentes tipos de codificación de caracteres, siempre que no estén cifrados ni protegidos por contraseña. Si el texto está insertado en forma de imágenes, se puede procesar las imágenes con algoritmos OCR para extraer el texto. Por tanto si se puede copiar el texto de un documento PDF y pegarlo en un documento de texto estándar, se debería poder indexar.

¿Qué ocurre con las imágenes de los archivos PDF?

Actualmente, las imágenes no se indexan.

¿Cómo se tratan los enlaces incluidos en los documentos PDF?

Normalmente, los enlaces incluidos en los documentos PDF se tratan de forma similar a los enlaces que encontramos en los archivos HTML: pueden entrar en la clasificación de PageRank y otras señales de indexación, y podemos seguirlos después de haber rastreado el archivo PDF. Actualmente, no es posible utilizar el atributo “nofollow” en los enlaces de un documento PDF.

¿Cómo puedo evitar que mis archivos PDF aparezcan en los resultados de búsqueda? Y, si ya aparecen, ¿cómo puedo eliminarlos?

La forma más sencilla de evitar que los documentos PDF aparezcan en los resultados de búsqueda es añadir una etiqueta X-Robots “noindex” en la cabecera HTTP utilizada para mostrar el archivo. Si ya se han indexado, dejarán de aparecer con el tiempo si utilizas la etiqueta X-Robots con la directiva “noindex”. Para acelerar la eliminación, es posible usar la herramienta de solicitud de eliminación de URL de las Herramientas para webmasters de Google.

¿Pueden obtener los archivos PDF una buena clasificación en los resultados de búsqueda?

Por lo general, estos archivos se clasifican de forma similar a otras páginas web. Publicaciones como irs form 2011 devuelven documentos PDF que obtienen una buena posición en los resultados de búsqueda gracias a su contenido y a la forma en la que están insertados y vinculados desde otras páginas web.

¿Se considera contenido duplicado si tengo una copia de mis páginas en formato HTML y PDF?

Siempre que sea posible, se recomienda mostrar una única copia del contenido. Si no es posible, asegúrarse de indicar cuál es nuestra versión preferida. Para ello, podemos incluir la URL que prefiramos en el sitemap o especificar la versión canónica en el archivo HTML o en las cabeceras HTTP del PDF. Para obtener más sugerencias, consulta el artículo del Centro de asistencia sobre canonicalización.

¿Cómo puedo influir en el título que aparece en los resultados de búsqueda de mi documento PDF?

Se usan dos elementos principales para determinar el título que se muestra: los metadatos del título que contiene el archivo y el texto de anclaje de los enlaces que dirigen al archivo PDF. Para que el algoritmo capte claramente el título que debe utilizar, se recomienda actualizar ambos elementos.

Fuente: DesarrolloWeb.com
http://www.desarrolloweb.com/de_interes/optimizacion-pdf-buscadores-5961.html

Queremos mejorar cada día más, necesitamos que usted nos regale dos minutos de su precioso tiempo y nos conteste 5 preguntas de la encuesta que le traemos hoy.

Click Aquí para comenzar la encuesta

En INBIOSYS tenemos todas las Soluciones en Seguridad Informática, basada en la Huella Digital

NUESTROS PRODUCTOS

Somos la primera Empresa en el país en “Soluciones de seguridad para préstamos de libros utilizando la huella digital”

Puede seguirnos en Twitter. Follow inbiosys on Twitter

Puede seguirnos en Facebook.

Visita nuestra página en Facebook

INBIOSYS Biometria

INBIOSYS
Jairo Alonso Gómez Cano
Gerente Comercial
https://inbiosys.wordpress.com
E-mail: jairo.gomez@inbiosys.com.co
PBX: (57)(4) 580 29 37
Celular: 312 782 60 21

INBIOSYS
Ingeniería y Sistemas Biométricos

Carrera 80 No. 39 – 06 Oficina 201 Barrio Laureles
Medellín Colombia

Anuncios

0 Responses to “Seguridad Informática. Optimización de PDFs en buscadores”



  1. Dejar un comentario

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s




octubre 2011
L M X J V S D
« Sep   Nov »
 12
3456789
10111213141516
17181920212223
24252627282930
31  

Escribe tu dirección de correo electrónico para suscribirte a este blog, y recibir notificaciones de nuevos mensajes por correo.

Únete a otros 55 seguidores

Categorías

Actualizaciones de Twitter


A %d blogueros les gusta esto: