Archivado remoto de URLs: una web permanente

martes, agosto 21, 2018

Archivado remoto de URLs: una web permanente

Si bien ya se comentó el problema de lo efímera de la web lo cierto es que si se requiere archivar alguna web las opciones no son muchas.

En principio se puede buscar si contamos con algún enlace roto con estas opciones:

https://archive.is/https://holait.blogspot.com
https://web.archive.org/web/*/https://holait.blogspot.com
https://megalodon.jp/?url=https://holait.blogspot.com (en japones)
https://www.webcitation.org/query?url=https://holait.blogspot.com (requiere registro)
https://webcache.googleusercontent.com/search?q=cache:https://holait.blogspot.com (para poder ver versiones viejas pero no archiva)

Cada uno de estos sitios permiten almacenar de una forma más o menos sencillas y con algunas limitaciones.

Ya han surgido varios proyectos que buscan que las noticias sean archivadas en sitios externos de forma automáticamente por cualquier tipo de censura posterior.

Lo cierto es que la posibilidad de generar mirrors de forma automática se utiliza para evitar algún tipo de saturación de servicios, así como también hay bots que toman información de enlaces y los almacenan de forma automática en agregadores sociales mediante el scraping de la información en el sitio.