« Archive.today » : différence entre les versions

Un article de Wikipédia, l'encyclopédie libre.
Contenu supprimé Contenu ajouté
SyntaxTerrorBot (discuter | contributions)
m →‎top : Amélioration {{site officiel}} + corrections mineures
Ajout d'informations sur son créateur, ajout de sources et d'une explication au nombre de domaines de ce service
Ligne 25 : Ligne 25 :
}}
}}


'''Archive.today''' (anciennement '''archive.is''') est un [[site web]] dont le but est d'[[Archivage du Web|archiver des pages web]] et {{Référence nécessaire|dont le centre de données est situé en [[France]], dans le [[Nord-Pas-de-Calais]]|date=27 octobre 2023}}. Il fonctionne en utilisant ''[[Hadoop|Apache Hadoop]]'' et ''[[Accumulo|Apache Accumulo]]''.
'''Archive.today''' (anciennement '''archive.is''') est un [[site web]] dont le but est d'[[Archivage du Web|archiver des pages web]] et dont le centre de données aurait été situé en [[France]], dans le [[Nord-Pas-de-Calais]]<ref>{{Lien web |langue=fr,en |auteur=Archive.Today |titre=Archive.is Blog - Parlez-vous français ? Parce que j'ai remarqué que vous site Internet vient de France, au moins les serveurs de celui-ci. Si oui, le Nord-Pas-de-Calais est-il un bon endroit ? |url=https://blog.archive.today/post/674936420267393024/parlez-vous-fran%C3%A7ais-parce-que-jai-remarqu%C3%A9-que |accès url=libre |site=Archive.Today |consulté le=11 Mai 2024}}</ref>. Il fonctionne en utilisant ''[[Hadoop|Apache Hadoop]]'' et ''[[Accumulo|Apache Accumulo]]''.

== Créateur ==
Bien que le site ne donne aucune indication sur son créateur ni sur son moyen de financement<ref>{{Lien web |langue=en |auteur=Archive.Today |titre=FAQ |url=https://archive.ph/faq |accès url=libre |site=Archive.Today |consulté le=11 Mai 2024}}</ref>, certaines personnes se sont mises à la recherche de son créateur et il se pourrait que se soit un certain Denis Petrov<ref>{{Lien web |langue=en |auteur=TrueDetective |titre=On which country are the creators and servers of archive.today / archive.is based? |url=https://webapps.stackexchange.com/a/175600 |accès url=libre |site=Stack Exchange |consulté le=11 Mai 2024}}</ref> de New-York qui soit le créateur de ce site.


== Particularité ==
== Particularité ==
Sa particularité est de capturer à la demande les pages web page par page afin de ne pas être affecté par l'éventuelle présence d'un fichier [[robots.txt]]<ref>{{Lien web|langue=en|titre=Comparison of web archiving services |url=https://wiki.dandascalescu.com/reviews/online_services/web_page_archiving|site=dandascalescu.com|date=19 septembre 2012|consulté le= 31 août 2016}}.</ref>. Il est donc impossible d'interdire l'archivage de son site web, ce qui explique pourquoi ce site est fréquemment critiqué.
Sa particularité est de capturer à la demande les pages web page par page afin de ne pas être affecté par l'éventuelle présence d'un fichier [[robots.txt]]<ref>{{Lien web|langue=en|titre=Comparison of web archiving services |url=https://wiki.dandascalescu.com/reviews/online_services/web_page_archiving|site=dandascalescu.com|date=19 septembre 2012|consulté le= 31 août 2016}}.</ref>. Il est donc impossible d'interdire l'archivage de son site web, ce qui explique pourquoi ce site est fréquemment critiqué.

Il a aussi de nombreuses adresses différentes qui se redirigent les unes entre les autres et changent souvent. Il semblerai que se soit à cause de la réputation des "[[Domaine de premier niveau|TLD]]" et qu'il change souvent les adresses pour cela.<ref>{{Lien web |langue=en |auteur=Archive.Today |titre=Archive.is Blog - Why has 'is' been redirecting to 'vn' and 'md' today? Should we start switching over, or is this a temporary thing? |url=https://blog.archive.today/post/665433145447989249/why-has-is-been-redirecting-to-vn-and-md |accès url=libre |site=Archive.Today |consulté le=11 Mai 2024}}</ref>


== Références ==
== Références ==

Version du 11 mai 2024 à 17:40

Logo de Archive.today

Adresse Site officiel
Publicité non
Type de site Archivage web
Langue anglais
Inscription non
Lancement 2012
État actuel actif

Archive.today (anciennement archive.is) est un site web dont le but est d'archiver des pages web et dont le centre de données aurait été situé en France, dans le Nord-Pas-de-Calais[1]. Il fonctionne en utilisant Apache Hadoop et Apache Accumulo.

Créateur

Bien que le site ne donne aucune indication sur son créateur ni sur son moyen de financement[2], certaines personnes se sont mises à la recherche de son créateur et il se pourrait que se soit un certain Denis Petrov[3] de New-York qui soit le créateur de ce site.

Particularité

Sa particularité est de capturer à la demande les pages web page par page afin de ne pas être affecté par l'éventuelle présence d'un fichier robots.txt[4]. Il est donc impossible d'interdire l'archivage de son site web, ce qui explique pourquoi ce site est fréquemment critiqué.

Il a aussi de nombreuses adresses différentes qui se redirigent les unes entre les autres et changent souvent. Il semblerai que se soit à cause de la réputation des "TLD" et qu'il change souvent les adresses pour cela.[5]

Références

  1. (fr + en) Archive.Today, « Archive.is Blog - Parlez-vous français ? Parce que j'ai remarqué que vous site Internet vient de France, au moins les serveurs de celui-ci. Si oui, le Nord-Pas-de-Calais est-il un bon endroit ? » Accès libre, sur Archive.Today (consulté le )
  2. (en) Archive.Today, « FAQ » Accès libre, sur Archive.Today (consulté le )
  3. (en) TrueDetective, « On which country are the creators and servers of archive.today / archive.is based? » Accès libre, sur Stack Exchange (consulté le )
  4. (en) « Comparison of web archiving services », sur dandascalescu.com, (consulté le ).
  5. (en) Archive.Today, « Archive.is Blog - Why has 'is' been redirecting to 'vn' and 'md' today? Should we start switching over, or is this a temporary thing? » Accès libre, sur Archive.Today (consulté le )

Voir aussi

Articles connexes

Liens externes