« Archive.today » : différence entre les versions
m →top : Amélioration {{site officiel}} + corrections mineures |
Ajout d'informations sur son créateur, ajout de sources et d'une explication au nombre de domaines de ce service |
||
Ligne 25 : | Ligne 25 : | ||
}} |
}} |
||
'''Archive.today''' (anciennement '''archive.is''') est un [[site web]] dont le but est d'[[Archivage du Web|archiver des pages web]] et |
'''Archive.today''' (anciennement '''archive.is''') est un [[site web]] dont le but est d'[[Archivage du Web|archiver des pages web]] et dont le centre de données aurait été situé en [[France]], dans le [[Nord-Pas-de-Calais]]<ref>{{Lien web |langue=fr,en |auteur=Archive.Today |titre=Archive.is Blog - Parlez-vous français ? Parce que j'ai remarqué que vous site Internet vient de France, au moins les serveurs de celui-ci. Si oui, le Nord-Pas-de-Calais est-il un bon endroit ? |url=https://blog.archive.today/post/674936420267393024/parlez-vous-fran%C3%A7ais-parce-que-jai-remarqu%C3%A9-que |accès url=libre |site=Archive.Today |consulté le=11 Mai 2024}}</ref>. Il fonctionne en utilisant ''[[Hadoop|Apache Hadoop]]'' et ''[[Accumulo|Apache Accumulo]]''. |
||
== Créateur == |
|||
Bien que le site ne donne aucune indication sur son créateur ni sur son moyen de financement<ref>{{Lien web |langue=en |auteur=Archive.Today |titre=FAQ |url=https://archive.ph/faq |accès url=libre |site=Archive.Today |consulté le=11 Mai 2024}}</ref>, certaines personnes se sont mises à la recherche de son créateur et il se pourrait que se soit un certain Denis Petrov<ref>{{Lien web |langue=en |auteur=TrueDetective |titre=On which country are the creators and servers of archive.today / archive.is based? |url=https://webapps.stackexchange.com/a/175600 |accès url=libre |site=Stack Exchange |consulté le=11 Mai 2024}}</ref> de New-York qui soit le créateur de ce site. |
|||
== Particularité == |
== Particularité == |
||
Sa particularité est de capturer à la demande les pages web page par page afin de ne pas être affecté par l'éventuelle présence d'un fichier [[robots.txt]]<ref>{{Lien web|langue=en|titre=Comparison of web archiving services |url=https://wiki.dandascalescu.com/reviews/online_services/web_page_archiving|site=dandascalescu.com|date=19 septembre 2012|consulté le= 31 août 2016}}.</ref>. Il est donc impossible d'interdire l'archivage de son site web, ce qui explique pourquoi ce site est fréquemment critiqué. |
Sa particularité est de capturer à la demande les pages web page par page afin de ne pas être affecté par l'éventuelle présence d'un fichier [[robots.txt]]<ref>{{Lien web|langue=en|titre=Comparison of web archiving services |url=https://wiki.dandascalescu.com/reviews/online_services/web_page_archiving|site=dandascalescu.com|date=19 septembre 2012|consulté le= 31 août 2016}}.</ref>. Il est donc impossible d'interdire l'archivage de son site web, ce qui explique pourquoi ce site est fréquemment critiqué. |
||
Il a aussi de nombreuses adresses différentes qui se redirigent les unes entre les autres et changent souvent. Il semblerai que se soit à cause de la réputation des "[[Domaine de premier niveau|TLD]]" et qu'il change souvent les adresses pour cela.<ref>{{Lien web |langue=en |auteur=Archive.Today |titre=Archive.is Blog - Why has 'is' been redirecting to 'vn' and 'md' today? Should we start switching over, or is this a temporary thing? |url=https://blog.archive.today/post/665433145447989249/why-has-is-been-redirecting-to-vn-and-md |accès url=libre |site=Archive.Today |consulté le=11 Mai 2024}}</ref> |
|||
== Références == |
== Références == |
Version du 11 mai 2024 à 17:40
Adresse | Site officiel |
---|---|
Publicité | non |
Type de site | Archivage web |
Langue | anglais |
Inscription | non |
Lancement | 2012 |
État actuel | actif |
modifier | |
Archive.today (anciennement archive.is) est un site web dont le but est d'archiver des pages web et dont le centre de données aurait été situé en France, dans le Nord-Pas-de-Calais[1]. Il fonctionne en utilisant Apache Hadoop et Apache Accumulo.
Créateur
Bien que le site ne donne aucune indication sur son créateur ni sur son moyen de financement[2], certaines personnes se sont mises à la recherche de son créateur et il se pourrait que se soit un certain Denis Petrov[3] de New-York qui soit le créateur de ce site.
Particularité
Sa particularité est de capturer à la demande les pages web page par page afin de ne pas être affecté par l'éventuelle présence d'un fichier robots.txt[4]. Il est donc impossible d'interdire l'archivage de son site web, ce qui explique pourquoi ce site est fréquemment critiqué.
Il a aussi de nombreuses adresses différentes qui se redirigent les unes entre les autres et changent souvent. Il semblerai que se soit à cause de la réputation des "TLD" et qu'il change souvent les adresses pour cela.[5]
Références
- (fr + en) Archive.Today, « Archive.is Blog - Parlez-vous français ? Parce que j'ai remarqué que vous site Internet vient de France, au moins les serveurs de celui-ci. Si oui, le Nord-Pas-de-Calais est-il un bon endroit ? » , sur Archive.Today (consulté le )
- (en) Archive.Today, « FAQ » , sur Archive.Today (consulté le )
- (en) TrueDetective, « On which country are the creators and servers of archive.today / archive.is based? » , sur Stack Exchange (consulté le )
- (en) « Comparison of web archiving services », sur dandascalescu.com, (consulté le ).
- (en) Archive.Today, « Archive.is Blog - Why has 'is' been redirecting to 'vn' and 'md' today? Should we start switching over, or is this a temporary thing? » , sur Archive.Today (consulté le )
Voir aussi
Articles connexes
Liens externes
- (en) « Create publicly available web page archives with Archive.is », sur ghacks.net.