archive.today
| archive.today | |
|---|---|
| archive.is | |
| |
| |
| URL | |
| Тип сайта | веб-архив и расширение браузера |
| Начало работы | 16 мая 2012 |
archive.today (ранее archive.is) — бесплатный сервис по архивированию веб-страниц, запущенный в 2012 году. Archive.today сохраняет содержание страниц, включая изображения, однако не поддерживает динамический контент. В отличие от портала Wayback Machine (WB) archive.today архивирует страницы по запросу пользователей и не использует поисковых роботов.
Принцип работы
Сервис archive.is был создан в мае 2012 года[2]. Спустя три года после создания, в мае 2015-го, портал изменил название на archive.today[3]. На 2021-й все дата-центры расположены в странах Европейского союза[2], а финансирование осуществляется за счёт частных спонсоров[2][4].
Расходы на функционирование архиватора оплачиваются его владельцем. По состоянию на июль 2021 года расходы только на сервера и домены составляли 2600 долларов в месяц[5].
В отличие от аналогичного проекта Wayback Machine, использующего поисковых роботов для сканирования и архивирования интернета[6], archive.today сохраняет веб-страницы только по запросу пользователей[7][8]. При отправке URL через специальную строку на сайте сервис автоматически архивирует содержимое HTML-страницы, включая растровые изображения и другие материалы, сохраняя CSS-стили и отдельные скрипты JavaScript. Аудио и видеофайлы, контент Adobe Flash, PDF, RSS и другие форматы XML не сохраняются[2]. После этого портал размещает в открытом доступе функциональную копию веб-страницы и снимок экрана, представляющий статичную визуализацию страницы в формате PNG[9][9][6][10][11].
Archive.today не сохраняет страницы, для доступа к которым требуется аутентификация, однако игнорирует стандарт исключений для роботов и за счёт этого имеет доступ ко многим «закрытым» сайтам[9][12]. Размер заархивированной страницы со всеми изображениями не должен превышать 50 МБ. Все данные хранятся в формате HDFS[2].
С 2013 года archive.today включён в агрегаторы Memento Project, поддерживаемого Лос-Аламосской национальной лабораторией и Университет Олд Доминион[13][14].
Создатели archive.today запустили специальное расширение браузера Mozilla Firefox, которое автоматически сохраняет и выкладывает в общий доступ копии каждой веб-страницы, добавляемой пользователем в закладки[4][9].
Использование
Сервис использовали такие хактивисты, как Джулиан Ассанж и Сирийская электронная армия, для архивирования ранее выложенных в интернет документов, используемых в качестве доказательств коррупции и военных преступлений[15][16][17].
В отдельных случаях активисты архивируют с помощью archive.today материалы тех веб-сайтов, против которых они выступают, таким образом препятствуя получению ими прибыли от просмотров рекламы. Например, в 2014 году сторонники Геймергейта часто использовали archive.today для распространения страниц новостных порталов Kotaku, IGN и Motherboard[8] — по данным Alexa Internet, в этот период 13 % трафика портала поступало с треда Геймергейта на Reddit[8].
Портал не несёт юридической ответственности за архивируемые пользователями материалы, однако при появлении жалоб на незаконный контент создатели сотрудничают с правоохранительными органами для его удаления[12].
Блокировки
В январе 2016 года Федеральная служба Российской Федерации по контролю за оборотом наркотиков заблокировала сервис, предположительно, за сохранение памятки по посещению Крыма, согласно которой туристы должны спрашивать разрешение на посещение у украинских властей[18][19].
В 2019 году портал archive.today был заблокирован в Австралии за архивацию страницы, содержащей видео стрельбы в новозеландских мечетях Крайстчерча[20].
В 2019 году зеркало archive.today было заблокировано на Фарерских островах[12]. На 2021 год портал заблокирован в Казахстане, Китае, Иране за хранение запрещённых материалов[12][21].
Глобальные блокировки
OpenDNS блокирует сайт, считая его разновидностью прокси-анонимайзера[22].
В феврале 2016 доменный регистратор OnlineNIC заблокировал старый домен сайта «archive.today», последние месяцы перенаправлявший на «archive.is»[23].
Владельцы
Владельцы архиватора официально неизвестны и сохраняют анонимность. Согласно данным, указанным при регистрации доменного имени archive.is, владельцем архиватора может быть Денис Петров из Праги, Чехия. Анализ официального блога архиватора показывает, что владелец архиватора владеет русским языком и скорее всего живёт в России[24].
Примечания
- ↑ The registry of blocked websites (англ.). reestr.rublacklist.net. Дата обращения: 11 октября 2024.
- ↑ 1 2 3 4 5 FAQ. archive.ph. Дата обращения: 3 ноября 2021. Архивировано 27 октября 2021 года.
- ↑ Archive.is blog. Archive.is (3 июня 2015). Дата обращения: 26 ноября 2021. Архивировано 27 октября 2021 года.
- ↑ 1 2 Comparison of web archiving services. Web Page Archiving. Дата обращения: 3 ноября 2021. Архивировано 22 сентября 2013 года.
- ↑ Archive.is blog — You said that before you die of old age you would... (англ.) (25 июля 2021). Дата обращения: 29 августа 2025. Архивировано 5 июня 2024 года.
- ↑ 1 2 Brunelle, 2016, с. 95—117.
- ↑ Salman Ravoof. How to Archive a Website: Our Mammoth Guide to Saving Your Site. Kinsta (3 ноября 2021). Дата обращения: 7 ноября 2021. Архивировано 5 ноября 2021 года.
- ↑ 1 2 3 Jason Koebler. Dear GamerGate: Please Stop Stealing Our Shit. Vice (29 октября 2014). Дата обращения: 3 ноября 2021. Архивировано 27 ноября 2021 года.
- ↑ 1 2 3 4 Martin Brinkmann. Create publicly available web page archives with Archive.is. G Hacks (22 апреля 2015). Дата обращения: 2 ноября 2021. Архивировано 23 июля 2018 года.
- ↑ KritikaGarg. 2020-07-15: Twitter Was Already Difficult To Archive, Now It's Worse! Web Science and Digital Library (15 июля 2020). Дата обращения: 3 ноября 2021. Архивировано 28 октября 2021 года.
- ↑ Garg, 2021.
- ↑ 1 2 3 4 Didi Rankovic. Archive.today domain mirror suspended by Faroe Islands council. Reclaim the Internet (27 октября 2019). Дата обращения: 3 ноября 2021. Архивировано 27 ноября 2021 года.
- ↑ Michael Nelson. 2013-07-09: Archive.is Supports Memento. Web Science and Digital Libraries Research Group (9 июля 2013). Дата обращения: 3 ноября 2021. Архивировано 6 ноября 2021 года.
- ↑ archive.is. archive.is. Дата обращения: 3 ноября 2021. Архивировано 15 сентября 2013 года.
- ↑ View Julian Assange - When Google Met WikiLeaks.pdf. Web Archive. Дата обращения: 7 ноября 2021. Архивировано 21 июля 2015 года.
- ↑ Julian Assange - Google Is Not What It Seems. Web Archive. Дата обращения: 6 ноября 2021. Архивировано 14 января 2016 года.
- ↑ US Army Official Website Hacked — Syrian Electronic Army. Web Archive. Дата обращения: 7 ноября 2021. Архивировано 11 июня 2015 года.
- ↑ Вадим Елистратов. Роскомнадзор заблокировал сервис archive.is, хранящий копии веб-сайтов. TJournal. Дата обращения: 3 ноября 2021. Архивировано 27 ноября 2021 года.
- ↑ Сервис, сохраняющий копии сайтов, признали запрещённым. Москва24 (29 января 2016). Дата обращения: 3 ноября 2021. Архивировано 27 ноября 2021 года.
- ↑ Bryan Menegus. New Zealand ISPs Say They’re Blocking Sites That Fail To Remove Christchurch Shooting Video. Gizmodo (19 марта 2019). Дата обращения: 3 ноября 2021. Архивировано 18 мая 2019 года.
- ↑ Методика. Как архивировать открытые данные. Factcheckkz. Право на правду (4 марта 2018). Дата обращения: 26 ноября 2021. Архивировано 27 ноября 2021 года.
- ↑ Jared. rylor (англ.). Twitter (24 июля 2015). Дата обращения: 30 января 2016. Архивировано 12 октября 2015 года.
- ↑ Domain problems again. Archive.is blog. Дата обращения: 27 ноября 2021. Архивировано 27 ноября 2021 года.
- ↑ archive.today: On the trail of the mysterious guerrilla archivist of the Internet (англ.) (5 августа 2023). Дата обращения: 28 августа 2025. Архивировано 24 августа 2025 года.
Литература
- Brunelle J., Kelly M., Weigle M., Nelson M. The impact of JavaScript on archivability // International Journal of Digital Library. — 2016. — P. 95—117. — doi:10.1007/s00799-015-0140-8.
- Garg K., Jayanetti H., Alam S., Weigle M., Nelson M. Replaying Archived Twitter: When your bird is broken, will it bring you down? // ArXiv.org. — 2021. — arXiv:2108.12092.

