Почему не работает вебархив?

В начале октября 2024 Архив Интернета подвергся мощнейшей DDOS и вот уже несколько дней находится в буквальном смысле в отключке, но проблема не только в этом. Похоже всеми любимый вебархив словил мегакомбо от недоброжелателей.


Что случилось?

Как известно из первоисточника Интернет-архив подвергся DDoS-атаке, ответственность за которую взяла на себя группа хактивистов BlackMeta, которая заявила, что будет проводить дополнительные атаки.

Одновременно (или почти одновременно) на сайте Internet Archive «The Wayback Machine» произошла утечка данных после того, как злоумышленник взломал веб-сайт и похитил базу данных аутентификации пользователей, содержащую 31 миллион уникальных записей.

Новости о взломе начали распространяться в среду днем после того, как посетители archive.org начали видеть предупреждение JavaScript, созданное хакером, в котором говорилось, что Интернет-архив был взломан.

Девять дней назад злоумышленник поделился базой данных аутентификации Internet Archive, и это файл SQL размером 6,4 ГБ с именем «ia_users.sql». База данных содержит информацию об аутентификации зарегистрированных участников, включая их адреса электронной почты, имена экранов, временные метки смены паролей, хэшированные с помощью Bcrypt пароли и другие внутренние данные.

Самая последняя временная метка на украденных записях — 28 сентября 2024 года, вероятно, когда и была украдена база данных.

Коллаж из скриншотов социальных сетей, посвященных кибератаке на «Интернет-архив» (Internet Archive). Слева расположены два поста официального аккаунта организации на русском языке с обновлениями от Брюстера Кейла о статусе услуг. Справа вверху показаны посты Брюстера Кейла на английском языке в социальной сети X (ранее Twitter), где он сообщает о DDoS-атаках, взломе сайта через JS-библиотеку и компрометации данных пользователей (имена, email, зашифрованные пароли). В правом нижнем углу находится всплывающее системное окно с сайта web.archive.org, иронизирующее над тем, что 31 миллион пользователей оказались в базе данных «Have I Been Pwned» (HIBP) из-за этой утечки.

Когда починят Вебархив?

Как написал основатель Всемирного архива интернет Брюстер Кейл в своих социальных сетях:

"Данные вебархива в безопасности. Сервисы отключены, пока мы их проверяем и усиливаем. Персонал архива усердно работает над устранением проблемы. Расчетные сроки восстановления работоспособности интернет архива дни, а не недели"

Держим кулачки за вебархив. А пока его чинят, но вам срочно нужно заархивировать вебсайт, воспользуйтесь русской версией вебархива.

Юристы интересуются как работает Архив интернет

Черно-белый художественный эскиз интерьера книжного магазина, выполненный в технике скетчинга с широким углом обзора. На переднем плане виден деревянный стол с открытой тетрадью, рукой человека, делающего записи, и сумкой. Пространство магазина заполнено высокими стеллажами, плотно заставленными книгами. Справа расположена стремянка, а в центре — проход, уходящий вглубь помещения. Освещение подчеркнуто декоративными круглыми лампами, свисающими с изогнутого потолка, и высокими окнами слева.

Поскольку мы имеем непосредственное отношение к созданию Веб-архив.ру, то нам нередко приходится отвечать на вопросы юристов и судов по работе Архива Интернет.

Как правило вопросы возникают в трех случаях:

  • когда представитель или судья впервые столкнулись с доказательствами из Веб-архива
  • когда одна из сторон ссылается на распечатки из Интернет Архива, но к моменту рассмотрения дела эти архивные копии оказались удалены из архива
  • когда одна из сторон по делу начинает сочинять небылицы про Вебархив, чтобы опорочить доказательства оппонента

В этой публикации собрали наиболее частые вопросы и ответы на них. Надеемся, что информация будет полезной.


Вопрос №1: Кто может добавить страницы в Архив Интернет?

Интернет-страницы могут быть заархивированы в глобальном Архиве интернет по инициативе любого пользователя, либо в автоматическом режиме самим сервисом web.archive.org в соответствии с его алгоритмами. Указанные алгоритмы отчасти схожи с алгоритмами поисковых систем, роботы которых ежедневно осуществляют обход интернет-сайтов, индексируя информацию, размещенную на них.

Вопрос №2: Есть ли на сайте Интернет Архива личный кабинет и есть ли в нем возможность удаления архивных копий из Архива Интернет?

Пользователи по желанию могут регистрироваться на сайте для получения доступа к личному кабинету. Кроме прочего личный кабинет позволяет пользователям взаимодействовать между собой (отзывы, публикации), а также формировать подборки различных архивных материалов.

Личный кабинет не предоставляет каких-либо преимуществ в работе с Архивом Интернет, в том числе не предоставляет пользователю технической возможности удаления архивных копий интернет-страниц, архивированных как по его инициативе, так и иных архивных копий, архивированных по инициативе других лиц или сервисом в автоматическом режиме.

Вопрос №3: Требуется ли регистрация для использования Интернет Архива?

Обязательная регистрация для использования сайта Архива интернет отсутствует. Регистрация, в том числе не требуется для поиска и просмотра архивных копий веб-страниц.

Вопрос №4: Требуется ли регистрация пользователей для добавления интернет-страницы в Архив Интернет ?

Для добавления интернет-страниц в глобальный интернет-архив пользователю не требуется регистрация. Любой пользователь может сделать это без регистрации просто вставив в соответствующее поле адрес интернет-страницы и нажав кнопку «сохранить» (анг. Save Page).

Запрос на добавление в архив также может быть создан без регистрации программными средствами, позволяющими отправлять автоматизированные запросы на архивацию той или иной интернет-страницы. Такие средства обычно пользуют интернет-сервисы, деятельность которых сопряжена с необходимостью сохранения состояния различных интернет-страниц на определенную дату (сервисы интернет-маркетинга и продвижения сайтов, юридические сервисы фиксации доказательств, например АС "ВЕБДЖАСТИС").

Вопрос №5: Происходит ли идентификация пользователя, инициирующего архивирование интернет-страницы в Архиве Интернет, с целью предоставления ему технической возможности удаления архивной копии в будущем?

При отправке запроса на добавление интернет-страницы в Архив Интернет на сайте web.archive.org идентификация пользователя, инициировавшего архивирование, не производится, никаких данных о себе пользователь не заполняет, в том числе для цели удаления архивной копии в будущем.

Вопрос №6: Могут ли пользователи сайта web.archive.org удалять архивные копии из Архива Интернет?

Третьим лицам и сервисам не предоставляется техническая возможность самостоятельно вносить исправления или удалять данные, содержащиеся в Архиве Интернет.

Вопросы, связанные с хранением, выдачей и удалением архивной информации из Архива Интернета направляются непосредственно в Архив Интернета:

Internet Archive 300 Funston Avenue San Francisco, CA 94118 Tel: +1 415-561-6767

Fax: +1 415-840-0391 Web: archive.org Email: info@archive.org

Таким образом, пользователи самостоятельно не могут удалять архивные копии интернет-страниц из Архива Интернет на сайте web.archive.org, но могут направить в администрацию сервиса запрос на такое удаление с соблюдением необходимых условий.

Вопрос №7: Кто может инициировать удаление архивных копий из Архива Интернет и что для этого нужно?

Регистрация на сайте для направления запроса на удаление архивных копий не требуется.

Исходя из разъяснений, которые размещены на сайте archive.org, а также в различных открытых источниках в сети Интернет, для удаление архивных копий интернет-страниц на сайте web.archive.or необходимо направить соответствующий запрос на электронный адрес Архива интернет info@archive.org. В запросе следует указать адрес сайта или интернет страниц, архивные копии которых необходимо исключить из Архива интернет, при необходимости период времени, за который необходимо исключить архивные копии, а также указать информацию, которая позволит идентифицировать заявителя как владельца сайта (лицо, контролирующее заархивированный сайт).

Так на сайте Интернет Архива в разделе помощи при работе с Архивом интернет https://help.archive.org/help/using-the-wayback-ma... и https://help.archive.org/help/wayback-machine-gene... применительно к запросам на удаление архивных копий сайтов указано следующее (перевод текста на странице выполнен стандартными средствами браузера google chrome):

«Вы собираете все сайты в сети?
Нет, Архив собирает общедоступные веб-страницы. Мы не архивируем страницы, для доступа к которым требуется пароль, страницы, которые доступны только тогда, когда человек вводит и отправляет форму, или страницы на защищенных серверах. Страницы не могут быть заархивированы из-за исключений роботов, а некоторые сайты исключаются по прямому запросу владельца сайта.

Почему в архиве нет сайта, который я ищу?
Некоторые сайты могут быть не включены, поскольку автоматические сканеры не знали об их существовании во время сканирования. Также возможно, что некоторые сайты не были заархивированы, потому что они были защищены паролем, заблокированы файлом robots.txt или иным образом недоступны для наших автоматизированных систем. Владельцы сайтов также могли попросить исключить их сайты из Wayback Machine.

Некоторые сайты недоступны из-за robots.txt или других исключений. Что это значит?
Такие сайты могли быть исключены из Wayback Machine из-за наличия на сайте файла robots.txt или по прямому запросу владельца сайта.

Как я могу исключить или удалить страницы моего сайта из Wayback Machine?Если вы хотите подать запрос на исключение архивов вашего сайта или учетной записи из web.archive.org, отправьте нам запрос на адрес info@archive.org и укажите:URL-адрес или URL-адреса материала период времени, который вы хотите исключить период времени, в течение которого вы имели контроль над сайтом или соответствующей учетной записью пользователя (если применимо) и любая другая информация, которая, по вашему мнению, будет полезна нам для лучшего понимания вашего запроса. Это инициирует проверку нашей командой. Мы не даем заранее никаких гарантий относительно результата запроса.»

ЧИТАТЬ ЕЩЕ ПРО ВЕБАРХИВ

Платные услуги Веб-Архив.ру

Каркасная 3D-модель (вайрфрейм) автомобиля DeLorean из фильма «Назад в будущее», выполненная тонкими черными линиями на белом фоне.

Бесплатный проект Веб-архив.ру был запущен нами в 2016 году. На нем никогда не было ни рекламы ни платы за его использование. Проект был и остается полностью дотационным, а желания завешивать его рекламой, несмотря на неплохую посещаемость, нет - не хочется портить интерфейсы сайта и настроение пользователям.

Изначально миссия сервиса Веб-архив.ру заключалась в том, чтобы предоставить удобный русскоязычный интерфейс для доступа к материалам Архива Интернет вне зависимости от доступности последнего.

Между тем за прошедшие годы мы получили сотни писем от владельцев сайтов об удалении архивных копий и сайтов, и примерно такое же количество писем от пользователей которые по той или иной причине не могут найти нужные им архивные копии (в том числе это правообладатели, которые столкнулись в суде с проблемой исключения архивных копий интернет-страниц их владельцами из Архива-Интернет).

Указанные обстоятельства подтолкнули нас к решению о добавлении в сервис Веб-архив.ру услуги архивации интернет-страниц по запросу и хранение таких защищенных копий в непубличной части архива.

Стоимость архивирования и хранения непубличной (защищенной) архивной копии составит 49 руб., без ограничения срока хранения.

Мы думаем, что выбрали непростой, но несомненно интересный путь для этого проекта. Будем держать в курсе новых фичей, которые будут постепенно появляться в Российском Веб-архиве.

Мы открыты для предложений и идей. Пишите нам на info@webjustice.ru

Запущен сервис по формированию Архивных справок

В ответ на давний запрос пользователей о получении документа, подтверждающего содержания интернет-страниц на определенную дату, мы запустили сервис по формированию Архивных справок на нашем сайте Веб-архив.ру.

Справки формируются онлайн.
Процедура достаточно простая: вы находите интересующую вас архивную копию страницы за нужную дату и добавляете ее в список, в отношении которого и будет сформирована архивная справка.

Архивная справка - это удобный и практичный электронный документ, являющийся письменным доказательством, которое можно представить в суд, в целях подтверждения тех или иных обстоятельств, имеющих значение для дела.

Подробнее о том что содержат архивные справки и для чего они нужны можно прочитать в соответствующем разделе сайта

Вебархив - машина времени для юриста

вайрфрейм автомобиля DeLorean из фильма

Если кто не знает, в далеком 1996 году, американский программист и стартапер из Калифорнии Брюстер Кейл запилил самый большой в мире цифровой архив произведений литературы, музыки и искусства, который и по сей день продолжает архивировать разнообразный медиа контент.

Управляет архивом некоммерческая организация Internet Archive. Доступ к данным архива бесплатный.

Кроме литературных и музыкальных произведений библиотека интернета собирает и хранит архивные копии сайтов. По понятным причинам в архиве собраны не все до единого сайты мира и не за все даты. Поисковый робот системы, определяя возможность и частоту индексации сайтов, отдает предпочтение популярным ресурсам, но не смотря на это, в большинстве случаев в архиве удается найти архивные копии нужного сайта, даже если он мало известен.

Русскоязычная версия Вебархива появилась в рунете в 2014 году.

Вебархив на службе юристов и правообладателей

Грамотные юристы в России и за рубежом давно смекнули, что в Вебархиве можно найти много информации, которая послужит доказательством в суде, даже если Ответчик удалил данные со своего сайта или изменил их.

Порой и сами Ответчики прибегают к использованию Вебархива для возражения против необоснованных или завышенных требований Истца.

Как правило, Вебархив используется для подтверждения следующих фактов:

  • Наличие или отсутствие правонарушения
  • Длительность правонарушения
  • Характер и обстоятельства правонарушения
  • Иные факты, имеющие правовое значение

Круговая диаграмма распределения судебных споров

Как показывает практика, чаще всего данные из Архива Интернет используются для доказывания определенных обстоятельств по делам, связанным с защитой прав на объекты интеллектуальной собственности. По имеющимся у нас данным примерное соотношение споров, в которых используются архивные копии сайтов, мы отобразили на диаграмме

Какие обстоятельства стремятся доказать юристы, с помощью Вебархива?

  • Незаконное использование товарного знака или коммерческого обозначения
  • Предложение к продаже товаров и услуг в сети интернет
  • Длительность нарушения на объекты интеллектуальных прав
  • Совершение Ответчиком действий, направленных на сокрытие следов правонарушения
  • Использование объекта интеллектуальных прав ранее даты предоставления ему правовой защиты
  • Установление сведений о надлежащем Ответчике
  • Установление связи между лицом фактически использующим сайт в настоящее время и фактическим правонарушителем

А как суды оценивают данные из интернет архива ?

Большинство судов в Российской Федерации знают и используют Вебархив в качестве источника получения доказательств.

Суды принимают и рассматривают в качестве доказательств нотариально заверенные архивные копии сайтов, результаты автоматической фиксации информации, реже простые распечатки. Немало дел, где судьи не поленились непосредственно в судебном заседании исследовать Архив Интернета в порядке статьи 78 АПК РФ.

Понятное дело, что тренды в подобных вопросах задает Суд по интеллектуальным правам (СИП РФ), рассматривающий одноименные споры, который неоднократно указывал следующее:

  • Согласно части 3 статьи 75 Арбитражного процессуального кодекса Российской Федерации документы, полученные посредством факсимильной, электронной или иной связи, в том числе с использованием информационно-телекоммуникационной сети «Интернет», а также документы, подписанные электронной подписью в порядке, установленном законодательством РФ, допускаются в качестве письменных доказательств в случаях и порядке, которые предусмотрены этим АПК РФ, другими федеральными законами, иными нормативными правовыми актами или договором.
  • Такие доказательства признаются относимыми, если дата фиксации содержащейся в доказательстве информации соответствует периоду доказывания, либо если фиксация осуществлена после предъявления искового заявления в суд, однако зафиксированная информация подтверждает существование в сети «Интернет» сведений о фактах, существовавших до даты направления соответствующего предложения. К числу последних относятся данные веб-архивов.
  • Главным критерием принятия в качестве надлежащего доказательства архивных копий интернет-страниц, полученных из веб-архивов, является, во-первых, невозможность вмешательства заинтересованных лиц (участников спора) в информационный ресурс, во-вторых, создание и использование сервиса именно для хранения информации о том, каким именно было содержимое интернет сайта.
  • Рассматривая дело №СИП-338/2017 в качестве суда первой инстанции, Суд по интеллектуальным правам в своем решении указал, что представленные Роспатентом распечатки сведений из веб-архива WayBackMachine (web.archive.org) содержат дату фиксации информации и адреса нахождения информации в сети Интернет (ссылки на сайты). Такие доказательства признаются относимыми, если дата фиксации содержащейся в доказательстве информации соответствует периоду доказывания, предшествующему дате подачи заявителем заявки на регистрацию спорного товарного знака, либо если фиксация осуществлена после предъявления искового заявления в суд, однако зафиксированная информация подтверждает существование в сети «Интернет» сведений о фактах, имеющих место быть до даты приоритета. К числу последних относятся данные веб-архивов, которые и были представлены Роспатентом в обоснование своих доводов.

В 2017 году Суд по интеллектуальным правам выпустил Справку по некоторым вопросам, возникающим при оценке доказательств, содержащих информацию, размещенную в сети «Интернет» (утв. Постановлением Президиума Суда по интеллектуальным правам от 14.09.2017 № СП-23/24).


В указанной справке СИП уделил немало внимания вопросам оценки архивных копий сайтов. Надо сказать, что в данной справке СИП занял весьма сдержанную позицию. Так в пункте 3.5.11 Справки указано:

При представлении ответчиком по делам названной категории в подтверждение факта использования товарного знака путем предложения товаров и услуг доказательств, полученных с использованием сети «Интернет», в том случае, когда такие доказательства признаны относимыми, при проверке их достоверности суд учитывает, что интернет-ресурсы, оказывающие доступ к архивным копиям, как правило, указывают на то, что они не несут ответственности за достоверность представленной информации и ее идентичность информации, размещенной на сайте в конкретный период времени. Такие доказательства признаются достоверными при отсутствии возражений иных лиц, участвующих в деле. При наличии мотивированных возражений такие доказательства принимаются во внимание только в случае представления ответчиком иных доказательств использования товарного знака, которые оцениваются в совокупности и взаимной связи (постановление Суда по интеллектуальным правам от 13.02.2017 по делу № А56-21705/2016).

Вместе с тем, непосредственно при рассмотрении споров, в которых стороны ссылаются на данные Архива Интернет, Суд по интеллектуальным правам практически во всех случаях положительно оценивает такие доказательства, несмотря на возражения противной стороны.

Видимо причина в том, что составить мотивированные возражения против принятия архивных копий интернет-страниц довольно проблематично.

Так, Арбитражный суд Тюменской области в решении по делу №А70-9233/2016 указал следующее:

Таким образом, представленные в материалы дела истцом в целях защиты своего права архивные копии интернет-страниц, сохраненные на сайте www.web-arhive.ru, соответствуют требованиям, предъявляемым к доказательствам арбитражным процессуальным законодательством и в данной части доводы ответчика является не состоятельными

Рассматривая кассационную жалобу по указанному выше делу, Суд по интеллектуальным правам пришел к следующему выводу:

Суды первой и апелляционной инстанций обоснованно приняли во внимание в качестве доказательств того, что нарушение прав истца на спорное изобретение не прекращено ответчиком, представленные в материалы настоящего дела архивные копии (http://webarhive.ru) страниц сайта t72.ru; протоколы автоматизированного осмотра информации в сети Интернет Автоматизированной системой «ВЕБДЖАСТИС» за период с октября 2012 года по сентябрь 2016 года.

Мы регулярно следим за судебной практикой по вопросу применения доказательств из Интернет в судах Российской Федерации, и в том числе за практикой использования в качестве доказательств заверенных архивных копий интернет-страниц. Регулярно заходите в наш блог и знакомьтесь с информацией по данной теме.

@Daddy_Lawyer