Британская библиотека сегодня приступила к созданию архива, включающего в себя содержание всех интернет-страниц, размещенных в национальном секторе интернета, а также все электронные книги, газеты, журналы, выпущенные на территории страны. Архив будет включать содержание всех британских блогов, в том числе на сайте Twitter, а также все данные, размещенные подданными королевства в открытом доступе на своих страницах в социальных сетях, таких как Facebook. С полуночи сегодняшнего дня /03:00 мск/ вступил в силу закон, разрешающий создание подобного архива. В это время сотрудники Британской библиотеки включили компьютеры, на которых установлены программы, отбирающие в интернете и записывающие на специальных серверах данные всех страниц, относящихся к национальной зоне интернета.
Сначала на серверы будет закачано содержимое всех сайтов, зарегистрированных в доменной зоне .uk /United Kindgdom — Соединенное Королевство Великобритании и Северной Ирландии/. Их, по оценкам, насчитывается около пяти млн, и они содержат около одного млрд отдельных электронных страниц. Затем программа начнет искать британские сайты, размещенные в доменных зонах .com и .org. Их число оценивается примерно в 3-4 млн.
Издатели каждой электронной книги, издаваемой в стране, отныне обязаны будут предоставить ее в распоряжение Британской библиотеки. Сайты газет и журналов, в том числе доступные только по подписке, должны бесплатно предоставить главному книгохранилищу страны содержание статей, размещенных на своих страницах. Кроме того, в библиотеку будут сдаваться все DVD, выпущенные на территории Великобритании.
Британская библиотека будет при помощи программного обеспечения создавать электронные «копии» блогов и страниц в социальных сетях, находящихся в открытом доступе. Личные данные, защищенные паролем или размещенные «только для друзей», архивироваться не будут, чтобы сохранить неприкосновенность частной жизни. Отслеживание блогов и социальных сетей поможет будущим исследователям изучить общественную реакцию на значимые исторические события.
Работа по скачиванию на серверы всего содержания британской зоны интернета займет несколько месяцев. База данных станет доступна для библиотечных пользователей начиная с января будущего года.
Созданная база данных, по расчетам будет включать 1000 терабайт информации /более миллиона гигабайт/, которые будут храниться на четырех серверах. Впоследствии каждый год будет создаваться новый архив, отражающий изменение британского цифрового информационного пространства за это период.
Содержание 250 наиболее популярных сайтов, таких как новостные порталы BBC и ведущих газет, со временем будет отслеживаться в более частом режиме, возможно, каждые несколько часов. Первоначальные инвестиции составили три млн фунтов /$4,5 млн/, впоследствии поддержание базы данных будет стоить два млн фунтов /$3 млн/ в год.
Помимо расположенной в Лондоне Британской библиотеки доступ к базе будет открыт для посетителей пяти учреждений, имеющих официальный статус «легальных хранилищ» информации. Это Бодлианская библиотека Оксфордского университета, Библиотека Кембриджского университета, национальные библиотеки Шотландии и Уэльса, а также книгохранилище Тринити-колледжа в ирландской столице Дублине.
Пользователи смогут войти в систему только в здании одной из шести этих библиотек. Один экземпляр электронного документа одновременно сможет посмотреть только один посетитель каждой из них, как это бывает с бумажными книгами. Это сделано для того, чтобы библиотеки не становились местами «массового» просмотра книг и газет, поскольку такая ситуация привела бы к уменьшению дохода издателей.
По британскому закону, с 1662 года издатели любой книги, брошюры, газеты или журнала должны отправлять один их экземпляр в Британскую библиотеку для вечного хранения. В наше время по одному экземпляру отправляется в шесть библиотек — «легальных хранилищ». Сейчас коллекция лондонской Британской библиотеки содержит 150 млн единиц книг, газет, журналов, рукописей. Каждый год к ним добавляется еще три миллиона изданий и документов.
В последние 20 лет из-за бурного развития интернета значительная часть печатного слова в Великобритании публикуется только в электронном виде. Принятый в 2003 году в Великобритании закон о «легальных хранилищах» позволил библиотекам создавать коллекции электронных изданий. Однако на деле это было сложно сделать, так как для архивирования каждого сайта или электронной книги необходимо было просить разрешения у издателя, обладающего авторскими правами. Переговоры с правообладателями длились 10 лет, компромиссный вариант закона был принят только сейчас.
«Этот проект позволит нарисовать картину разнообразия жизни в Соединенном Королевстве для наших детей и внуков, — считает Люси Берджес, глава отдела стратегии информационного наполнения Британской библиотеки. — Этой базой данных будут пользоваться все, от историков общества до дизайнеров моды, исследователей, изучающих наш язык и нашу культуру», — считает она.
… [Trackback]
[…] Find More Information here on that Topic: portaltele.com.ua/news/internet/2013-04-06-08-16-47.html […]
… [Trackback]
[…] Read More Info here to that Topic: portaltele.com.ua/news/internet/2013-04-06-08-16-47.html […]