Глава комитета Государственной думы по вопросам семьи, женщин и детей Елена Мизулина объявила о новых инициативах в своей бескомпромиссной борьбе со всем тем, что приносит вред детям.
Инициатив четыре. Первая — уголовная ответственность за хранение детской порнографии без цели сбыта. Вторая — создание базы данных «образов детской порнографии». Третья — специальный хостинг для сайтов школ, чтобы школы не пользовались бесплатными хостингами, показывающими вредную для детей рекламу. Четвертая — обязать сотовых операторов сделать для детей специальный безопасный мобильный интернет, подключение к которому будет осуществляться при использовании специальной «детской» SIM-карты.
Презрев все инициативы, кроме одной, циничные блогеры немедленно стали строить планы на базу данных с «образами детской порнографии». Во-первых, появились прогнозы относительно скорости появления этой базы данных в продаже. Во-вторых — предположения о ее возможной цене. Ну и в-третьих, был задан резонный вопрос: если предполагается уголовная ответственность за хранение детской порнографии, то кто же тогда рискнет создавать целую базу данных с подобным контентом?
Что ж, все эти вопросы резонные, а депутат Мизулина, хотя и ссылается на опыт США, но в интернете не очень разбирается. Соответственно, пояснить свои инициативы она не может.
Между тем большие базы данных с «образами» действительно существуют. Попробуйте, например, выложить на YouTube что-нибудь, на что могут быть оформлены авторские права. Cкажем, серию «Симпсонов». У вас ничего не получится: YouTube сообщит вам, что контент защищен правами, и даже назовет, чьими именно. Довольно трудно предположить, что Google — владелец YouTube — имеет штат модераторов, глазами отсматривающих все 72 часа видео, которые выкладываются на видеохостинг ежеминутно. Масштабы подобного модерариума должны были бы быть совершенно китайскими. Но, по счастью, мы живем в XXI веке, и одна из ведущих технологический компаний мира придумала, как отсекать «Симпсонов» автоматически.
Для этого из исходного изображения — или последовательности изображений, если речь идет о видео — вычисляется некое число, называемое «хеш-значение». Хеш-функция, то есть алгоритм, по которому вычисляется это число, в разных случаях разная, и, собственно, именно эта функция и составляет ноу-хау любой подобной системы. Смысл ее работы в том, что хеш-значения, полученные из двух одинаковых картинок, должны совпадать. Если они совпадают — значит, это одна и та же картинка. Или одна и та же песня, или одно и то же всё что угодно, поскольку любая информация на компьютере — это файл, состоящий из нулей и единиц, и вычислить хеш-значение можно из информации любой природы.
Важным свойством любой подобной системы является то, что хранить собственно контент в базе данных не нужно — достаточно хранить только хеш-значение. Так сделано, например, в любой системе, которая принимает пароли. Из соображений безопасности пароль никогда не хранится в системе. Когда пользователь заводит себе пароль, из него сразу же вычисляется хеш-значение — оно и хранится, а получить из него исходный пароль невозможно. Когда пользователь хочет войти в систему, он вводит пароль, из него также вычисляется хеш-значение, которое сравнивается с хранящимся в системе. Если они совпадают — значит, пароль правильный.
Таким образом, «база данных образов детской порнографии» самой детской порнографии содержать, конечно, не будет. Она будет содержать лишь вычисленные из картинок и видеофайлов значения, которые можно будет быстро и, что немаловажно, автоматически проверять на совпадения со значениями, полученными из любой картинки или видео, выкладываемых на какой бы то ни было сайт. И даже архивация запретного контента не сможет укрыть его от подобной проверки.
А что может укрыть запретный контент от проверки — это его шифрация. Здесь у одного из очень немногих действительно разумных предложений депутата Мизулиной слабое место.
Дело в том, что педофилия в настоящее время — самый осуждаемый из человеческих пороков. Соответственно, педофилы свое пристрастие скрывают. Нет, есть, конечно, такие, которые его пытаются обосновать, причем публично, но это скорее клинический случай. Типичный любитель картинок с голыми детьми вряд ли будет вывешивать их в интернет в незашифрованном виде — он же не самоубийца.
Таким образом, от собственно педофилов (людей, обменивающихся подобным контентом) система Елены Мизулиной не спасет. Она сможет лишь очистить Сеть от явных идиотов и от доступных примеров педоконтента. Хотя лично я, признаться, за 20 лет практически постоянного пребывания в интернете ни разу ни на какую детскую порнографию в открытом виде не натыкался. Даже тогда, когда в интернете не было ни правительств, ни законов, ни даже контролирующих практически весь контент могущественных корпораций.
Впрочем, несмотря на некоторые упомянутые недостатки, создание подобной системы действительно выглядит довольно разумным.
Осталось только подсчитать, сколько бы она могла стоить.