Алгоритмы Facebook помогут искать дубликаты видео и изображений для борьбы с недопустимым контентом

Алгоритмы Facebook помогут искать дубликаты видео и изображений для борьбы с недопустимым контентом
Facebook открыла исходный код двух алгоритмов. Они способны определять степень идентичности для фото и видео, даже если в них внесены небольшие изменения. Эти алгоритмы соцсеть активно использует для борьбы с контентом, содержащим материалы, связанные с эксплуатацией детей, террористической пропагандой и различными формами насилия. Об этом сообщает Информатор Tech, ссылаясь на FB Newsroom. Facebook отмечает, что она впервые поделилась подобной технологией, и в компании надеются, что с ее помощью другие крупные порталы и сервисы, небольшие студии по разработке ПО и некоммерческие организации смогут эффективнее бороться с распространением недопустимого медиа-контента в мировой сети. «Когда мы находим фрагмент недопустимого контента, технологии могут помочь нам найти все его дубликаты и предотвратить их распространение. Для тех, кто уже использует свою собственную или другую технологию сопоставления контента, наши технологии могут стать еще одним уровнем защиты, делая системы безопасности намного более мощными», — сообщили в Facebook. Facebook утверждает, что два опубликованных алгоритма — PDQ и TMK+PDQ — были разработаны для работы с огромными массивами данных и основаны на уже существующих моделях и реализациях, включая pHash, PhotoDNA от Microsoft, aHash и dHash. Например, алгоритм PDQ для сравнения фотографий был вдохновлён pHash, однако при этом разработан полностью с нуля разработчиками из Facebook, в то время как сопоставляющий видео TMK+PDQF создан совместными усилиями исследовательской группой Facebook по искусственному интеллекту и учеными из Университета Модены и Реджо-Эмилии в Италии. Оба алгоритма анализируют искомые файлы, благодаря коротким цифровых хешам, уникальным идентификаторам, которые помогают определить, являются ли два файла одинаковыми или похожими, даже без исходного изображения или видео. Facebook отмечает, что данные хеши могут быть легко переданы другим компаниям и некоммерческим организациям, а также отраслевым партнерам через Глобальный интернет-форум по борьбе с терроризмом (GIFCT), поэтому все заинтересованные в сетевой безопасности компании также смогут удалять контент, помеченный Facebook как небезопасный, если он загружен в их сервисы. Разработка PDQ и TMK+PDQ шла вслед за релизом вышеупомянутой PhotoDNA десять лет назад в попытке борьбы с детской порнографией в сети со стороны Microsoft. Также совсем недавно Google запустила Content Safety API, платформу искусственного интеллекта, предназначенную для выявления онлайн-материалов о сексуальных надругательствах над детьми, чтобы сделать работу людей-модераторов более эффективной. Ранее сообщалось, что стартапы в сфере секс-технологий объединяются, чтобы протестовать против рекламных политик Facebook. Помимо этого, Facebook успешно провела тест читающей мысли системы. Узнать еще больше актуальных новостей из мира технологий и игр можно в нашем Telegram-канале и на Facebook.
Главная Актуально Україна на часі Youtube
Информатор в
телефоне 👉
Скачать