ПОЧЕМУ FaceApp – НЕ ТО, ЧЕМ КАЖЕТСЯ


*и не только он – все аналоги


Многие из вас решили посмотреть, как будут выглядеть в старости через FaceApp. Любопытно, а главное бесплатно – казалось бы, какой может быть подвох?:) Он есть и не один.
Приложения такого рода (речь о “загрузи свое фото и скажи нам ‘Икс’”, где икс может быть любым конкретным признаком содержания фото – возрастом, полом, указанием профессии, хроническим заболеванием человека на фото и так далее) как правило представляют собой конкретный, тщательно спланированный компанией-автором бизнес-процесс. Его можно описать так: “получить максимально ценную размеченную базу данных так, чтобы никому за нее не платить”.


Искусственный интеллект (он же – “ИИ”) и нейронные сети, как его разновидность, безусловно, имеет огромный потенциал практического применения, но одна из главных проблем “дата-сатанистов” (шикарный русский сленг для термина data-scientist), настраивающих модели для ИИ, – это чистота разметки базы. Если вы сидите и пытаетесь получить из какой-то базы данных пользу при помощи ИИ, главный стопор частенько именно в том, чтобы четко классифицировать информацию по конкретным признакам. Грубо говоря, кто-то должен посмотреть в цифры, и сказать, что этот номер – это паспорт, а вот это – именно водительские права, а в случаях фоточек – что это собачка, это кошечка, а это несовершеннолетний подросток славянской внешности. Если информация полностью размечена, то есть, классифицирована, вы, как data-scientist, можете начинать творить в ней чудеса, вроде создания ботов, автоматически ищущих всех несовершеннолетних славянских подростков в сети ВКонтакте, затем анализирующих все тексты на их стенах и, если найдено слово “наркотик” или упоминания конкретных названий препаратов, автоматически добавляющих всех этих подростков в особый список госнаркоконтроля (хотя подросток а) мог просто цитировать чью-то статью б) быть не в курсе, что за ним следят). Пример вымышленный, совпадения случайны. Я привожу его, чтобы вы поняли простую вещь – до того, как база не размечена, извлечение из нее практической пользы крайне затруднительно – для этого можно использовать интересные технические решения, но задача нетривиальная. Поэтому в сухом остатке – разметка имеет колоссальную ценность. В долларах, рублях, евро, фунтах.


В Китае проблема разметки в прямом смысле может решаться в ручную: парой миллионов китайцев, что получают приказ партии и целыми днями только и делают, что размечают фотографии по принципу “банан/не банан”, за минимальную зарплату (ибо партии не нужны безработные и опасные элементы). Западный мир претендует на демократию, поэтому обожает комбинировать капитализм и социализм по своему усмотрению. В частности, жить по принципу “зарабатывать по-максимуму, а платить по-минимуму”. Этот подход приводит к хитрым шагам вроде “CAPTCHA” (когда, чтобы авторизоваться на сайте, ва заставляют “доказать, что вы не машина” кликая на мосты/автобусы/котиков на фотках), тестам вроде “кто ты в Звездных войнах”, приложениям типа FaceApp и вирусным акциям типа “челлендж запостить, как я выглядел 20 лет назад”. Все эти задачи не имеют НИЧЕГО общего с декларируемыми. В реальности, капча помогает гуглу (как его автору) получать петабайты размеченных фото, результаты тестов “кто ты в звездных войнах” (а это ни что иное, как типовой тест на определение психологического типа) – немедленно привязываются к вашим данным браузера и сливаются маркетологам для контекстной рекламы (и вы можете сами в этому убедиться, почитав правила, на которых соглашаетесь участвовать – я просто не хочу тратить сейчас время в этом посте), а приложения типа FaceApp и аналоги – это ни что иное, как хитрый инструмент получения данных о топологии возрастных изменений.


И все бы хорошо, но есть вещи, которые меня лично напрягают. Главная – это нечестность объяснения правил игры. Если бы авторы подобных проектов честно и открыто декларировали на своих сайтах, что в реальности они собирают данные для конкретных платных продуктов и проектов, которые затем нам же будут продавать, – это было бы ок. Я считаю, что законодательно надо обязывать компании, штампующие игровые тесты капчи и ары вроде FaceApp, – обязывать их крупным шрифтом предупреждать о том, что они моментально сольют всю дату рекламным агрегаторам и/или будут использовать ваши фото без вашего ведома в исследованиях, рекламе, продажах (да, да, на это вы тоже подписались, согласившись с условиями). По аналогии с тем, как табачную индустрию обязали писать о том, что курить вредно, надо обязать дата-коллекторов предупреждать о своих истинных намерениях. У людей должен быть осознанный выбор, если мы претендуем на звание свободного общества.


Ведь чем по факту кончится FaceApp и предшествующий ему вирусный марафон “опубликуй фото себя молодого”? Такая база с ходу имеет, как минимум, 7-10 конкретных бизнес-применения. Назову самые очевидные 3:


1) Автоматическое определение возраста по фото, для ограничения доступа (доступ к банковскому счету, к порно-сайту, к типу лекарств). Погрешность будет большой, но как дополнительный фид данных – это крайне ценно и за такой API будут платить в том числе на гос. уровне.


2) Индустрия wellness&beauty – имея достаточное количество размеченных возрастных данных, можно действительно предсказывать внешние симптомы старения и рекомендовать конкретные косметические операции, терапии и так далее. Это многомиллиардный, если не трилионный бизнес, ибо многие хотят выглядеть, как Джордж Клуни и Анжелина Джоули. Мы сами подобную вещь делаем, но в сборе данных никого не обманываем.
3) Спец.Цели (назовем

это так) – в случае использования злоумышленником маскировки, париков, косметики, накладных элементов, для сокрытия своей истинной сущности, + поиск беглых и скрывающихся преступников – можно научить ИИ распознавать истинное лицо. Проблема тут в том, что результаты исследований в данном случае не публичны и принадлежат 1 компании, которая может избирательно раздавать эту власть.
В сухом остатке, все глубокие исследования и обозначенные задачи – полезны. Вопрос лишь в том, кому они полезны, как конкретно будут применяться и довольны ли вы ролью болванчика в этой игре. Как говорит Наташа Краснова “вот и все, вот и все”:)


p.s. like /share приветствуется, вопросы тоже смело задавайте, как обычно:) Понятно, что я описал тут вопрос по верхам. В деталях лучше будет прочитать в книге, которую я все же мечтаю вот-вот закончить и отдать издателю.


UP: друзья, коллеги, читатели – у меня нет задачи никого обратить в свою веру. Пост – моя позиция. Она обоснована. Если вы считаете, что это паранойя и для вас нормально на халяву помогать крупным компаниям обманом получать и размечать данные – это ваше право и я ничего не хочу доказывать. Просто призываю еще раз все взвесить. Шерлок Холмс был прав, когда говорил простую истину – «ищите мотив»:) никто и никогда не будет тратить деньги… просто так.