Но это уже совсем другая история
Detector с функцией collector?
нет, collector с функцией detector.
Поляки в этом деле преуспели
Я лично предпочитаю заниматься этим вручную. Все эти технологии хрен их знает как они работают, а так проверенный человек уже знает своё дело.
Бля а действительно как?
При помощи общедоступной библиотеки цп для разработчиков, конечно же.
А между нами, разработчиками, где можно такую библиотеку достать? Надо центральный процессор разогнать, хочу знать что делают профи в этом деле.
Делают хороший общий энкодер картинок (картинка -> вектор), потом не глядя скармливают библиотеку с цп. Получившиеся вектора запихивают в базу и для каждой картинки подаваемой на вход делают KNN поиск. Калибруют similarity threshold чтобы не выдавать ложнопозитивные результаты.
Потом (после деплоя первой версии) у кого-то сверху возникает охерительная идея (надёжная как швейцарские часы) за-fine-tune-ить модель чтобы детектить ещё больше цп и бедным человекам-разметчикам из индии, которые работают за два бакса в час, приходят пользовательские картинки с высокой похожестью на цп (задетекченные первой версией модели, но которые не привысили threshold выше). У части аннотаторов явно после этого будут психологические проблемы, но зато теперь надёжно детектится на одну цп картинку в год больше и на одного потенциального латентного педофила больше сдают в ФБР.
Извините за сленг и английские термины, я плохо разбираюсь в русскоязычной терминологии.
Потом (после деплоя первой версии) у кого-то сверху возникает охерительная идея (надёжная как швейцарские часы) за-fine-tune-ить модель чтобы детектить ещё больше цп и бедным человекам-разметчикам из индии, которые работают за два бакса в час, приходят пользовательские картинки с высокой похожестью на цп (задетекченные первой версией модели, но которые не привысили threshold выше). У части аннотаторов явно после этого будут психологические проблемы, но зато теперь надёжно детектится на одну цп картинку в год больше и на одного потенциального латентного педофила больше сдают в ФБР.
Извините за сленг и английские термины, я плохо разбираюсь в русскоязычной терминологии.
Индус-разметчик во время создания датасета:
Ну если серьёзно, спасибо за такое доходчивое объяснение, мне самому было интересно, как работают с таким контентом.
так что в гугл устроится не так сложно, но разметчиком
за гугл не скажу, но обычно разметку аутсорсят третьим компаниям
Я, кстати, не согласен с этим утверждением. Зарплата мужчины - вещь, на которую он может повлиять. Низкая - не повод для стыда, особенно если ты молод. Мужчина не рождается успешным, он им становится.
Юность/красота/фертильность и всё что связано с вот этим вот "возраст" женщины - то, с чем она родилась. Не восполняемый ресурс, но всё-же ресурс данный ей изначально, и то, как она им распоряжается - её дело. Почему не стоит спрашивать у девушки её возраст? Что-бы, простите, не обидеть? Если ей 27-37 она, счастливо замужем и с детьми, у неё всё хорошо - какая разница сколько ей? А если ей 30 и у неё первые коты появились, то боже упаси спрашивать.
Юность/красота/фертильность и всё что связано с вот этим вот "возраст" женщины - то, с чем она родилась. Не восполняемый ресурс, но всё-же ресурс данный ей изначально, и то, как она им распоряжается - её дело. Почему не стоит спрашивать у девушки её возраст? Что-бы, простите, не обидеть? Если ей 27-37 она, счастливо замужем и с детьми, у неё всё хорошо - какая разница сколько ей? А если ей 30 и у неё первые коты появились, то боже упаси спрашивать.
Чтобы написать коммент, необходимо залогиниться
Отличный комментарий!