Можно искать картинки на джое через google.картинки с фильтром "site:joyreactor.cc". А нельзяли встроить эту функцию в сам джой? Если поиск находит что-то, писать, что картинка баян и давать ссылку. По идее надо только парсер возвращаемых значений написать. Боянов должно стать гараздо меньше.
ну, ты не поверишь...
Нынешний баянодетектор совсем тупой. Ищет только картинки, 1 в 1 совпадающие с загружаемой. Обрезали полоску пикселей, убрали вотермарк, другое разрешение - и всё, детектор ничего не найдёт.
гуглопоиск куда умнее.
гуглопоиск куда умнее.
в принципе, если постить только ориджинал контент, а не репостить репосты в бесконечной веренице боянов - поиск будет не нужен...
Мне лично джой даром не нужен только с ориджинал контентом. У нас не девиантарт чай.
А ты представляешь что будет если каждый сайт будет со своим ориджинал контентом?
Сразу возникнет агрегатор и срубит трафик и бабло.
По сути шило на мыло меняем, сейчас юзеры делают подборку с других сайтов с вкраплениями ОК, а по твоему варианту это будет сборщик делать.
И есть одно большое НО, если юзер посещает только jr то, первое имеет место быть, если же он сидит на всём что хоть сколько-нибудь годнее говна, то тогда надо что-то делать.
И есть одно большое НО, если юзер посещает только jr то, первое имеет место быть, если же он сидит на всём что хоть сколько-нибудь годнее говна, то тогда надо что-то делать.
> убрали вотермарк, другое разрешение - и всё, детектор ничего не найдёт.
Это не баг, это фича. представь, как гуглопоиск и последующий "парсер" будут нещадно резать адвайсы/"мемы"/etc, на которых только текст разнится. Как лесом пойдут комиксы с разным переводом, фотожабы. ИМХО, то, как сейчас работает - норм. баяны можно и заминусовать, раз уж модеры разделов за контентом не хотят смотреть.
Это не баг, это фича. представь, как гуглопоиск и последующий "парсер" будут нещадно резать адвайсы/"мемы"/etc, на которых только текст разнится. Как лесом пойдут комиксы с разным переводом, фотожабы. ИМХО, то, как сейчас работает - норм. баяны можно и заминусовать, раз уж модеры разделов за контентом не хотят смотреть.
Сейчас же ничего не режется, только выдаётся предупреждение со ссылками на похожие посты. Пользователь в любом случае сам выбирает, заливать или нет.
Вообще, в идеале бы конечно реализовать свой алгоритм поиска похожих изображений - это и независимость от гугла и его индексатором, и возможность подобрать оптимальную строгость при поиске похожих изображений.
Вообще, в идеале бы конечно реализовать свой алгоритм поиска похожих изображений - это и независимость от гугла и его индексатором, и возможность подобрать оптимальную строгость при поиске похожих изображений.
У тебя есть готовый алгоритм?
Как минимум на хабре видел статью с достаточно подробным описанием основных способов сравнения. Если коротко, то при заливке для всех картинок надо будет делать ряд однотипных операций - перевод в оттенки серого, создание нескольких миниатюр малого размера (64x64, 32x32, 8x8...) и вычисление какой-то особой функции для них. В дальнейшем для поиска соответствий используются именно результаты вычисления этой функции.
Пересказал как помню, читал давно уже.
Пересказал как помню, читал давно уже.
На днях решал такую проблему. Модуль для php libpuzzle спасет отца российской демократии.
1) Делать парсер гугля - дело неблагодарное. Гугль легко забанит его.
2) в гугль-картинках совпадения могут быть очень примерными.
3) баянометр будет дорабатываться
2) в гугль-картинках совпадения могут быть очень примерными.
3) баянометр будет дорабатываться
чётко, ясно, с расстановкой - спасибо, всё понятно :)
парсить гуглю тяжелое решение:
надо дохера IP чтобы не банились запросы
надо все распарсить и сравнить сходство иначе будет слишком дохуя похожих. вот тут и теряется весь смысл затеи
надо дохера IP чтобы не банились запросы
надо все распарсить и сравнить сходство иначе будет слишком дохуя похожих. вот тут и теряется весь смысл затеи
А мне баяны не мешают. Ну баян и баян, чего бугуртить? А некоторые годные баяны и с удовольствием лишний раз глянуть можно. Как и старые, которые тупо не видел в силу их давности.
ну вообще гуглпоиск по картинкам с джоем работает не идеально, я хз что с ним не так, но он не находит всех картинок, например, был случай, когда гуглом я не смог найти похожее изображение, а вот вручную за минут 30 у меня все получилось. Естественно я бы не занимался такой ерундой, если бы не был уверен, что видел уже похожий пост на джое ранее. Такое впечатление, что гугл не индексирует часть джоя.
алгоритм гугла помойму тоже не сильно блеск
картинки без вотермарка на основе данной еле-еле со скрипом находит, и то не всегда
картинки без вотермарка на основе данной еле-еле со скрипом находит, и то не всегда
А можно сделать так, чтобы круглое стало квадратным. И добавьте немного Джастина Бибера над логотипом... И да это должно всем нравиться.
PS То, что для одних боян, для других ново.
PS То, что для одних боян, для других ново.
тогда на реакторе не станет картинок.
сталкер...
Гугль часто выдаёт совсем непохожие картинки как похожие, так что в качестве баянодетектора он не годится.