sfw
nsfw
ExtraDJ
ExtraDJ
Рейтинг:
1620.290 за неделю
Постов: 868
Комментов: 1832
C нами с: 2013-09-16

Посты пользователя ExtraDJ

Доброго, господа баянисты
Хочу поблагодарить всех кто донатил на патероне. Спасибо, за то что сняли с меня ответственность по оплате хостинга и домена. На сейчас 3 из 4 патронов ушли, а ответственность вернулась ко мне. Я на сейчас не сильно уверен в стабильной своего дохода, потому, буду рад и впредь не волноваться на эту тему
Ссылки на patreon/buymeacoffee есть на сайте баянометра
Спасибо 
Попробовал снова поиграться с более продвинутыми методами поиска, но, опять не пришел к положительным результатам. SIFT/SURF слишком громоздки. ORB ведет себя тоже неплохо, но полегче, и исполняет поставленные задачи, но, встает более серьезная проблема - поиск. Для снижения количества ложно-положительных результатов поиска нужно увеличивать количество точек для изображения. Увеличение количества точек - больше данных для поиска. Больше данных для поиска - меньше скорость и требуется больше мощностей. На реакторе больше 7 миллионов изображений. При < 100 точек - результат ультра гавно. 200-300 - более менее, но не на таком объеме. Это неплохо работало бы, если бы было 1-2 миллиона изображений. +- допустимые результаты, для такого объема, это 450+ точек на изображение. Итого, 3 миллиарда точек. Это порядка 200+ гигов данных, которые нужно хранить в оперативе, для более быстрого поиска. И даже при таких условиях поиск одной картинки длиться порядка 20-25 секунд, что уже далеко за приделами комфортного уровня. Можно ли решить это? Да, конечно, но это уже нужно распределять все на штуки 4+ сервера, а цена аренды такого удовольствия выходит слишком большая(150$+). Согласно опросу недавнему, она вроде бы подъемная, но, я прекрасно понимаю что обстоятельства у людей меняются. Кто-то переоценил свои финансовые возможности, а кого то просто заебет донатить на это, а бегать постоянно делать посты на это тему... Ну такое себе удовольствие.
Потому сорян, я правда старался, но уперся в ограничения не связанные с программными аспектами. Или может вы подскажите метод поиска hamming, который работает быстро на огромном объеме данных, и при этом не требует существенных апаратних ресурсов

p.s. это разве что собирать сразу на годик+ аренды, и тогда есть смысл дальше играться, но уже с несколькими серверами

Обновление 1.0.7

1. Исправлен баг, когда после длительного простоя, при быстром скачивании файл имел префикс 
undefinedundefined
2. Исправлена проблема, когда не грузились комментарии к определенным постам
Ссылки для установки/обновления:
Запрашиваю помощь пидоров
Столкнулся с проблемкой, и чето сильно туплю видать. Всем админам известная комманда ls -la через sftp вместо количества ссылок выдает знаки вопроса. При этом через ssh такой проблемы нет.
Через ssh:
-rwxrwxrwx  1 user  group  4096  Jul 15 15:15 filename
Через sftp:
-rwxrwxrwx  ? user  group  4096  Jul 15 15:15 filename
г' КУПОН ^
НА 1 ПОМОЩЬ,пидоры помогите,реактор помоги
Реквестирую помощь пидоров. Есть у меня картиночка, и уже который год я хочу найти фулы которые были использованы для ее создания. Уверен что местные пидоры узнают нужную жопу из десятков тысяч
V- vs	X ^
	
	
thigh	high socks
	
[ — |n,пидоры помогите,реактор помоги
Купон, по традиции, прилагается
г' КУПОН ^
НА 1 ПОМОЩЬ,пидоры помогите,реактор помоги

Отличный комментарий!

Не благодари
i PHILLY STEAK I & CHEESE
(IKS. RPRH (llli ISA13 n l
croissant crust
(hotpockets
■ sandwiches,пидоры помогите,реактор помоги
Попробую на досуге еще поиграться с алгоритмами поиска. Даже если все будет успешно - на повторное заполнение базы с 0 может уйти месяц-другой, так что скорых изменений не ждите, а пока есть просьба - накидайте постов, которые очевидно являються дублями, но при этом баянометр их не находит. Спасибо

Исправлен баг, который в определенных условиях мог создавать кучу запросов к API, и таким образом выдавался временный бан на IP пользователя. Обязательно к обновлению
Ссылки для установки/обновления:
Под недавним постом меня снова попинали на тему того, как хуево работает баянометр и все такое. О его недостатках мне хорошо известно, но, к сожалению это просто ограничения алгоритма который используется(pHash). Соответственно что бы от них избавиться - нужно заменять алгоритм, заново собирать новую базу и т.д. В качестве тестов уже был испробован ORB и SURF, и разные варианты на их основе. Они себя неплохо показали, особенно с поиском кропнутых картинок, но, когда речь заходит о другой деформации картинки в лице шакалов или ватермарков - начинаются большие проблемы. Даже незначительное шакальство они переваривают плохо и начинают давать в разы больше ложно положительных результатов, или наоборот не находить то, что точно должны. Был испробован другой алгоритм, использующий акселерацию ресурсами GPU. Он себя показал неплохо, но требует просто дохуища ресурсов, а без них - просто неюзабелен, ибо время поиска даже на тестовом, не особо большом объеме данных, достигало минут. Арендовать сервер с GPU крайне недешевое удовольствие, потому отпал как вариант. Сейчас на примете есть несколько еще алгоритмов которые можно было бы попробовать, и которые не на столько жрущие, но все ровно сулят существенным увеличением требований к серверу, потому решил провести опрос, дабы понимать вообще стоит тратить время на тесты и проработку вариантов, или оставляем как есть.
Текущий сервер на котором крутиться баянометр обходиться 12$/месяц. Его хватает с достаточным запасом, а благодаря трем реакторчанам на патреоне я могу снять с себя вопрос содержания сервера, за что им отдельное спасибо. Предполагаемая стоимость аренды сервера которого будет достаточна для +- адекватной роботы с терпимой скоростью поиска лежит в диапазоне 40-70$. Брать на себя полную ответственность за спонсирование этого я не готов, потому решил спросить у вас, готовы ли вы оплачивать содержание этого добра, если это будет реализовано. Метод оплаты - patreon / buymeacoffee. Отвечайте пожалуйста честно, с расчетом на своим реальные возможности, а так же учитывая среднесрочное прогнозирование. Спасибо
Готовы ли вы спонсировать содержание сервера баянометра
Да, готов. Могу позволить выделить на это 10$/мес. без какого либо дискомфорта
20(1,68%)
Да, готов. Мой комфортный придел - 3$ или около того
55(4,63%)
Мне бы хотелось что бы это было реализовано, но на финансовую поддержку действа я не готов
262(22,07%)
Забей хуй, и так нормально все работает, а те косяки которые есть - терпимы
850(71,61%)