В файлах Steam найдено гигантское хранилище матов на 29 языках мира — из них 2000 слов русском языке.
Вероятно, по этим файлам разработчики фильтруют маты в чатах.
Посмотреть их можно в папке resource. Название файлов начинается с filter_profanity.
Отличный комментарий!
Поляки очень близко подобрались.
Хотя странно, у меня поляки впереди планеты всей, почти в два раза больше чем на русском по весу и в три раза больше по количеству строк.
полез смотреть у себя. То что на 1 скрине (со словом clean) - это список не матерных исключений.
А зачем это всё фильтровать?
Чтобы никто не писал гадости про высокопреосвященство и несовершеннолетних.
И правоохранительные неприкосновенности
Посттравматическая последовательность.
Правоохранительное превосходительство.
И продемонстрировать высокопреосвященству достопримечательности несовершеннолетних налогоплательщиков.
Часть сообщений на форумах/в отзывах бывает цензуриться, скорее всего список слов как раз из этих файлов и берутся
"неприкосновенность несовершеннолетней"
и чуть выше конфиденциальность налогоплательщиков, совпадение?
Да хуй его знает.
Меня в одной игре банили в чате за слово "проиграли", а само слово зац***урили, хотя я просто написал "Хоть мы и проиграли, но вы были отличные тиммейты".
Но там я хотя бы вижу логику: внесли в ЧС, чтобы не дай бох не допустить "токсичности", даже не подумав, что кто-то будет использовать слово "проигрыш" и производные не для того, чтобы хуесосить "нубов" в своей команде.
А какая тут логика я даже хуй знает
Вспомни овердроч, где за "GG" банили людей.
При этом у Дивы была реплика "ГГ"
наверное из-за школоты с их "проиграл с подливой"
этой школоте не за 30 уже?
В кс если включить чатфильтр, он будет цензурить слово "команда" в сообщениях от самой игры в чате. Судя по всему очень часто это делают на такой отъебись, что просто весь текст в чате фильтруется, независимо от происхождения.
Подозреваю filter_clean_* это список нормальных слов на которые реагирует фильтр матов, но не должен.
Судя по длине слов фильтр не понимает слова больше 17 букв и отправляет в мат если нет в этом списке.
Да прост валвы не смогли в регулярки это все завернуть (вероятно, плохо ориентируются в языке) и тупо нахерачили простыни однокоренных слов.
Сравни с английским - у меня там 69 строчек всего, которые по сути эквивалентны нашим 2000.
Так у них и jebać и chuj и pizda и все производные от них есть. В неблагополучных районах даже язык знать не нужно, чтобы нормально общаться.
"вхуякнуть"
фпедолить :)
полагаю это фильтр политкорректности на всех языках
Но там есть и flitered_banned_russian
вот русофобы
Читал регекспы. Много думал.
вторая директория стима -> огромный список архивов со словом banned_
долго же искали халявный резурспак для бана в играх по матюкам...
Игра Pure имела такой списочек еще в... когда она там вышла
въебурить
Ничего больше у китайцев в файлах нет, как все просто
filter_clean_* это скорей всего списки хороших слов которые банить не надо. В китайском и японском эти иероглифы не означают ничего плохого, но они могут быть вшиты в фильтр банов.
А в других файлах вообще нет ничего, вот и скинул что было)
Так не особо они там спрятаны чтоб их искать, больше забавляет что в файле banned english сразу маты кириллицей
клевый regexp
Теперь нужно написать слово нига так, чтобы он пропускал.
Подстрахуй
От подстрахуя слышу!
У поляков всё веселее
Пока это напишешь уже и забудешь зачем надо было сматериться-то...
там 6841 строка так то)
Пан Гжегош, опять вы за своё!
а файл timestamp это типа когда последний раз сам написал мат?
Отличный комментарий!