Как фильтровать слова для взрослых

Возможный дубликат:
Как вы применить хороший фильтр ненормативной лексики?

Я разрабатываю веб-приложение и не хочу, чтобы люди публиковали контент для взрослых (порнографический).

Так есть ли услуга или список слов, связанных с порно?

Или есть другой способ отфильтровать контент для взрослых?


person enesness    schedule 07.03.2010    source источник
comment
stackoverflow.com/search?q=censor+censorship+obscenity   -  person kennytm    schedule 07.03.2010
comment
Это может иметь непредвиденные последствия, такие как блокировка терминов, связанных с сексуальным здоровьем, таких как презервативы для безопасного секса при раке груди. Я также вижу много блогов, которые обходят это, говоря p0rn или [s] ex.   -  person kyle k    schedule 27.06.2013


Ответы (3)


Это невозможно, Дисней провалил.
Если вы ограничите количество слов, которые можно использовать, вы увидите что-то вроде этого:

Я хочу засунуть своего длинношеего жирафа в твоего пушистого белого кролика

Что вам нужно, так это хороший способ для пользователей пометить неприемлемый контент и механизм, чтобы быстро с ним справиться. Один из способов - автоматически скрывать / удалять контент, если он был помечен более X раз.

person Nifle    schedule 07.03.2010
comment
Я рекомендую WebPurify за их фильтр ненормативной лексики API. Они постоянно улучшают и обновляют свои алгоритмы, поэтому со временем они становятся лучше: webpurify.com - person Marshall Æon; 07.10.2015

Просто помните о проблеме medireview при фильтрации ;-) Сделать ложный положительно при использовании простых алгоритмов фильтрации текста. Возможно, стоит даже рассмотреть подход Байесовской статистической классификации, используемый в спам-фильтрах.

person naivists    schedule 07.03.2010

Да, здесь и здесь. Прочтите: это невозможно.

person devio    schedule 07.03.2010