Алгоритм обнаружения злоупотреблений Yahoo работает 90% времени, и это большой шаг вперед в своей области

помощь компьютерного алгоритма

В новостных статьях Yahoo, как и в остальной части Интернета, много сомнительных комментариев, поэтому команда Yahoo решила использовать свой раздел комментариев, чтобы разработать алгоритм, который мог бы успешно выявлять наиболее серьезных нарушителей. Их новый алгоритм обнаружения злоупотреблений работает в 90% случаев, что, по их словам, делает его более эффективным, чем попытки других организаций совершать аналогичные подвиги, и описывается как важный шаг вперед в этой области. 90 процентов делает Признаюсь, звучит неплохо.

Проводной сообщает, что Yahoo также выпускает первую общедоступную базу данных о ненавистнических высказываниях в Интернете в рамках своего проекта по борьбе со злоупотреблениями. Это означает, что другие сайты смогут использовать базу данных комментариев Yahoo для разработки своих собственных алгоритмов. Алгоритм Yahoo был разработан на основе машинного обучения, а также на основе данных пользователей о своих разделах комментариев.

Самая сложная часть любого алгоритма модерации комментариев - иметь дело с ложными срабатываниями. Многие алгоритмы обнаружения злоупотреблений ищут определенные слова или фразы, например оскорбления или распространенные оскорбления, и автоматически помечают комментарии для модерации. Однако это приводит к тому, что комментарии помечаются, даже если они ссылаются на оскорбление, например, в контексте того, что говорят, что это неуместно, или если комментарий является саркастической имитацией тролля. Алгоритм Yahoo, по-видимому, может обнаруживать определенные речевые модели, и он разработан для того, чтобы отличить шутливый сарказм от реального оскорбления. (Конечно, если ваш веселый комментарий неотличим от фактического злоупотребления, тогда я почти уверен, что алгоритм все равно пометит его, но я не могу точно сказать, как работает эта часть ИИ.)

Yahoo привлекла обученных модераторов комментариев, чтобы они помогли усовершенствовать алгоритм, и они также заплатили некоторым неподготовленным модераторам, и они обнаружили, что обученные модераторы намного лучше понимают, какие комментарии подходят (что-то вроде ежу понятно, но эй). В процессе создания ИИ Yahoo обнаружила, что работа этих обученных людей-модераторов была важна для поддержания эффективности алгоритма и совершенствования его методов обнаружения.

Конечно, алгоритмы все еще имеют предубеждения , что потребует (будем надеяться, разнообразной) команды модераторов, которые продолжат итерацию по методикам, используемым для классификации комментариев. Звучит как тяжелая работа, но по крайней мере Yahoo теперь понимает важность обучения и оценки ролей как своих хорошо обученных модераторов, так и их нового коллеги по ИИ.

вселенная стивена розовый кварц и жемчуг

(через Следующая Сеть , изображение через Майкл Кордедда / Flickr )