Новаторское исследование того, что она сказала

Удивительная эффективность и долговечность легендарного это то, что она сказала шутка, недавно снова популяризированная с помощью Офис , сделал больше, чем предоставил миллионам людей коленный ответ на случайный разговор. Теперь он вышел на новый уровень социальной значимости, вдохновив серьезные лингвистические исследования. Он представлен в форме исследовательской работы под названием Вот что она сказала: двойная идентификация , за авторством двух студентов, изучающих информатику, Хлоя Киддон а также Yuriy Brun .

В своей статье пара обрисовывает в общих чертах свое создание Двусмысленность через перенос существительного или DEviaNT подход, который автоматически определяет, что она сказала (TWSS), шутит. Они называют свой подход метафорическим анализом, который несет в себе двойное значение и основан на оценке одних слов как более сексуальных, чем другие. Команда взвесила несколько сексуальных существительных и глаголов, а затем запустила свой алгоритм.

В своем исследовании пара также обнаружила некоторые интересные правила шуток TWSS. Например, риск неправильно использовать шутку TWSS. Из их исследования:

Например, в социальной среде цена того, что она сказала неуместным образом, высока, в то время как цена того, чтобы не сказать это, когда это могло быть уместно, незначительна.

Чтобы решить эту проблему и добиться лучших результатов, команда использовала алгоритм обучения. Среди прочего, это установило в 100 раз больше ложных срабатываний, чем ложноотрицательных.

После запуска DEviaNT через серию предварительно идентифицированных шуток TWSS и случайных цитат. В своем тесте они использовали 1,5 эротических предложения и 57 000 неэротических предложений. Команда говорит, что они достигли показателя успеха, превышающего 71,4%. Хотя это может показаться не таким уж большим, команда говорит, что с большим набором данных они ожидали бы результатов, близких к 99,5%. Вдобавок DEviaNT дал несколько интересных результатов. Опять же из исследования:

DEviaNT вернул 28 таких предложений (все с одинаковой вероятностью являются TWSS), 20 из которых являются истинно положительными. Однако 2 из 8 ложных срабатываний на самом деле являются TWSS (несмотря на то, что исходят из отрицательных данных тестирования): Да, дайте мне все сливки, и он ушел. и да, но его дыра иногда действительно пахнет.

Некоторые могут преуменьшить значение этого исследования, назвав его просто забавой и малоценностью. Это была бы легкая атака, поскольку даже исследователи описывают свою работу как сложную проблему понимания естественного языка. (Это то, что она сказала.)

( Новый ученый через Беглец )