Россия

Нет - обману: компьютер будет узнавать пол человека по набранному им тексту

Российским ученым удалось разработать метод компьютерной лингвистики, благодаря которому пользователю, желающему обмануть искусственный интеллект, не удастся этого сделать.
Подписывайтесь на Sputnik в Дзен

КИШИНЕВ, 28 апр — Sputnik. Коллективу российских ученых удалось разработать метод, который обучает компьютер распознавать пол человека по набранному им тексту. Точность определения гендерных признаков пишущего варьируется у отметки в 80 процентов. Исследование проводилось специалистами из российского "Курчатовского Института" и Воронежского государственного университета. Научная разработка относится к области компьютерной лингвистики. Исследование проводилось по гранту Российского Научного Фонда.

Многочисленные научные исследования показывают, что в письменном тексте неизбежно отражаются характеристики его автора — пол, психологические особенности, уровень образования.

Речь является ценным психодиагностическим инструментом, который используют специалисты кадровых служб крупных компаний, а также служб безопасности.
На основе анализа речи можно диагностировать наличие у человека некоторых заболеваний таких, как деменция и депрессия, а также определить склонность к суицидальному поведению. Потребность в установлении характеристик автора текста также растет с развитием интернет-коммуникаций: компаниям важно знать, каким группам лиц нравятся их товары и услуги.

Букштейн: искусственный интеллект брошен на борьбу с Russia Today

Ученые, работающие в данном направлении (лингвисты, психологи, специалисты по информационным технологиям), на основе численных значений различных параметров текста строят математические модели для диагностирования тех или иных параметров личности.

Коллектив специалистов проанализировал эффективность различных технологий машинного обучения с использованием нейронных сетей для анализа текстов.

В ходе исследования они сравнили точность решения задачи гендерной идентификации текстов на основе двух подходов к моделированию на основе данных: с одной стороны, алгоритмы машинного обучения, с другой стороны — нейронные сети глубокого обучения.

Создан искусственный интеллект, превосходящий человека в аналитике

"Мы достигли высоких результатов в определении пола автора текста благодаря продвинутым нейросетевым моделям, в условиях, когда автор не скрывает свой пол. На очереди задача определения пола в условиях его намеренного сокрытия", — рассказал доцент Александр Сбоев.

Так, в следующих текстах, размещенных изначально на сайте знакомств, нейросеть без труда находит подвох в десяти случаях из десяти, притом, что автор намеренно ставит в подписи имя противоположного пола.

Текст написан девушкой: "Я красивый, накачанный мужчина 30 лет. Работаю в крупной компании на хорошей должности с приличной зарплатой. Живу в собственной квартире в центре города. В собственности также находится небольшой, но симпатичный домик в одной из деревушек Италии. Увлекаюсь спортом, в частности, футболом. Люблю выбираться куда-нибудь на выходные, не терплю домоседок. Девушка, которая мне бы подошла, должна обладать скромным нравом, красивой внешностью и привлекательной фигурой по современным стандартам. Она должна разделять мои интересы, не должна быть ревнивой и не должна пытаться вызвать чувство ревности у меня. Содержать девушку я не собираюсь, так как считаю, что в семье должны работать оба. Бюджет также предпочитаю вести раздельно. Не потерплю измены".

Текст написан мужчиной: "Здравствуйте! Я крайне недовольна, крайне! Почему вы так себя с нами ведете?! Мы же тоже люди, мы все равны! Вы сексист? Я больше не буду это терпеть! Я твою машину вообще всю разобью, разрисую. Жди, нелюдь. Финишу таким быть".

Ученые разработали замену важному человеческому органу>>>

Результаты этого исследования показали, что подход, основанный на использовании сверхточной нейронной сети и методов глубокого обучения для распознавания пола человека, написавшего текст, является наиболее оптимальным.

Сейчас группа исследователей работает над задачей распознавания возраста пользователя компьютера, который сознательно скрывает свои прожитые годы.