23 мая 2012 г.

Искусственный разум. Роботы начинают составлять все более серьезную конкуренцию журналистам.


С недавних пор на американском сайте Forbes стали появляться статьи, автором к которым указан Narrative Science (дословно "рассказывающая наука"). Это технология, которая позволяет создать связный текст без участия человека, причем, если раньше роботы-журналисты работали только с мертвой статистикой и писали о результатах спортивных матчей или финансовых прогнозах, то теперь они могут составлять и околополитические тексты. 
Западные авторы, которым теперь приходится рассматривать роботов как своих конкурентов, активно обсуждают, какие плюсы и минусы приносит в журналистику эта технология.

Написано роботом

Строго говоря, Narrative Science - это не только технология, но и название чикагской компании, которая придумала алгоритм, позволяющий машине преобразовать сухие факты в тексты. Компания была основана в 2010 году Ларри Бирнбаумом, Крисом Хэммондом и Стюартом Фрэнкелем. Бирнбаум и Хэммонд - выпускники Йельского университета, имеющие лингвистическое и программистское образование, а Фрэнкель - один из бывших топ-менеджеров компании DoubleClick, которая теперь создает рекламные сервисы Google.
Первая история, которая была написана роботом, была посвящена результатам бейсбольного матча. В большинстве статей, которыми первое время занималась компания, обрабатывалась либо спортивная, либо финансовая статистика: робот брал за основу таблицу или финансовый отчет, вычленял главные факты, которые шли в первый абзац статьи, выстраивал композицию и даже придумывал к материалу заголовок, отражающий основное содержание.

Разработчики однако утверждают, что Narrative Science может работать с любым видом информации и любой темой. Для этого в работе программистам помогают журналисты, с которыми сотрудничает Narrative Science. Технология Narrative Science, хотя и использует один и тот же основной алгоритм, изменяется в деталях под каждого нового клиента. Самая простая часть - это смена формата (имен, дат, шрифтов). Перед журналистами же ставится более серьезная задача: определить, каким должен быть стиль статей, и подобрать необходимый набор специфических слов и выражений, которые должен знать робот. Именно благодаря тому, что журналисты задают роботам стандарты и язык обычных журналистских материалов, статьи от Narrative Science в действительности не выглядят, как написанные машиной.



На настоящий момент у компании Narrative Science уже более 30 клиентов, а прибыль за прошлый год составила 6 миллионов долларов. От строительных и финансовых компаний, которые использовали робота для создания внутренних отчетов, технология пришла и в настоящую журналистику - компания Narrative Science подписала контракт с Forbes и теперь создает для него материалы по отчетам о доходах компаний. Назвать язык в статьях Narrative Science очень живым и красочным нельзя, зато в них доступным образом излагаются все необходимые факты.
Компания продолжает развивать технологию и дальше. В феврале этого года Narrative Science сгенерировал статью на околополитическую тему: она была сделана на анализе записей в Twitter и рассказывала о частоте упоминаний в микроблоге имен кандидатов в президенты от партии республиканцев. При этом робот сделал и попытку анализа собранных данных, хотя и не очень глубокого:"Хотя общий характер твитов о Ньюте Гингриче позитивен, в общественном мнении, касающемся кандидата и его образа, наблюдается негативная тенденция".
Но компания ставит перед собой куда более амбициозные задачи, чем простой анализ статистики и записей в социальных сетях. Как пишет журнал The Atlantic, создатели технологии сейчас работают над проектом "аудитория одного", в рамках которого они надеются научить Narrative Science генерировать тексты, предназначенные одному человеку или небольшой группе людей. Статьи будут подстраиваться под интересы отдельных людей, а их тематика будет варьироваться от оценки биржи с предложением, какие акции покупать, до разъяснений медицинских анализов клиента.

Друг или враг

Внедрение Narrative Science в мир медиа, да еще и с такими захватывающими дух перспективами, естественным образом вызывает большой отклик у самих журналистов - которые видят в авторе-роботе как своего конкурента, так и полезного помощника.
С того момента, как журнал столь высокого класса, как Forbes, позволил себе публиковать опусы Narrative Science, в прессе не перестают появляться разгромные рецензии статей, созданных роботом. Одни отмечают унылый и чуть ли не примитивный стиль, другие - низкий уровень аналитики, а третьи немедленно находят следствие - низкую посещаемость статей.

Исследования Narrative Science, скорее всего (сама компания не раскрывает деталей своей работы), относятся к так называемой обработке естественного языка (Natural Language Processing, NLP) - теории на стыке исследований по созданию искуственного интеллекта и математической лингвистики. NLP изучает проблемы компьютерного анализа текстовой информации, а также вопросы синтеза грамотного (то есть соответствующего правилам естественного языка) текста. Надо сказать, что задача синтеза текста проще задачи его анализа - достаточно вспомнить, как работают машинные переводчики или системы распознания речи. Именно поэтому, во-первых, заявление авторов о скором создании индивидуальных информационных систем следует рассматривать с изрядной долей скепсиса. Во-вторых, работа машин, судя по наличию журналистов, изготавливающих шаблоны, основана на обычных нейронных сетях, поэтому принципиально не отличается от аналогичных систем в других отраслях.

Несмотря на обилие критики, многие журналисты видят в Narrative Science определенную конкуренцию - хотя бы потому, что на создание одной статьи, в отличие от журналиста, у робота уходит несколько секунд. В первую очередь от такой конкуренции могут пострадать сотрудники новостных агрегаторов, которые не производят собственного контента. Кроме того, компьютер может быстро и легко обрабатывать большие объемы информации - человеку, к примеру, просто не уследить за постоянно обновляющимися записями в социальных сетях. Ну и наконец, робота, в отличие от человека, сложно уличить в необъективности, а в нишевых СМИ точная подача фактов бывает куда важнее изысканного авторского стиля. Роботы-журналисты, к тому же, обходятся владельцам СМИ куда дешевле, чем обычные люди - причем, во всех смыслах. Так, по данным The New York Times, за одну статью в 500 слов, созданную посредством Narrative Science, клиенты могут платить меньше 10 долларов. К тому же, автор-робот избавляет владельца СМИ от необходимости предоставлять хорошие условия работы, платить за страховку и отпускать сотрудника в отпуск. По сути, клиент платит только за алгоритм, все остальные издержки берет на себя сама Narrative Science.
Но журналистов волнует не только практическая, но и этическая сторона вопроса. Автор Евгений Морозов в статье под названием "Робот украл мою Пулитцеровскую премию" отмечает возможные негативные последствия от развития технологии в области персонализированной прессы. Он пишет, что поскольку компьютер будет выдавать статьи на основе активности человека в интернете, то разным людям он будет преподавать одну и ту же информацию по-разному. Так, любителям условного Life News (или USA Today) он будет выдавать статьи, активно сдобренные сплетнями и пикантными подробностями, и в случае, если много изданий обзаведутся подобными роботами, люди просто не будут иметь возможности вырваться за пределы того, что Морозов называет "junk press" - или фаст-фуд прессы. В этом потоке желтых статей все сложнее будет выжить качественной эрудированной журналистике, с которой у большинства людей просто может не быть возможности познакомиться.
Тем не менее, несмотря на все тревоги и претензии журналистов, создатели Narrative Science утверждают, что технология на самом деле должна упрощать жизнь сотрудникам СМИ. Они объясняют, что программа мгновенно анализирует большие объемы информации (та же статистика или социальные сети), и журналисты, экономя время, могут работать уже с этой рыбой и превращать ее в интересный аналитический текст. Таким образом, технология позволяет выходить медиа совсем на новые уровни и достигать совсем другой глубины анализа.
Конечно, из-за технологий типа Narrative Science конкуренция в сфере СМИ растет - но растет она скорее в том смысле, что журналистам надо стараться куда больше, чтобы их тексты выглядели достойно на фоне материалов, сгенерированных роботом. А это в свою очередь не может не идти на пользу медиасфере, которая одновременно задыхается от переизбытка людей, называющих себя журналистами, и нехватки действительно хороших репортеров и авторов.
Narrative Science
ЗХЖ 
 

Комментариев нет:

Отправить комментарий