Сегодня четверг, 25.04.2024, 08:40, ньюсмейкеров: 44181, сайтов: 1206, публикаций: 3429203
11.12.2008 00:00
Новости.
Просмотров всего: 2454; сегодня: 1.

Cognitive Translator — система машинного перевода текста нового поколения

Cognitive Translator — система машинного перевода текста нового поколения

Cognitive Technologies представляет систему машинного перевода текстов нового поколения Cognitive Translator, в основу которой легло более глубокое представление знания о языке. Процесс разработки системы занял около 60 человеко/лет и длился более 8 лет.

Научный коллектив Cognitive Technologies (в то время ВНИИСИ АН СССР) начал заниматься задачами машинного перевода, как направлением искусственного интеллекта, более 20 лет назад, за 5 лет до образования компании, в рамках работ по набору первых словарей перевода. Проект Cognitive Translator рассматривается компанией как научный, хотя некоторые из его результатов сегодня используются при построении комплексных информационных систем и при разработке тиражируемых программных продуктов.

Проект по созданию данной версии Cognitive Translator начался в 2000 году. Его участниками, помимо специалистов Cognitive Technologies, стала группа профессиональных лингвистов из МГУ, Института Русского Языка РАН и других организаций. Группой были разработаны уникальные алгоритмы синтаксического разбора и правила машинного перевода. На их основе была построена новая более совершенная — структурная модель представления знания о языке, которая включает, помимо описания морфологии и синтаксиса, еще и элементы анализа структурных связей. За счет этого система добивается глубокого «понимания» текста, и даже претендует на разрешение смысловых неоднозначностей («ключ» дверной и «ключ» - источник воды).

Принципы построения модели языка, заложенные в Cognitive Translator, основаны на технологии анализа — понимания текста, что позволило в рамках исследовательского проекта при участии относительно небольшой группы разработчиков создать систему, дающую качество перевода, сравнимое с современными промышленными системами. Стоит отметить, что существующие сегодня на рынке системы машинного перевода используют подход, разработанный еще в 70-ых годах прошлого века, подразумевающий непрерывное ручное наполнения базы словоформ. Для достижения высокого качества перевода и добавления новых языков этот подход требует подключения огромных ресурсов (сотен специалистов), что, естественно, ограничивает число коллективов, занятых в этой области.

Предложенная компанией Cognitive Technologies модель описания «языка» практически инвариантна (по отношению к языкам) и позволяет на порядок снизить трудозатраты при описании морфологии и синтаксиса различных языков мира. Построенные на ее базе системы перевода нового поколения позволят разрешать смысловые неоднозначности не только для двух языков, но и для всего межъязыкового пространства. В настоящее время ядро системы — анализатор текста, предназначенный для описания новых языков, находится в открытом доступе.

Технологии анализа информации, разработанные в рамках проекта Cognitive Translator, находят свое применение в создаваемых компанией информационных системах, в частности для решения задач распознавания и «понимания» документов.

9 декабря Cognitive Translator (включая описание системы) был выложен в открытый доступ в сети Интернет на сайте www.cognitive.ru в разделе «Научные исследования», что является подарком посетителям сайта к Новому году. Система представляет собой интерактивную среду, обеспечивающую возможность перевода, редактирования и синхронного просмотра оригинала текста, перевода и дополнительных вариантов перевода. Ограничение по размеру переводимого текста составляет 32 Кбайт (примерно 32 000 знаков). Система поддерживает два направления перевода англо-русский и русско-английский.

Необходимо отметить, что представляемый проект находился в течение последних пяти лет в режиме альфа–тестирования. За это время система сделала порядка 20 млн. переводов (около 15 000 переводов в день).

В ближайших планах по развитию проекта Cognitive Translator: добавление новых языков перевода, создание и подключение новых правил перевода, совершенствование технологий «понимания».

Тематические сайты: PublisherNews - портал системы продвижения публикаций, Информтехнологии, связь, Интернет, Искусственный интеллект, Клуб "Бизнес, информация"
Сайты субъектов РФ: Москва
Сайты федеральных округов РФ: Центральный федеральный округ
Сайты стран: Россия

Ньюсмейкер: Cognitive Technologies — 214 публикаций
Поделиться:

Интересно:

Ранее неизвестные поселения позднего бронзового века найдены в Крыму
24.04.2024 18:02 Новости
Ранее неизвестные поселения позднего бронзового века найдены в Крыму
Учёные Крымского федерального университета обнаружили поселение позднего бронзового века на территории Караларского природного парка в керченском Приазовье. Об этом сообщила заведующая отделом естественнонаучных методов в археологии Научно-исследовательского центра истории и археологии Крыма КФУ...
Свыше 102 млрд руб. составила годовая выручка социального бизнеса
24.04.2024 17:05 Новости
Свыше 102 млрд руб. составила годовая выручка социального бизнеса
Минэкономразвития России актуализировало данные по деятельности социальных предпринимателей в экономике в целом и в региональном разрезе. На январь 2024 года в России зарегистрировано почти 11 тысяч социальных предприятий. Из них 7,8 — тысяч...
Объявлен конкурс на проект памятника «Детям войны» в Горно-Алтайске
24.04.2024 12:43 Новости
Объявлен конкурс на проект памятника «Детям войны» в Горно-Алтайске
Российское военно-историческое общество объявляет о начале творческого конкурса на лучший архитектурно-художественный проект памятника «Детям войны» в Горно-Алтайске. Подача конкурсных проектов авторами осуществляется до 18 часов 00 минут по московскому времени 20 мая 2024 года. В...
В Москве представили первый том издания «История России. В 20 томах»
24.04.2024 10:33 Новости
В Москве представили первый том издания «История России. В 20 томах»
В Доме Российского исторического общества был представлен первый вышедший том академического издания «История России. В 20 томах».  «История России. В 20 томах» — масштабный проект по написанию единой, научно выверенной отечественной истории. Идея создания подобного проекта была...
Как в Москве помогают бизнесу адаптироваться к правовым новшествам
24.04.2024 9:06 Новости
Как в Москве помогают бизнесу адаптироваться к правовым новшествам
Предприниматели обязаны следить за правовыми нововведениями и своевременно менять подходы к работе, а городские власти им в этом помогают. Законодательство в сфере торговли меняется и совершенствуется в интересах потребителя — это касается продажи алкогольной продукции и товаров с обязательной...