Сегодня среда, 24.06.2026, 04:53, ньюсмейкеров: 45117, сайтов: 1203, публикаций: 3596118, просмотров за сутки: 529903
14.12.2007 00:00
Новости.
Просмотров всего: 5973; сегодня: 1.

Cognitive Technologies открывает коды программы Cuneiform

Компания Cognitive Technologies анонсирует разработки в области Open Source. Данное направление в течение последних двух лет переживает небывалый подъем во всем мире и преимущества его очевидны:

- любой желающий может бесплатно получить программный продукт;

- любой желающий может доработать продукт в соответствии со своими желаниями и требованиями, благодаря тому, что коды программы открыты.

Как свидетельствует мировой опыт развития Open Source - решений, данные условия предоставляют широкие возможности для масштабного развития программных продуктов. Пример Linux, Apache, Open Office и других продуктов не дает повода в этом усомниться.

Кроме того, как коммерческая компания, Cognitive Technologies видит реальную выгоду от развития направления. OCR – технологии составляют незначительный сегмент ИТ-рынка, но для того, чтобы его активно развивать требуется довольно значительный производственный ресурс. Еще в 1995 году Cognitive Technologies сделал стратегическое заявление о том, что OCR-системы уже достигли промышленного качества распознавания. Дальнейшее повышение точности распознавания не является первостепенной задачей (две или четыре ошибки сделает система на пяти листах не столь принципиально). В дальнейшем они будут трансформироваться в утилиты к «большим системам». К этому, в итоге, и была сведена деятельность компании в части распознавания печатных текстов. (Наоборот, в области ICR и IDR наша компания активно занималась и занимается исследованиями и разработками, связанными с распознаванием сложных документов, форм документов, технологиями «понимания» документов и т.д.)

Сегодня уже привычно видеть модули распознавания в системах электронного документооборота, графических и текстовых редакторах. Не секрет, что в ближайшее время возможность распознавания появится и в поисковых машинах. Стоит сказать, что за период с 2000 года никаких революционных изменений в технологиях OCR не произошло. Развитие данных систем шло, главным образом, по пути совершенствования их сервисной стороны и расширения списка дополнительных возможностей (распознавание новых языков и т.д.) (Отметим, что в этот период времени серьезные результаты были получены в сферах forms processing и «понимания» документов).

Весь период разработки OCR CuneiForm, по оценке Cognitive Technologies, составил порядка 470 человеко-лет.

Наш опыт в проектах Open Source

Таким образом, по мнению Cognitive Technologies подключение ресурса «сообщества» в разработки в сфере OCR под руководством ученых-консультантов и менеджеров Cognitive Technologies должно принести значимый эффект. Отметим, что Cognitive Technologies уже имеет значительный научно-производственный опыт работ по направлению Open Source. В течение двух последних лет компания является исполнителем проекта ФЦП «Электронная Россия» по созданию Open Source-решений для органов государственной власти России. Кроме того, несколько месяцев назад Cognitive Technologies начала Open Source проект по распознаванию марок автомобилей, который реализуется с участием студенческого сообщества под эгидой кафедры Когнитивных Технологий, открытой Cognitive Technologies в МФТИ. Результаты по данному проекту планируется получить к 2010 году.

Open Source-проект «OCR CuneiForm» - научный проект Cognitive Technologies

Необходимо отметить, что для компании Cognitive Technologies, в которой научные исследования занимают значительную долю деятельности, Open Source проект OCR CuneiForm представляет огромный научно-практический интерес. Компания предполагает получить комплекс идей и методов, который сможет значительно усилить данную систему и получить в ближайшее время ряд «прорывных» технологических решений.

Рынок свободного ПО

Объем мирового рынка свободного ПО, по данным аналитической компании Saugatuck Technology, к 2010 году составит $22 млрд. при ежегодном росте в 30%. По данным исследовательского центра "Финам", рынок свободного ПО в России составляет сегодня $40 млн. К 2010 году эта цифра достигнет $200 млн.

Доля Cognitive Technologies к 2010 году может составить 5-7% за счет оказания услуг, технической поддержки и рекламы.

Программа «Распознавание должно быть на каждом компьютере»

Предполагается, что одним из основных результатов Open Source - проекта OCR CuneiForm должен стать рост популярности и распространенности решений в области распознавания печатных текстов благодаря открытости кода и нулевой стоимости ПО. Системы распознавания должны стать общедоступными!

По данным Cognitive Technologies число активных пользователей систем распознавания (те, кто используют OCR не реже 1 раза в месяц) за счет использования Open Source к 2010 году может возрасти в 5 раз, во многом за счет активного подключения к использованию OCR офисных сотрудников, учащихся школ, студентов вузов, а также государственных структур, для которых бесплатное ПО станет хорошей альтернативой пиратским продуктам.

Таким образом, число пользователей OCR к этому периоду времени может составить порядка 25 млн. человек. (Сегодня это число составляет порядка 5 млн. чел.)

Компания Cognitive Technologies планирует развивать проект в три этапа:

1. OCR Cuneiform - программa Freeware

12 декабря 2007 года OCR CuneiForm станет доступной для широкого использования (freeware). Полную версию системы можно будет скачать с сайта Cognitive Technologies www.cuneiform.ru (http://www.cuneiform.ru/downloads/index.html), а также в последствии с тематических ресурсов www.download.ru, www.freeware.ru и т.д.

2. Подготовка web-сервиса

В рамках данного этапа будет подготовлен Интернет-ресурс www.Cuneiform.ru. Любой желающий сможет бесплатно распознать документы в on-line.

Сроки: конец января 2008 г.

Компания Cognitive Technologies планирует довести число распознаваний на www.Cuneiform.ru до 10 000 в день к концу 2008 г.

3. Подготовка и размещение исходных кодов OCR Cuneiform

Сроки: март 2008 г.

С начала марта 2008 года Cognitive Technologies в качестве инвестора и координатора планирует начать работы по подготовке новой версии OCR CuneiForm с участием широких слоев компьютерного «сообщества».

Информация об OCR CuneiForm:

OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи.

• высокое качество распознавания;

• высокая скорость работы;

• распознавание текстов на русском, английском, смешанном русско-английском, украинском, немецком, французском, испанском, итальянском, шведском и других (всего более 20);

• работа в режиме автофрагментации для поиска текстовых блоков, таблиц и изображений, а также мощное средство ручной и полуавтоматической фрагментации;

• распознавание таблиц любой структуры и сложности, в том числе и без отображения линий табличной сетки;

• автоматическое сохранение иллюстраций (черно-белых и цветных) и таблиц в получаемом на выходе документе;

• полное сохранение топологии страницы;

• поддержка пакетного режима сканирования и распознавания;

• простота использования и интуитивный интерфейс, встроенные помощники по работе с программой;

• встроенный текстовый редактор для работы с распознанным текстом;

• совмещенный показ изображений и результатов распознавания.

В системе используется целый ряд уникальных технологий, среди которых адаптивное распознавание, нейронные сети, когнитивный анализ альтернатив распознавания и другие.

Тематические сайты: PublisherNews - портал системы продвижения публикаций, Информтехнологии, связь, Интернет, Искусственный интеллект, Реклама и PR, Технологии
Сайты субъектов РФ: Москва
Сайты федеральных округов РФ: Центральный федеральный округ
Сайты стран: Россия, Украина

Ньюсмейкер: Cognitive Technologies — 214 публикаций

Интересно:

Как Лев Толстой защищал Севастополь
18.06.2026 9:06 Аналитика
Как Лев Толстой защищал Севастополь
13 сентября 1854 года (25 сентября по н. ст.) началась первая героическая оборона Севастополя. 349 дней русские моряки и солдаты отстаивали город при численном превосходстве противника и продемонстрировали всему миру свой героизм, мужество и отвагу. Среди защитников города был и молодой подпоручик Лев Николаевич Толстой – в будущем знаменитый русский писатель. Почти мировая война 4 октября 1853 года Турция в очередной раз объявила России войну, и вновь Россия ответила тем же. Но в этот раз Турцию поддержали Англия и Франция, которые очень внимательно следили за развитием событием и совсем не были заинтересованы в усилении России на Черном море. В феврале 1854 года они заключили военный союз с Турцией и сразу же выдвинули России ультиматум о выведении войск из Дунайских княжеств. Россия, естественно, не стала выполнять такие требования, и 15 марта союзники объявили ей войну. Англия и Франция попыталась начать боевые действия с...
Любимые игры Екатерины Великой
17.06.2026 9:06 Аналитика
Любимые игры Екатерины Великой
Сегодня мы поговорим о Екатерине II не как об императрице, продолжавшей дела Петра Великого и устроившей российскому дворянству «золотой век», а как о женщине на троне, которой были весьма не чужды и простые житейские утехи. Верхом и с ружьем В отличие от своих предшественниц на троне, императрица-просветительница вместо балов и маскарадов ежедневно занималась рутинной государственной работой. А ее любимые развлечения немного отличались от того, что радовало душу ее предшественницам-императрицам. Одним из любимых занятий Екатерины было катание верхом. Современники рассказывали, что она правила лошадьми как профессиональный наездник. Государыне очень нравилось вырываться из общей кавалькады. В те времена дамы по-мужски не ездили, это было не принято. У Екатерины же было специальное английское седло. С его помощью уже по ходу движения она принимала мужскую посадку и поэтому развивала бешеную скорость, однако нормы приличия при...
Значение Крымской войны 1853-1856 гг. обсудили на конференции в Москве
14.06.2026 0:37 Мероприятия
Значение Крымской войны 1853-1856 гг. обсудили на конференции в Москве
10 июня 2026 года в московском Доме русского зарубежья им. А.И. Солженицына прошла масштабная межрегиональная научно‑практическая конференция, приуроченная к 170‑летию окончания Крымской войны (Восточной) войны 1853–1856 гг. и подписанию Парижского мирного договора (Парижского трактата) «Значение Крымской (Восточной) войны 1853-1856 гг. для России и мира». Инициаторами и организаторами конференции выступило Российское Дворянское Собрание (РДС) во главе с М.Ю. Лермонтовым, Общества потомков участников Отечественной войны 1812 г. и Первой мировой войны (В.И. Алявдин) при поддержке Московского отделения Императорского Православного Палестинского Общества (ИППО).Парижский трактат, подписанный 18(30) марта 1856 г. Российской Империей, с одной стороны, и странами-союзниками по Крымской войне (Османской империей, Британией, Францией, Австрией, Королевством Сардиния и Пруссией), с другой стороны, ознаменовал де-юре официальное...
11.06.2026 15:05 Интервью, мнения
«Гигант — Компьютерные системы»: борьба с кибермошенничеством
Эксперт «Гигант— Компьютерные системы» рассказал, почему 7 часов 48 минут до блокировки не стоит называть прорывом и как антифрод-инфраструктура влияет на защиту граждан.  Минцифры опубликовало отчет о ходе реализации государственной программы «Информационное общество» нацпроекта «Экономика данных» за 2025 год. Один из ключевых показателей - среднее время блокировки фишинговых и мошеннических ресурсов. Фактический результат составил 7 часов 48 минут при плановом ориентире 8 часов. Также в отчете говорится о росте доли предотвращенного кибермошенничества на 53,7% и расширении числа организаций, участвующих в системе противодействия киберпреступлениям. В этот контур входят органы исполнительной власти, операторы связи и финансовые организации. Именно они формируют базовую инфраструктуру реагирования на цифровое мошенничество. О том, как корректно оценивать эти показатели, почему рост предотвращенного мошенничества нельзя...
В строю бессмертных: снайпер Ивченко и его последний бой за Родину
07.06.2026 11:39 Персоны
В строю бессмертных: снайпер Ивченко и его последний бой за Родину
В славной летописи Великой Отечественной войны, написанной кровью и мужеством советских воинов, особое место занимают подвиги гвардейцев-героев. Их имена, как яркие звёзды, озаряют путь грядущим поколениям, служа примером беззаветной преданности Социалистической Родине, народу и Коммунистической партии. В этом бессмертном строю — гвардии ефрейтор Михаил Лаврентьевич Ивченко.  Уроженец деревни Тимонино Красноярского края, он, как и миллионы его сверстников, вышел из трудовой крестьянской семьи. Получив начальное образование, Михаил Ивченко добросовестно трудился в колхозе, пройдя путь от возчика до бригадира, воспитывая в себе качества сознательного строителя социалистического общества. В 1940 году по призыву Родины он был направлен для прохождения службы в стрелковые части, дислоцированные на Крайнем Севере. С первых дней вероломного нападения гитлеровских захватчиков товарищ Ивченко стоял на переднем крае борьбы. В суровых...