Події

ЕС оцифрует исторические тексты

1

Корпорация IBM и Европейский Союз расширили свое исследовательское партнерство, в котором теперь участвуют около тридцати национальных библиотек, научно-исследовательских институтов, университетов и организаций со всей Европы. Цель этого расширенного партнерства – создать новую технологию, которая позволит с высокой точностью и на массовой основе преобразовывать в цифровую форму исторически и культурно значимые текстовые материалы.

В отличие от предыдущих проектов по оцифровке текстов, результаты которых оказались статичными и не получили дальнейшего развития, эта уникальная крупномасштабная инициатива, получившая название IMPACT (IMProving ACcess to Text; «улучшение доступа к тестам»), предложит европейским институтам новые инструменты и наилучшие методики, которые дадут им возможность эффективно продолжать создание высококачественных цифровых копий редких исторических текстов, размещая их в Интернете и делая широко доступными для поиска и онлайнового редактирования.

impact

Исследовательский проект IMPACT, финансируемый Евросоюзом, сочетает в себе возможности нового инновационного Web-ориентированного программного обеспечения для адаптивного оптического распознавания символов (OCR) с мощью технологии “crowd computing” – быстроразвивающейся концепции, основанной на совместном использовании коллективных знаний, навыков и опыта многочисленных групп людей (или «толп» людей) для расширения, углубления и совершенствования процесса или продукта с целью коренного улучшения его качества и эффективности. Объединение этих технологий позволит заинтересованным сторонам впервые адаптировать процедуры оцифровки и распознавания текста к особенностям древних шрифтов, к искажениям и аномалиям, и даже к специфическим терминологиям и лексиконам – при сокращении показателей частоты появления ошибок на 35% и частоты замещений и подстановок символов и сочетаний символов на 75%.

«IMPACT замечателен тем, что он не только дает этим знаменитым культурным центрам возможность поближе познакомить людей с редчайшими историческими текстами, которых они, возможно, никогда не видели раньше, но также реально позволяет этим людям стать частью процесса сохранения этого наследия, — считает доктор Тал Дрори (Tal Drory), руководитель группы обработки документов в отделении IBM Research в Хайфе. — IMPACT предлагает первую в своем роде систему преобразования текста в цифровую форму, которая сочетает мощь технологии “crowd computing” и адаптивного OCR-решения для распознавания и корректуры оцифрованного текста. Такая комбинация позволяет достичь выдающихся результатов для всех видов исторических документов, от 15 века до 19 века».

Взято с expert.com.ua

1 Comment

  1. … [Trackback]

    […] Information to that Topic: portaltele.com.ua/news/events/2010-08-27-01-53-53.html […]

Leave a reply