Культура

Культура / Библиотеки и музеи / Цифровые библиотеки /

IBM поможет в оцифровке европейских архивов

27 августа 2010 года, 15:00 | Текст: Дмитрий Целиков | Послушать эту новость

Далеко не каждая система оптического распознавания текста найдёт здесь символ «е». (Иллюстрация ImpAcT.)
Далеко не каждая система оптического распознавания текста найдёт здесь символ «е». (Иллюстрация ImpAcT.)

Корпорация IBM поможет Евросоюзу в оцифровке огромной коллекции исторических документов Старого Света.

В проекте ImpAcT (Improving Access to Text) примут участие два десятка библиотек, вузов и компаний.

Главное в программе не охват, а точность распознавания текста, который кое-где сильно поблёк, а в иных местах набран давно вышедшими из употребления шрифтами. Из-за этого традиционные системы оптического распознавания символов работают чрезвычайно медленно. ImpAcT не только обладает новыми технологиями распознавания, но и во многом полагается на распределённые вычисления. По оценке IBM, аккуратность системы на 25–50% выше, чем у конкурентов. ImpAcT даже умеет учиться на своих ошибках, на которые ему будет указывать обширное онлайн-сообщество волонтёров.

Процесс сканирования не будет централизованным: каждое учреждение само выбирает время и масштабы оцифровки. В конечном итоге в Сети должны оказаться десятки тысяч редких документов XV–XIX веков, к которым, возможно, раньше не имели доступа ни специалисты, ни любители.

Подготовлено по материалам CNET News.

Каждый день слушайте итоговый подкаст Свободного Радио «Компьюлента»!
Ваше имя* Город Страна Регистрация        Авторизация
Прокомментировать

Комментариев пока нет

Последние новости по теме "Цифровые библиотеки":

Сегодня в рамках проекта Бизнес в облаках обсуждаются перспективы облачных сервисов.
Рассмотрим некоторые стратегические преимущества, обеспечиваемые облачными вычислениями.
В рамках проекта «Бизнес в облаках» iBusiness предложил экспертам обсудить роль репутации поставщиков на рынке «облаков».
Архив материалов
  «   Май 2011   »  
ПнВтСрЧтПтСбВс
            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31