От Serge Pod
К All
Дата 17.02.2001 12:12:44
Рубрики Прочее;

Вопрос о распознавании текстов с ятями и твердыми знаками

Приветствую!

Есть желание выложить в сеть текст статьи Циолковского "Исследование мировых пространств реактивными приборами"-1903г.
Проблема-текст на дореволюционном языке.Распознавалка не берёт.
Вопрос к корифеям:
1)нет ли в сети этой статьи(не 1926г!)
2) как сделать лучше, какой формат применить
3)если не дадут из библиотеки домой, как лучше копировать-(ксерокс?, сканер?-на дискете чтобы поместилось)
Исходник-34 страницы, текст не очень чёткий



С уважением, Serge Pod.
http://airbase.uka.ru

От Ingvar
К Serge Pod (17.02.2001 12:12:44)
Дата 19.02.2001 16:54:18

Есть специальный формат - DjVu

>Приветствую!

>Есть желание выложить в сеть текст статьи Циолковского "Исследование мировых пространств реактивными приборами"-1903г.
>Проблема-текст на дореволюционном языке.Распознавалка не берёт.
>Вопрос к корифеям:
>1)нет ли в сети этой статьи(не 1926г!)
>2) как сделать лучше, какой формат применить
>3)если не дадут из библиотеки домой, как лучше копировать-(ксерокс?, сканер?-на дискете чтобы поместилось)
>Исходник-34 страницы, текст не очень чёткий

>С уважением, Serge Pod.
http://airbase.uka.ru

Глянь вот это. Классный формат. В самый раз для твоего случая и вообще для случаяя со старыми книгами.

http://www.djvu.com/

На сервере http://koni.spb.ru/ в этом формате были дореволюционные книжки о лошадях. Удобно мне понравилось.

От Serge Pod
К Ingvar (19.02.2001 16:54:18)
Дата 20.02.2001 01:43:01

Спасибо (-)


От Bigfoot
К Serge Pod (17.02.2001 12:12:44)
Дата 18.02.2001 21:35:09

Не уверен на 100%, но (+)

вроде бы в Fine Reader 5.0 есть паттерн для распознавания старой орфографии. Могу попробовать - шлите небольшую картинку с текстом, покумекаю.
Успехов,
Йети

От Serge Pod
К Bigfoot (18.02.2001 21:35:09)
Дата 19.02.2001 00:11:33

А как потом в инете текст с ятями выкладывать? (-)


От Bigfoot
К Serge Pod (19.02.2001 00:11:33)
Дата 19.02.2001 00:21:17

Я ж о распознавании. А так (+)

можно юзать шрифт специфицкий. В смысле, сделать pdf c embedded-font'ом. В картинках это будет малочитабельно, ИМХО.
Если качество печати низкое, то сканировать надо с максимальным разрешением, играя с контрастом/яркостью, чтобы максимально убрать по возможности всякий "мусор". Шрифт я видал такой, не помню где. При желании можно нарыть.
Единственная проблема, сканированные изображения в таком варианте будут нехило весить, дискетами не отделаетесь. Впрочем, красота требует жертв, pdf получится зато маленький.
Успехов,
Йети

От Serge Pod
К Bigfoot (19.02.2001 00:21:17)
Дата 19.02.2001 00:49:57

Спасибо, бум сканить. (-)


От Олег К
К Serge Pod (19.02.2001 00:11:33)
Дата 19.02.2001 00:18:10

Re: А как...

Есть специальные шрифты.

На русском небе выложено несколько книг в сатрой орфографии и есть к ним шрифты.

В файнридере специального модуля для этого я не нашел.

От Bigfoot
К Олег К (19.02.2001 00:18:10)
Дата 19.02.2001 00:27:32

В какой версии FR нету? (+)

Я же специально указал - 5.0, в 4.76 этого паттерна еще не было.
Кроме того, существуют несколько вариантов инсталляции 5.0. Не во всех этот паттерн будет включен.В "Про" есть нечто, под названием "старая орфография".

От Олег К
К Bigfoot (19.02.2001 00:27:32)
Дата 19.02.2001 01:48:22

Re: В какой...

>Я же специально указал - 5.0, в 4.76 этого паттерна еще не было.
>Кроме того, существуют несколько вариантов инсталляции 5.0. Не во всех этот паттерн будет включен.В "Про" есть нечто, под названием "старая орфография".


понял, исправлюсь! :)))

От Дмитрий Журко
К Serge Pod (17.02.2001 12:12:44)
Дата 17.02.2001 19:21:58

Re: Вопрос о...

Здравствуйте. Зайдите на

http://www.adelaida.net/hieroglyph/

там неплохой русский редактор текстов в
который интегрирован afterscan. В общем,
интересен он как раз для людей с Вашей
или подобной проблемой. Всё бесплатно
и на русском языке.

Дмитрий Журко, Кёнигсберг (Калининград)

От Serge Pod
К Дмитрий Журко (17.02.2001 19:21:58)
Дата 17.02.2001 23:38:24

И Вам спасибо :) (-)


От Senser
К Serge Pod (17.02.2001 12:12:44)
Дата 17.02.2001 13:03:19

Re: В таком случае лучше всего PDF

>Приветствую!


И читаться нечеткий текст будет лучше, и проблем с распознаванием никаких. А акробат ридер поди небоcь у всех есть. Если проблемы с записью - сканируйте в графический формат постранично, я вам 34 страницы в PDF загоню.

>Есть желание выложить в сеть текст статьи Циолковского "Исследование мировых пространств реактивными приборами"-1903г.
>Проблема-текст на дореволюционном языке.Распознавалка не берёт.
>Вопрос к корифеям:
>1)нет ли в сети этой статьи(не 1926г!)
>2) как сделать лучше, какой формат применить
>3)если не дадут из библиотеки домой, как лучше копировать-(ксерокс?, сканер?-на дискете чтобы поместилось)
>Исходник-34 страницы, текст не очень чёткий



>С уважением, Serge Pod.
http://airbase.uka.ru

От Serge Pod
К Senser (17.02.2001 13:03:19)
Дата 17.02.2001 13:42:54

Спасибо! (-)