ПК-ностальгия
HOME
Железо
Программы
Оборудование
Статьи и публикации
Фототаблица
Ссылки
Почта
Гостевая
ПОИСК
Новости Яndex
О сайте

Этот сайт предназначен, прежде всего, людям, ностальгирующим по ушедшим РУССКОМУ СЛОВУ, Windows 3.1, ФОТОНУ, процессорам 486SX и иже с ними.
Конечно, времена должны идти вперед, но почему они обязательно должны уходить?

StuhlbergR 2007 ©
Системы управления документацией (продолжение)

Никто не даст нам избавленья, кроме "Text-Management Systems"

Возможно, нашего героя несколько утешит то обстоятельство, что его зарубежные коллеги, столкнувшиеся с аналогичными проблемами, также обнаружили, что ни системы управления базами данных, ни гипертекстовые системы в "чистом" виде не могут удовлетворить всем требованиям, предъявляемым придирчивыми пользователями. Поэтому они стали создавать такие системы, где соединились бы разноообразные методы хранения и обработки информации, называя их "text-management systems" (мы будем использовать термин "системы управления документацией"). Основные методы, заимствованные ими из других систем, приведены на рисунке.

Основное внимание в системах управления документацией уделяется, конечно, поиску информации. Помимо обычного логического поиска по ключевым словам во многих системах можно указать, что искомые слова должны находиться в пределах одного предложения, абзаца или страницы. Некоторые системы позволяют искать по "образцу", содержащему кроме букв специальные символы (wildcards), например, "?" для любого одиночного символа и "*" - для любой группы символов. Наиболее развитые системы управления документацией обеспечивают поиск не только заданного слова, но и его синонимов или связанных с ним по смыслу слов. Группы таких слов и синонимов содержатся в словарях системы, и пользователь может расширять эти словари.

Практически все системы управления документацией при поиске слов используют индекс, включающий указатели на все слова, встречающиеся в документах. В одних системах индексы указывают только имя документа или содержащего его файла, в других - хранят также местоположение слова в тексте (такие индексы, разумеется, гораздо больше по размеру). В большинстве систем пользователь может указывать, какие слова не надо включать в индекс.

В настоящее время в США на персональных компьютерах работают от 80 до 100 тысяч систем управления документацией. Ожидается, что доход от их продаж в 1992 году составит 650 млн. долл. В таблице приведены основные характеристики наиболее популярных систем.

Таблица. Основные характеристики зарубежных систем управления документацией для MS-DOS
Название Фирма Поиск по тексту Поиск по индексу Гипертекст Работа с графическими
документами
Цена, долл.1
ask Sam ask Sam Systems
+
+
+
-
395
Concordance Dataflight Software
-
+
-
-
995
Delta Imaging Delta Tech Corp.
+
+
-
-
5000
Dragnet Access Softek
+
+
-
-
145
Folio Views Follo Corp.
-
+
+
±2
695
Ful/Text Fulcrum Technologies
+
-
-
-
5000
Hyperties Cognetics Corp.
+
+
+
±
379
idealList Blackwell Scientific Publications
-
+
+
-
225
Isys 2.0 Odyssey Development
-
+
-
-
395
IZE Retreival Dynamics Inc.
+
+
+
-
495
KAware Knowledge Access
+
-
+
-
995
KRS International Knowledge Set Corp.
+
-
+
+
400
Magellan Lotus Development Corp.
-
+
-
±
99
MediaBase Crownin shield software
+
+
+
+
7500
Personal Librarian Cucumber Information Services
+
+
+
-
895
Power! Search Horizon Technology
+
+
-
-
295
re:Search Micro Retrieval Corp.
-
+
-
±
795
Search Express Executive Technologies
+
+
+
+
2495
Topic Verity Inc.
+
+
+
±
795
Zyindex Zylab Corp.
-
+
-
±
395
Источники: "Datamation", 1991, July 15; "Byte", 1992, June.
1  если для продукта существует диапазон цен, указана минимальная цена.
2 ± означает, что в графических документах недопустимы ссылки.

Рассмотрим вкратце три системы управления документацией, которые редакция журнала "Byte" в своем обзоре признала наилучшими.

Isys 2.0
(фирма Odyssey Development)

Программный продукт Isys анализирует файлы с текстовой информацией и создает индекс, указывающий, в каких файлах присутствуют те или иные слова. Размер индекса для файлов общим объемом около 10 Мбайт составляет примерно 6 Мбайт. Для индексации таких файлов на Compaq 486 требуется около 30 минут. При добавлении нового файла дополнительная индексация продолжается примерно 30 секунд.

Обеспечивается поиск по одному или нескольким ключевым словам. Результатом поискаявляется список файлов, который может быть отсортирован по алфавиту, размеру, частоте нахождения искомых слов. При выборе какого-либо файла из этого списка выводится найденное слово и несколько окружающих его строк.

Folio Views
(фирма Folio Corp.)

Программа Folio Views объединяет текстовые и графические файлы в библиотеку, добавляя к ней индексный файл. С помощью программ-фильтров в библиотеку можно включать текстовые файлы 42 форматов. Графические файлы должны иметь формат PCX.

После этого данные подвергаются сжатию, так что суммарный объем библиотеки из файлов размером 10 Мбайт и их индекса составляет примерно 7 Мбайт. Для создания такой библиотеки на Compaq 486 требуется несколько минут. При добавлении нового текста обновление библиотеки и индекса занимает около полутора минут.

Пакет Folio Views позволяет указывать связи между различными текстовыми документами, а также структурировать и группировать документы. Поиск ведется по ключевым словам, причем можно формулировать достаточно сложные логические условия.

askSam
(фирма askSam Systems)

Программа askSam построена как база данных, в которой хранятся текстовые документы. В одних реляционных таблицах могут храниться неструктурированные документы, в других - структурированные (например, с выделенными полями "Автор", "Заголовок" и т.п.). Могут быть созданы индексы для отдельных полей, но полный индексный файл (содержащий все слова текста) не создается.

Возможен поиск как по полям, так и по тексту документа. Слово в тексте можно использовать для поиска других документов, что придает программе "гипертекстовые" черты. После поиска среди структурированных документов программа автоматически просматривает новый, еще не структурированный материал.

[1]   [2]   [3]

Статья была опубликована в журнале "Мир ПК" №6 1992 г.


Программы

Большинство предоставленного здесь материала является цитированием со старых номеров компьютерных журналов, таких, как "Мир ПК" или "Весь Компьютерный Мир". К сожалению, все мои попытки связаться с этими изданиями по поводу вопроса о цитировании были безуспешны. Издания упорно хранили молчание. Что я разрешил себе расценивать как знак согласия, указывая, тем не менее, повсюду как выходные данные издания (с работающей ссылкой на Интернет-представительство), так и автора публикации. Тем более, что, в силу срока давности этих публикаций, вряд ли материал можно рассматривать как коммерческий или рекламный, пусть даже названия фирм здесь и присутствуют (уж без этого никуда). Ежели появятся какие претензии по оному поводу, прошу издания связаться со мной

Райво Штулберг


Rambler's Top100

Рейтинг@Mail.ru Сайт мышонка Портал HotINDEX: знакомства, товары, хостинг, создание сайта, Интернет-магазин, развлечения, анекдоты, юмор, эротика, погода, курсы валют и многое другое! Сайт Татьяны Полукаровой Яндекс цитирования Каталог Ресурсов Интернет
Белый каталог сайтов Литературное ДАО

Автор обращает внимание на то, что никакой представленный здесь материал не служит рекламным целям ни фирм,ни их продкутам, а носит сугубо информационно-образовательный характер