Этот сайт предназначен, прежде всего, людям, ностальгирующим по ушедшим РУССКОМУ СЛОВУ, Windows 3.1, ФОТОНУ, процессорам 486SX и иже с ними.
Конечно, времена должны идти вперед, но почему они обязательно должны уходить?
StuhlbergR 2007 ©
|
Беседы о поколениях ЭВМН. Бусленко, В. Бусленко
© Издательство "Молодая гвардия", 1977 г.
Все настойчивее вторгаются электронные вычислительные машины в науку и в народное хозяйство. О зарождении этих машин, принципе их действия, их развитии и влиянии на жизнь человека расскажут член-корреспондент АН СССР Н. Бусленко и его сын кандидат технических наук В. Бусленко.
Хранение и поиск информации в ЭВМ третьего поколения
- Тысячелетия постоянной заботой человечества было не столько хранение, сколько накопление новой информации. Средства хранения всегда оказывались под рукой: от каменных плит с ассирийской клинописью и средневековых рукописных фолиантов до современных библиотек, плотно набитых книгами и журналами. Почему же сейчас слово "информация" приобретает какой-то угрожающий оттенок?
- Проблема информации - детище научно-технического прогресса. Информация настолько решительно вторгается в нашу жизнь, а ее количество растет так быстро, что в последнее время даже говорят об "информационном буме" или даже об "информационном взрыве"
За последние 25 лет вышло столько же книг, сколько их было издано до этого с того момента, как изобрели книгопечатание. За двести лет, с 1750 до 1950 года, население нашей планеты увеличилось в три раза, а число научных журналов - в десять тысяч раз. В 1975 году в мире опубликовано более трех миллионов журнальных статей по естественным наукам и технике, 250 тысяч книг, 500 тысяч описаний к патентам и авторским свидетельствам на изобретения. Число зарегистрированных патентов к этому времени достигло 15 миллионов. Ежегодный печатный объем публикаций составляет сейчас 10 миллиардов печатных страниц; этот объем увеличивается в два раза примерно каждые 10 лет.
ВДревнем Новгороде люди записывали информацию на так называемых берестяных грамотах.
Представьте себе человека, который задался бы целью просмотреть годовой выпуск литературы по какой-нибудь отрасли техники, например, по машиностроению. Если на просмотр каждого источника он будет тратить всего три минуты, то, работая по 40 часов в неделю, он должен будет заниматься этим делом более 5 лет! Из-за физической невозможности быть в курсе публикаций нередко заново открывают давно открытое, изобретают уже изобретенное. Следствием этого положения является неоправданное дублирование исследований, расчетов и проектов.
По американским данным, потери от этого достигают не менее 40 процентов рабочего времени ученых и инженеров. Так, компания "Дженерал электрик" в течение двух лет исследовала возможность вызывать дождь с помощью серебра и сухого льда. В конце работы оказалось, что 20 лет назад результаты такого же исследования были опубликованы в Голландии. Одна из американских лабораторий в течение 5 лет проводила исследования по электронному переводу и затратила на это миллион долларов. Позже были найдены публикации работ, выполненных в Советском Союзе, где содержались ответы на большинство поставленных вопросов. Препарат для дисперсии серы, который разрабатывала некая крупная скандинавская фирма, уже был выпущен в широкую продажу английским концерном "Импириэл кэмикл индастриз".
Руководитель одной фирмы признался, что считает более выгодным провести новые исследования, нежели тратить время на поиск готового решения, если сумма, выделяемая на решение проблемы, не превышает 50 000 долларов. Органами регистрации изобретений отвергаются более 25 процентов заявок из-за отсутствия новизны.
По образному замечанию академика С.Вавилова, "... современный читатель находится перед гималаями библиотек в положении золотоискателя, которому нужно отыскать крупинку золота в массе песка". Эта ситуация характерна в настоящее время для многих сфер человеческой деятельности.
Машиностроительный завод средней мощности изготавливает около 20 тысяч деталей и комплектующих узлов. Чтобы заказать их, направить в нужный цех сырье и инструменты, оценить трудоемкость производства, обеспечить рабочей силой и финансированием в соответствии с действующими трудовыми и материальными нормативами, требуется составить немало документов, содержащих многочисленные учетно-плановые показатели. Поэтому в рамках одного только завода ежегодно приходится "переваривать" примерно 150 миллионов показателей, совершая при этом 300-350 миллионов вычислительных операций. Каков же тогда объем учетно-плановой информации по всей отрасли промышленности или по всему народному хозяйству в условиях развитой внутриотраслевой и межотраслевой кооперации?
Позже человек в качестве носителя информации стал использовать бумагу. Так продолжается и по сей день...
По данным всесоюзной переписи населения 1969 года, в сфере информационной, плановой, учетной и управленческой деятельности в нашей стране было занято около 10 миллионов работников умственного труда.
Для бесперебойного функционирования народного хозяйства существенное значение имеет четкая работа службы материально-технического снабжения. В этой сфере находятся десятки миллионов наименований изделий, полуфабрикатов, запасных частей, аппаратуры и оборудования. Для их хранения служба имеет сотни и тысячи складов, баз, хранилищ, расположенных на огромной территории. Качественное снабжение может быть организовано лишь в случае, если "кто-нибудь" будет знать потребность всех без исключения предприятий и помнить, где, на каких складах и в каком количестве находятся соответствующие предметы снабжения.
Любопытно вспомнить такой эпизод. Заместитель начальника главка одного из министерств принимал посетителей. Главный инженер подчиненного завода жаловался, что из-за некоторых электронных ламп, "уже изрядно севших", плохо работает контрольно-измерительная аппаратура и завод выпускает продукцию с повышенным процентом брака. Если в ближайшие дни ламп достать не удастся, придется остановить главный конвейер. Получить эти лампы в обычном порядке, через снабженческие органы, не удалось, так как руководители завода не могли предвидеть их выход из строя и не сделали своевременные заявки. Заместитель начальника главка обзвонил ряд складов, смежных заводов, но "достать" нужных ламп не смог. Звонил он и директору завода - изготовителя этих ламп и с трудом, благодаря личному знакомству, уговорил его срочно выдать из сверхплановой продукции десяток ламп для предотвращения чрезвычайного происшествия.
Вместе с тем следующим посетителем оказался представитель одного небольшого склада, который докладывал, что у него уже два года хранится партия тех самых ламп. Срок годности их истекает, а их никто не берет и не заказывает, так как профиль склада в основном относится к металлопродукции и вряд ли кто-то догадывается о наличии таких ламп на складе.
Современные крупные библиотеки располагают миллионами книг и журналов. Государственная библиотека имени В.И. Ленина в Москве хранит свыше десяти миллионов томов. Как найти книгу по нужному вопросу? Могут ли библиотекари помнить, какие у них есть книги и что написано в каждой из них? Правда, существуют каталоги. Но в каталогах миллионы карточек. Сколько нужно времени, чтобы просмотреть каталог по нужной проблеме? Как угадать за скупыми аннотациями истинное содержание книги? Как узнать, содержатся ли в книге нужные сведения?
Представьте себе адресное бюро большого города, имеющего несколько миллионов жителей. На каждого жителя заводится карточка, содержащая его фамилию, имя и отчество, возраст, местожительство и другие данные Сколько нужно времени, чтобы найти в такой картотеке адрес требуемого жителя?
...но со временем положение изменяется. Наверняка, в будущем бумажные носители станут такой же экзотикой, как, скажем, сегодня книга из пергамента.
Число аналогичных примеров может быть без труда значительно увелично, и все они подтверждают одну мысль - хранение и поиск информации превращаются в наши дни в актуальнейшую полнохозяйственную проблему. Ни одно современное государство не может остаться в стороне от информационного бума!
В нашей стране в 1952 году создан Всесоюзный институт научной и технической информации Государственного комитета по науке и технике Академии наук СССЗ (ВИНИТИ). В его обязанности входит составление кратких рефератов всей мировой литературы по естествознанию и технике и публикация их в реферативных журналах по отраслям (173 выпуска по 6 раз в год), он готовит обзорно-библиографическую и справочную литературу, выпускает экспресс-информационные издания по наиболее актуальным вопросам. Институт имеет машиносчетные станции и издательский комбинат.
Потребности практики стимулируют появление новых наук - информатики, теории информации, теории кодирования. Все они так или иначе порождены проблемой информации. Так, информатика изучает вопросы возникновения, хранения и поиска информации, отображение ее в виде документов и правила использования. Открываются даже своеобразные законы, вроде закона Бредфорда: "Если научные журналы располагать в порядке уменьшения числа статей по данному вопросу, то их можно разделить на основную зону (журналы, посвященные данному вопросу) и на несколько зон, содержащих то же число статей, что и основная зона. Тогда число журналов в основной зоне и последующих зонах будет относиться как 1 : К : К2 : К3 : К4 и т.д. ..."
Много научных работ выполнено в области компактного кодирования и экономического запоминания информации. Существуют специальные колы, способные "замечать" и исправлять ошибки и т.д.
- Разумеется, без электронных помощников человек не сможет выбраться из информационных джунглей. Но сомнительно, что эти гималаи информации удастся втиснуть в ЭВМ размером с письменный стол!
- Если иметь в виду только внутреннюю память ЭВМ, то ваши сомнения вполне оправданы, однако известно, что современные компьютеры допускают подключение практически неограниченного числа внешних запоминающих устройств, в них можно хранить миллиарды бит.
Как уже говорилось раньше, память ЭВМ делится на внутреннюю (оперативную) и внешнюю. Оперативная память непосредственно участвует в решении задач и является неотъемлемой частью процессора ЭВМ. Без нее машина вообще ничего не способна сосчитать, даже 2х2.
Оперативная память работает со скоростью арифметического устройства ЭВМ и поэтому является очень дорогостоящей. Большие же массивы информации, которые используются не постоянно, а время от времени, располагаются во внешней памяти, более дешевой и более емкой, но, увы, работающей уже не так быстро.
Внешние запоминающие устройства, как известно, магнитофонного типа: магнитные барабаны, магнитные ленты и магнитные диски.
Отечественные серийные магнитные барабаны имеют емкость порядка 6-10 миллионов бит. Скорость обращения (поиска нужной зоны) к барабану - 30 миллисекунд. Самый большой из известных барабанов (ЭВМ УНИВАК) имеет емкость 450-900 миллионов бит. Время одного обращения 92 миллисекунды.
Магнитные барабаны имеют емкость в 50-100 раз большую, чем оперативные запоминающие устройства ЭВМ. Они, конечно, не решают проблемы "большой памяти", но благодаря сравнительно быстрому считыванию информации являются очень полезными для ЭВМ. Обычно они служат "промежуточной" памятью, хранящей информацию, наиболее часто используемую при решении задач. На барабаны переписывают с магнитных лент данные, которые предполагается использовать при предстоящем решении задачи.
Емкость магнитной ленты уже больше - 200-400 миллионов бит. Основной ее недостаток - малая скорость считывания информации, достигающая нескольких минут. Не всегда ленты обладают хорошей надежностью: их механизмы требуют точной регулировки. Сами ленты рвутся из-за резких стартов и остановок.
Современные машины могут работать с большим числом лентопротяжек. Обычно их имеется от 4 до 16, хотя известны ЭВМ, у которых их 64 и более.
Таким образом, внешняя память ЭВМ на магнитных дисках - это уже миллиарды бит.
Емкость магнитных дисков достигает сотен миллионов бит. Плотность записи порядка 100-150 бит на миллиметр дорожки. Внешняя память на магнитных дисках способна хранить громадный объем сведений - 10-15 миллиардов бит. Основное достоинство наряду с большим объемом - это высокая скорость считывания. Запоминающее устройство на магнитных дисках уже полностью решает проблему большой памяти. Здесь речь идет не только о возможности хранения больших объемов информации, но и о ее обработке на ЭВМ с небольшими потерями на поиск и считывание информации.
Чтобы наглядно представить себе объемы памяти на лентах и на дискетах, подсчитаем, сколько бит требуется для хранения текста всех 40 томов нового издания Большой Советской Энциклопедии.
Формат страницы БСЭ рассчитан не более чем на 2500 знаков. Если каждый знак занимает целый байт, то для записи одной страницы потребуется 2 500х8=20 000 бит. В каждом томе БСЭ не более 1000 страниц. Поэтому во всех сорока томах
20 000х1 000х40 000=800 000 000 бит.
Это всего-навсего 4-5 дисков, или 2-4 ленты, то есть примерно 1/10 часть внешней памяти обычной серийной ЭВМ третьего поколения.
Ежегодные публикации по естествознанию и технике составляют 3 миллиона статей. Если считать в среднем статью из 10 страниц по 1500 знаков, то одна статья содержит
10х1 500х10=150 000 бит,
а все три миллиона статей
150 000х3 000 000=450 000 000 000 бит.
Но 450 миллиардов бит разместилось бы спокойно в 40 накопителях на магнитных дисках.
Современная наука и техника имеют не более сотни крупных областей. Поэтому всемирные публикации по одной области знания не заняли бы даже одного накопителя на магнитных дисках.
Специалисты считают, что в 1-2 накопителях на магнитных дисках с современными характеристиками могут разместиться все основные сведения по любой узкой области естествознания или техники, например, по ядерной физике, самолетостроению или обувной промышленности, особенно если не гнаться за хранением всех сведений - скажем, устарелых.
ЭВМ "Урал-1". На переднем плане можно видеть магнитный барабан.
Располагая такими хранилищами информации, можно совершенно преобразить труд инженеров-конструкторов, проектировщиков, технологов, экономистов на предприятиях, в конструкторских бюро и проектных или исследовательских институтах. Вместо того, чтобы рыться в книгах, журналах, справочниках, сборниках нормативов и стандартов, инженер может обратиться к ЭВМ и получить любую необходимую ему справку.
Заманчивые перспективы возникают в области общесправочных учреждений широкого назначения. Любой житель любого населенного пункта, имея доступ к машинной памяти, мог бы получить информацию по любому интересующему его поводу - от наличия тех или иных товаров в торговой сети и репертуара зрелищных учреждений до тонких вопросов искусствоведения, науки, техники и народного хозяйства. Даже самая богатая фантазия не в состоянии предсказать, как преобразится в связи с этим облик образования, самообразования и вообще быт людей.
Поиск информации в большой памяти ЭВМ является одной из наиболее актуальных задач машинной математики. Каждая ЭВМ способна найти информацию лишь в том случае, если искомый элемент информации снабжен признаком, по которому его можно отличить от других элементов.
Пусть известно, что во внешней памяти ЭВМ имеется миллиард элементов информации с соответствующими признаками. Относительно порядка расположения их ничего не известно. Оператор задает машине признак и просит по этому признаку найти нужные сведения. ЭВМ обратится к первому диску накопителя и, начиная с первой его зоны, "просмотрит", нет ли этого признака у элементов информации, расположенных в первой ячейке этой зоны.
Если он есть, то есть обследованный признак совпал с заданным, поиск окончен: нужные сведения найдены, остается переписать их в оперативную память и использовать для решения задачи или выдать пользователю. Если же признак не совпал с заданным, ЭВМ перейдет ко второй ячейке первой зоны первого диска. Если совпадения и здесь не получается, ЭВМ переходит к третьей ячейке и т.д. Закончив обследование первой зоны и не получив совпадения признаков, ЭВМ перейдет к первой ячейке второй зоны и т.д. Обследовав все зоны первого диска, ЭВМ обратится ко второму диску, к третьему и т.д. Когда же можно рассчитывать на окончание поиска требуемого элемента информации?
Очевидно, что при такой организации поиска при большом числе выборок потребуется число сравнений признаков, в среднем равное половине числа имеющихся элементов, то есть в нашем примере - 500 миллионов сравнений. Как же быть? Ведь если тратить на сравнение признака, например, одну десятитысячную секунды, то на поиск нужного элемента потребуется 50 000 секунд, то есть более тринадцати часов!
Конечно, это очень много. Но, оказывается, можно организовать поиск так, что это время сократится в сотни раз! Для этого необходимо расположить информацию в специальном порядке и организовать соответствующим образом процедуры поиска. Суть дела удобно пояснить на примере адресного бюро.
Каталог адресного бюро построен по алфавиту. Если потребуется найти сведения, например, о Нестеровой Елене Сергеевне, то, очевидно, просматривать зоны с фамилиями, начинающимися с букв А, Б, В и т.д. до М включительно не имеет никакого смысла. Нужно сразу обращаться к зонам, где фамилии начинаются с буквы Н. Для этого в памяти ЭВМ достаточно иметь адресную табличку, в которой были бы указаны адреса начала зоны информации, содержащие фамилии, начинающиеся с каждой буквы алфавита. Просмотр таблички с 30 буквами (считая, что с некоторых букв фамилии не начинаются) потребует в среднем всего 15 сравнений, но зато область поиска сократится значительно!
Обратившись в зону буквы Н, ЭВМ теперь должна следить за второй, третьей и т.д. буквами фамилий. Если в зоне буквы Н фамилий очень много, можно построить еще одну адресную табличку с адресами вторых букв фамилий. Тогда машина пропустит фамилии со второй буквой, отличной от "е", и перейдет сразу к группе ячеек "Не" и т.д. Теперь видно, как поиск существенно сокращается, но для этого нужно иметь заранее заготовленные таблички с адресами букв и программы для обращения к ним. Если нужно получить выигрыш в скорости поиска, приходится идти на дополнительные затраты, связанные с повышением степени организации данных и развитием интеллекта ЭВМ.
Все это очень хорошо, но, к сожалению, не всякую информацию возможно (или целесообразно) располагать по алфавиту. Например, в системах материально-технического снабжения или управления производством описание признаков было бы слишком длинным. Даже в простейшем случае, когда речь идет о поиске технологической документации на изделие, оно могло бы выглядеть следующим образом: "Болт стальной, закаленный, марка стали "инструментальная", твердости 80 по Бринелю, с сопротивлением по разрыву 75 кг на квадратный миллиметр, длина болта 80 миллиметров, диаметр - 25 миллиметров, резьба треугольная, с постоянным шагом 3, начинается на расстоянии 15 миллиметров от головки, головка имеет чистоту по второму классу точности, форма головки в виде усеченного конуса с диаметром основания 20 миллиметров".
[1] [2] [3]
Подраздел "Беседы о поколениях ЭВМ"
|
Большинство предоставленного здесь материала является цитированием со старых номеров компьютерных журналов, таких, как
"Мир ПК" или "Компьютерра". К сожалению, все мои попытки связаться с этими изданиями по поводу вопроса о цитировании были безуспешны.
Издания упорно хранили молчание. Что я разрешил себе расценивать как знак согласия, указывая, тем не менее, повсюду как выходные данные
издания (с работающей ссылкой на Интернет-представительство), так и автора публикации. Тем более, что, в силу срока давности этих публикаций, вряд ли материал можно рассматривать как коммерческий или рекламный,
пусть даже названия фирм здесь и присутствуют (уж без этого никуда).
Ежели появятся какие претензии по оному поводу, прошу
издания связаться со мной
Райво Штулберг |