Годун В.М. , Орленко Н.С.. Информационные системы и технологии в статистике (2003)

6.4. Основы построения банка статистических данных для коммерческой деятельности

Создание статистического АБД для коммерческой деятельности направлено на решение следующих основных задач:
обеспечение информационного обслуживания украинских и иностранных пользователей путем предоставления им доступа к проблемноориентованих и специализированных баз данных, которые содержат динамические ряды показателей, аналитические текстовые и библиографические материалы государственной статистики;
обеспечение комплексного информационно-справочного обслуживания пользователей путем предоставления им информации о составе баз данных АБД, регламент их актуализации и пополнения новыми статистическими показателями и материалами, а также комментариев по методологии исчисления и сопоставления данных, которые хранятся в АБД;
обучение пользователей работе с банком данных через учебную подсистему КАБСД;
предоставление пользователям консультаций через автоматизированную систему электронной пошти.
КАБСД обеспечивает следующие основные режимы информационного обслуживания пользователей: «on-line», «off-line», выборочное распространение информации.
Режим «on-line» который является самым распространенным, часто используется в информационном обслуживание пользователей большинства коммерческих АБД. Он обеспечивает непосредственное взаимодействие пользователей АБД в процессе поиска и обработки информации, передаваемой на терминальное устройство (дисплей или персональную ЭВМ) во время сеанса работы с АБД.
Режим «off-line» отличается от «on-line» тем, что информация, выдаваемая АБД по запросу пользователя, не направляется на терминальное устройство, а в виде бумажного документа направляется пользователю по почте. Этот режим также достаточно распространен в коммерческих АБД, он удовлетворяет многих пользователей, не требующие особой оперативности получения информации из АБД. К тому же, по сравнению с режимом «on-line» стоимость предоставляемых услуг достаточно низькою.
Режим выборочного распространения информации является развитой формой «off-line» и строится на основе каталогизированы запросов. В этом режиме пользователь может разместить свой запрос в каталог запросов АБД для долгосрочного хранения с целью постоянного получения с почтой новых данных по определенной тематике. КАБСД должен обеспечивать автоматический просмотр каталогизированы запросов и выдачу информации: при каждой актуализации данных, на которые есть ссылки в каталогизированы запросе; по требованию пользователя; в заданные пользователем моменты времени. Цены на услуги выборочного распространения информации выше, чем на услуги в режиме «off-line», однако удобство однократного обращения к АБД и постоянного получения новой информации привлекает к нему постоянных пользователей (научных работников, сотрудников коммерческих организаций, имеющих долгосрочные интересы, и т.д. . д.).
Коммерческий автоматизированный банк статистических данных представляет собой систему информационных, программных, языковых, организационных и технических средств, предназначенных для ввода, накопления, хранения, актуализации, обработки и издания статистических данных по запросам пользователей. Разработка КАБСД опирается прежде всего на общие принципы построения автоматизированных систем обработки экономической информации. Эти принципы широко освещаются в отечественной и зарубежной литератури.
Основными параметрами функционирования КАБСД являются:
повышена надежность работы всех элементов системы;
наличие специфических для КАБСД подсистем (например, автоматизированных расчетов с пользователями)
удобная язык и средства информационной навигации для эффективного формирования запросов
быстрая реакция системы при реализации информационных услуг
наличие конкурентоспособного информационного фонда статистических данных и материалов, которые по своей тематике, степенью достоверности и актуализации пользуются постоянным или устойчивым периодическим капиталом.
Информационный фонд (ИФ) состоит из фактографических и документальных баз данных, находящихся под управлением СУБД и ИПС, и фонда служебной информации. Каждая база данных делится на разделы, рубрики и подрубрики. Подрубрики выделяются только в больших по объему и относительно самостоятельных по содержанию информационных совокупностях для удобства пользователей. Логическая структура баз данных должна соответствовать системе статистических показателей социально-экономического развития Украины, что обеспечивает удобство для пользователя в процессе навигации по базам данных, логику в организации процессов, их актуализации и расширении. Принципиальная схема КАБСД приведены на рис 6.1.
Логическую структуру информационного фонда КАБСД наглядно рис. 6.2.
В базах данных хранится информация: о населении; труд и кадры; национальное богатство, охрану окружающей среды и рациональное использование природных ресурсов, научно-технический прогресс, расходы, себестоимость, цены, тарифы, производство общественного продукта, вращения общественного продукта, национальный доход, его распределение и использования; деятельность непроизводственной сферы народного хозяйства; социальное развитие народа; финансы, кредит, денежное обращение; внешние связи. Логическая структура информационного фонда КАБСД охватывает фактографическую базу данных (разделы, рубрики, подрубрики и динамические ряды показателей) и документальную базу данных (разделы, включающие текстовые документы).
Итак, информационная модель КАБСД включает фактографическую базу данных, которая содержит динамические ряды статистических показателей социально-экономического развития Украины и зарубежных стран, и документальную базу данных с аналитическими статистическими материалами и библиографией по проблемам статистики Украини.
Например, фактографическая информационная КАБСД может иметь следующие базы данных:
1. Гражданин и среды его жизнедеятельности. Рубрики БД: население и его состав; семья и прибыли; обеспеченность населения товарами и услугами и их потребления, условия труда и жизни, производство и эффективность; образование и культура, здоровья и окружающей среды; моральная статистика.
2. Производство и потребление товаров массового спроса на душу населення.
3. Динамика индекса цен на товары народного споживання.
4. Доходы населения и бюджет семьи.
5. Государственный бюджет, доходы и расходы предприятий и организаций.
6. Себестоимость, затраты и потери в народном господарстви.
7. Национальное багатство.
8. Урожайность сельскохозяйственных культур и продуктивность скота и птицы при разных формах власности.
9. Научно-технический прогресс и эффективность производства. Рубрики БД: общие показатели НТП; внедрение прогрессивных технологий по народнохозяйственных комплексах, факторы влияния научно-технического прогресса в повышении эффективности виробництва.
10. Капитальное будивництво.
11. Международные сравнения основных показателей развития Украины и других стран свиту.
12. Международная торговля и внешнеэкономические связи.
13. Реестр совместных пидприемств.
Минимальной логической единицей в фактографической базе данных является статистический показатель, есть количественная характеристика конкретного экономического явления, процесса или объекта. В БД показатели логично объединяются в динамические ряды, каждый из которых состоит из наименования показателя, его дополнительных признаков и значений на определенный период часу.
В КАБСД используется такая структура динамического ряда показателя: наименование показателя, признак периодичности, признак территории, другие дополнительные признаки, которые уточняют конкретный экономический смысл показателя, а также значение показателя, связанные с потрепанной характеристики.
Как дескриптор для поиска данных используются наименования и все признаки показателя. Например, динамический ряд показателя годовой периодичности: «Численность населения в возрасте до 30 лет в Киеве за 1996-2000 годы в тысячах человек структурируется по территориям». Его дескрипторами являются: название показателя (НП) - численность населения; признак периодичности (Ш) - летняя периодичность; признак территории (Т) - г. Киев; временная характеристика (диапазон) - 1996-2000 гг; признак возрастной структуры (дП1 ) - в возрасте до 30 рокив.
Признак единицы измерения включено в наименование показателя - тысяч / чоловик.
БД допускается хранение нескольких динамических рядов, которые имеют то же наименование показателя, но различаются набором дополнительных ознак.
Каждый динамический ряд показателей представляется в виде строки рубрики или записи файла СУБД. Запись делится на поля, содержащие коды наименований признаков, а также значение показателя динамического ряду.
Организация хранения значений динамических рядов показателя может осуществляться двумя способами:
1. Каждое значение в динамическом ряду показателей связывается с конкретным значением временной характеристики;
2. Значение в динамическом ряду показателей хранится отдельно от значения временной характеристики, а их взаимное привязки выполняется путем пересчета по формулою
П (М) = (М - Н): Ш 1,
где П - позиция значение показателя на М-й момент времени;
М - значение временной характеристики;
Н - начальное значение временной характеристики динамического ряда;
Ш - степень (шаг) динамического ряду.
Преимущество первого способа заключается в отсутствии необходимости хранения пустых значений показателей. Недостаток его - большая избыточность в связи с хранением значений временной характеристики в длинных динамических рядах. Второй способ экономичнее для хранения длинных динамических рядов, экономичный, но его недостаток - необходимость проведения дополнительных расчетов перед выборке значений показателей динамического ряду.
Поскольку КАБСД предназначен для хранения длинных динамических рядов показателей в одной записи, то применяется второй способ. Для ведения документальных баз данных используется информационно-поисковая система, которая обеспечивает хранение текстового, таблично-текстового и библиографического материала, и гибкий интерфейс с пользователями для поиска необходимой информации по ключевым словам и словосочетаниям, по произвольным словам и словосочетаниям, содержащимся в тексте документов, по выделенным полями (автор, название, дата выпуска и т. д.).
При работе в режиме on-line пользователь имеет возможность получать полный список ключевых слов, по которым происходит поиск информации, или выбор элементов для поиска из списков, которые подает программа. Оформление выбранных и обработанных данных состоит в предоставлении документам унифицированного вигляду.
Программные средства обеспечивают выполнение полного объема функций КАБСД:
ведение фонда служебной информации;
поиск и выдачу списка, где находится информация, в частности справочная;
организацию поиска и выбора фактографической и документальной информации;
выполнение функций арифметического и логического обработки значений динамических рядов показателей;
обработки фактографической информации пакетами программ, которые реализуют экономико-математические методы и методы статистической обработки;
организации выдачи фактографичои информации в виде унифицированных таблиц и символьных графиков;
выполнение функций обучения пользователя работе с АБД;
выполнение функций администрирования АБД.
Программные средства КАБСД реализуются в виде подсистем взаимодействия с пользователями администрирования, поиска, выбора и обработки данных, оформления исходных звитив.
Структура программных средств КАБСД. В состав программных средств входят четыре подсистемы:
подсистема взаимодействия с пользователем (средства формирования запроса, сервисные средства пользователя, средства обучения пользователей)
подсистема администрирования БД (средства ведения БД, средства работы с метаданными, средства сбора статистики функционирования АБД)
подсистема поиска и обработки данных (средства реализации запросов обработки и анализа данных)
подсистема оформления исходных материалов (средства генерации отчетов, псевдографические средства).
Работа КАБСД ведется с помощью АРМ пользователей и АРМ администратора БД. Учитывая особую важность надежности хранения и распространения на коммерческой основе статистических материалов и данных, в КАБСД должно быть обеспечено высокую степень безопасности данных и авторизацию доступа к ним. Процессы актуализации, расширения, реорганизации и реструктуризации БД должны быть недоступны пользователю и осуществляться администрацией КАБСД.
Задачи администрирования КАБСД можно разделить на организационные и технические. В организационных задач относятся:
разработке технологических процессов актуализации, расширения, реорганизации, реструктуризации и восстановления БД;
стандартизация интерфейсов между всеми компонентами системы;
повидомляння пользователей об изменениях в базе данных
организация обучения пользователей, подготовка счетов за работу с КАБСД;
контроль расчетов с пользователями и т. д.
Задачами администрирования КАБСД технического характера являются:
обеспечения функционирования технических средств, сопровождение СУБД и других приложений;
контроль за внесением изменений в физические структуры данных
регулирования эксплуатационных характеристик КАБСД;
ведение фонда служебного информации.
Подсистема администрирования включает средства ведения баз данных, средства сбора и обработки статистики функционирования КАБСД, средства АРМ администратора, реализованные на ПЭВМ. Средства ведения баз данных реализуют функции: генерирование и скачивания базы данных, актуализации и расширения базы данных, реструктуризации и реорганизации данных и их видновлювання.
Для оценки эффективности функционирования АБД необходимые данные о:
использования команд языка манипулирования данными СУБД по запросам с целью совершенствования языка пользователя;
частоту обращения к тем или иным физических блоков данных
выполнении тех или иных элементарных операций (пересылка, записи считывания с магнитных носителей, арифметических, логических операций и т. п.);
ошибки, сделанные пользователем при формировании запиту.
Для повышения эффективности работы пользователей с КАБСД существует учебная подсистема. С ее помощью пользователи получают необходимых знаний и навыков. Предусматриваются ознакомление с порядком работы КАБСД, логической структурой информационного фонда, изучения языков пользователей, а также консультации по системе электронной почты, методологических вопросов расчета показателей динамических рядов тощо.
Для уменьшения трата времени и стоимостных затрат и для повышения удобства работы пользователя с КАБСД интерфейс реализуется как пидсистема.
Состав справочной информации для пользователя КАБСД имеет особое значение, поскольку именно она позволяет эффективно осуществлять процесс навигации по базам данных. Роль информационного средства навигации в КАБСД выполняют директории. Структура директории КАБСД предусматривает три уровня справочной информации.
На каждом уровне директория описывает все элементы, а также связь с элементами следующего уровня. Например, связь разделов с базой данных, рубрик с разделами и т. д.
На верхнем уровне в директории БД содержатся краткие описания структур баз данных, хранимых в базе данных информации, их разделов и кодов, а также способов получения справочной информации по разделам БД.
Для КАБСД директория на уровне раздела БД включает описание рубрик, а также краткое описание состава и структуры статистической информации хранится в них.
Директории рубрик, которые являются для КАБСД нижним уровнем, содержащие описание состава и структуры динамических рядов в данной рубрике, их временных характеристик, периодичности, способов обращения к них.
Пользователю предоставляется возможность выбирать формы выдачи директорий из нескольких стандартных форм. Экономическую эффективность и конкурентоспособность коммерческих АБД во многом определяет пользовательский интерфейс. Он обеспечивает формирование запросов пользователей на получение справочной информации по АБД, на поиск и выборку нужных данных и текстовых материалов, контроль корректности вопрос (семантический, логический, синтаксический), выдачу информации пользователю для корректировки неправильно составленных запитив.
Предполагается, что в настоящее время структура спроса на внешнем рынке на украинских статистическую информацию может быть удовлетворена в основном за счет фактографической информации. Поэтому основное внимание будет уделяться проектированию языка пользователя для работы с фактографической базой данных КАБСД. Основными требованиями к языка пользователя является: комфортность для пользователя в процессе составления запросов, простота логики, разгрузки языка синтаксисом, непроцедурнисть, многоязычие, минимальный объем служебной информации, которая выдается користувачеви.
В языке программирования реализация функций поиска, обработки и выдачи информации предусматривает и возможность ошибки пользователя в определении содержания и объема запрашиваемой информации. Например, пользователь может сделать вполне корректно вопрос, выполнение которого системой повлечет выдачу большого количества информации, из которой пользователю необходимо лишь какая-то часть. Чтобы пользователь избежал таких расходов, функции поиска и выдачи данных технологически отделены.

<- 6.3. Компьютерные технологии распространения статистической информации 6.5. АРМ пользователя коммерческого автоматизированного банка статистических данных ->