Вариант НОПС разметки текста по технологии МОДА
Приложение 2
2-О1 – Интеллектуализация процессов современной обработки и преобразования информационной продукции на содержательном уровне
Конференция 55 лет ВИНИТИ
(авторы :Ю.Н. Шуко, Л.В. Грачева, октябрь 2007 г.)
О3 – Реферирование как наиболее массовый этап преобразования информации в краткий (порядка 1500 символов) текст реферата является наиболее массовым аналитическим процессом. Нацеленность процесса реферирования при всех вариантах инструкций по подготовке рефератов и при попытках выработки технологии их подготовки с использованием различных вариантов типовой структуры реферата (TCP), в первую очередь была направлена на решение основной задачи, сформулированной еще в 50-х годах: «реферат выражает центральную тему или предмет публикации, но имеет объем не превышающий 3% объема исходного текста». Эта система реферирования без жесткой TCP действовала в ВИНИТИ долгое время и воспринималась редакторами и референтами, а также пользователями нормально.
П1 – Однако в 80-х годах стал проявляться интерес к типовой структуре реферата. На страницах сборника «Научно-технической информации» ВИНИТИ развернулась дискуссия с критикой сложившейся практики реферирования, появились разработки, в которых авторы пытались найти вариант решения комплексной задачи выработки TCP для РЖ ВИНИТИ.
Н1 – Нарастающая лавина новой информации породила информационные перегрузки пользователей, что в свою очередь, приводит к неадекватному восприятию информации и грубым ошибкам в процессе принятия решений (ППР).
Н2 – Особенно это важно стало в современных рыночных условиях и все возрастающей конкуренции, что предъявляет повышенные требования к информации по параметру оперативной точности.
Н3 – При этом следует учитывать, что сфера действия режима ЛПР/ППР в наше время значительно расширилась – это не только руководители различных уровней, но и каждый человек в практических ситуациях рыночной конкуренции. Однако, в условиях действия Интернета, каждый может получить необходимую ему информацию, но все в том же виде – подборки документов, где необходимые сведения распределены в авторской систематизации и весьма хаотично. Сложившаяся ситуация получила определение «информационных стрессов» в процессе НПР.
О4 – Одним из решений данной проблемы остается РЖ, обеспечивающий многосторонний охват и отражение достижений мировой науки и техники, представленных в структурированной форме в виде рефератов. В связи с тем, что в силу сложившихся обстоятельств ВИНИТИ не в состоянии обеспечивать полный охват мировой научно-технической литературы, необходимо поддерживать на высоком уровне другие достижения института -своевременность публикаций и качество реферирования.
Н4 – Это направление имеет много аспектов реализации, важнейшим из которых, очевидно, следует считать развитие информационной аналитики на основе развития процесса реферирования.
О2 – Интеллектуализация современных ИС посредством их объектной ориентации связана, прежде всего, со структуризацией информации, приданием ей формы сведений, то есть систематизированной совокупности фактов. Представление четко структурированной информации — это первый шаг на пути интеллектуализации ИС.
П1 – Так, информационная технология фреймов практически сводится к созданию типовых структур, имеющих четко выраженные составляющие (слоты). Однако когда речь идет о научно-технической информации, выработка формата представления сведений весьма затруднена из-за многозначности информации, ее принципиальной нечеткости.
П2 – Возможно именно поэтому в принципе перспективный метод поаспектного реферирования так и не получил промышленного внедрения. Этому «способствовало» и другое обстоятельство: процесс преобразования сведений на входе системы (реферирование, аннотирование, т. е. первичное сжатие) не может быть автоматизирован и в ближайшей перспективе остается прерогативой информатора-аналитика.
П3 – В технологии метода объектно-документального анализа (Т-МОДА) объединены некоторые средства, которые много лет устойчиво используются в информационной практике и в принципе новыми не являются. Однако их взаимосвязанное и взаимообусловленное использование, соединение их в едином методе, главная цель которого - повышение точности обработки и преобразования информации в промышленных ИС, выводит этот процесс на уровень универсальных технологических операций со строго определенной последовательностью реализации.
П4 – Принципиальной особенностью Т-МОДА является сквозное единство, преемственность и технологическая взаимосвязь всех сопряженных этапов информационного процесса, что обеспечивается приведением их к определенному формату и согласованием с ним специфики каждого частного процесса.
П5 – Типовые для любой ИС процессы (реферирование, аннотирование, индексирование; систематизация и пересистематизация; подготовка выходных документов) в Т-МОДА представлены в виде трех взаимосвязанных частных технологий, объединенных форматом HOПC (надобъекты – основной объект – подобъекты – связанные объекты).
П6 – Подготовка рефератов с помощью формата НОПС позволяет существенно улучшить их качество на основе гарантированного отбора из первоисточника необходимых потребителю сведений. П7 – Объектно-ориентированный реферат (ОР) - это вторичный документ объемом 1 тыс-1,5 тыс. знаков, в котором сведения об объектах изложены по типовому формату НОПС и наполнены по типовым характеристикам: название -исполнительские аспекты - уровневые характеристики - развитие объектов. В тексте ОР в среднем упоминается 25-30 объектов, что составляет примерно 20% количества объектов в типовом обзоре, статье. Количество объектов, упомянутых в тексте ОР, является основой для контроля качества реферата по параметру «информативность». Этот показатель назовем «объектностью» конкретного текста.
О4 – Исполнители данной работы (проведено 2 НИР по интеллектуализации на основе Т-МОДА) пришли к выводу о необходимости расширения поля исследования с принципиальным акцентом на практике применения TCP в массовом процессе реферирования.
Н5 – Т-МОДА обеспечивает поддержку потребностей пользователя в темпе развития его творческой мысли непосредственно до момента принятия решения.
Н5 – Процесс выработки решения на завершающем этапе остается за человеком.
О5 – Т-МОДА может внедряться в традиционный информационный процесс на любом из этапов - от подборки информационной продукции до подготовки вариантов решения. Внедрение новой технологии в информационные системы и в личную интеллектуально-информационную практику позволит обрабатывать научно-техническую литературу с высокой оперативной точностью, что обеспечит создание нового информационного продукта и повышение/качества услуг.