Автоматизированная система статистического анализа прогнозирования параметров технологического процесса производства

Тип работы:
Дипломная
Предмет:
Программирование


Узнать стоимость

Детальная информация о работе

Выдержка из работы

АННОТАЦИЯ

Данный документ представляет собой пояснительную записку к дипломному проекту на тему «Автоматизированная система статистического анализа прогнозирования параметров технологического процесса производства», где отражены все основные этапы проектирования автоматизированной системы.

Система предназначена для более глубокого контроля технологического процесса, и тем самым получения максимально приближенной к заданному качеству продукции и снижения процента брака.

автоматизированная система технологический производство

ВВЕДЕНИЕ

Вопрос качества выпускаемой продукции всегда являлся одним из основных вопросов промышленного производства. Удовлетворение постоянно растущего спроса на высококачественную продукцию возможно только на базе эффективного контроля и анализа качества готовой продукции.

Для повышения качества продукции необходимо постоянно совершенствовать технологию производства, что обеспечивается за счет внедрения автоматизированных систем сбора и обработки информации, анализа технологии и гибкого управления. Оснащение заводов современной вычислительной техникой и использование автоматизированных систем, создает условия для повышения качества готовой продукции. Для решения данной задачи необходимо разработать систему, позволяющую анализировать технологические этапы производства с целью получения требуемых свойств с максимальной вероятностью.

Внедрение подобного проекта в действующее производство позволит значительно понизить процент забракованной продукции, улучшить ее качество за счет повышения качества управления производством.

1. Литературный и патентный обзор постановки подобных задач. Анализ аналогичных систем

Целью проекта является создание автоматизированной системы анализа технологических параметров производства продукции. В настоящее время существует большое количество коммерческих систем решающих эту задачу.

Одной из таких систем является система Stata 7 — универсальный статистический пакет со специализацией в областях эконометрики, биометрики, анализе стратифицированных обследований. Предназначен для студентов, аспирантов, исследователей в прикладных областях, интенсивно пользующихся статистикой в своей работе.

Достоинства пакета

Программа Stata — это универсальный пакет для решения статистических задач в самых разных прикладных областях: экономике, медицине, биологии, социологии. Впервые пакет вышел на рынок под этим названием в начале 80-х гг. В январе 1999 г. была выпущена шестая версия, в декабре 2000 г. — седьмая. Основными достоинствами Stata являются:

· большой спектр реализованных статистических методов; возможности гибкой пакетной обработки данных (т. е. программирования всей последовательности команд, начиная от загрузки данных в память до всех деталей анализа);

· возможности интерактивного режима работы полностью идентичны возможностям пакетной обработки;

· относительная простота написания собственных программных модулей, и, вместе с тем, весьма серьезный спектр средств программирования;

· мощная поддержка как со стороны производителя, так и со стороны других пользователей Stata (через интернетовский список рассылки); огромный архив пользовательских программ в открытом доступе;

· возможность максимизации функций правдоподобия, задаваемых пользователем;

· наличие совместимых по функциональным возможностям и форматам данных реализаций для большинства популярных платформ (Windows, Macintosh, UNIX).

По поводу графических средств мнения пользователей разнятся: с одной стороны, они вполне достаточны для текущего графического анализа данных и подготовки научных публикаций, с другой, несравнимы с графическими возможностями специализированных пакетов типа Harvard Graphics или презентационных программ типа PowerPoint.

Возможности пакета

· Базовые статистические методы описательные статистики, таблицы сопряженности, корреляции, t-тесты, тесты на равенство дисперсий, тесты на пропорции, …

· Линейные модели дисперсионный анализ, линейная регрессия, оценка ковариационной матрицы в форме Хьюбера-Уайта, метод инструментальных переменных, трехшаговый МНК, внешне не связанные регрессии, регрессии с ограничениями, квантильные регрессии, обобщенный МНК.

· Обобщенные линейные модели Гауссовская, биномиальная, Пуассоновская, отрицательная биномиальная, гамма, логит, пробит, степенная модели, модель дополнительных логарифмов.

· Модели с бинарными и ограниченными зависимыми переменными логит, пробит, тобит-модели, регрессия с цензурированием, условно-логистическая регрессия, полиномиальная, вложенная логит-модели, пуассон-регрессия, отрицательно-биномиальная модель, модели с увеличенной пропорцией нулей, модель Хекмана, модель обработки, предельные эффекты.

· Панельные/повторные данные обобщенные уравнения оценивания, регрессии со случайными и фиксированными эффектами, модели пробит и тобит со случайными эффектами, модели Пуассона и отрицательная биномиальная со случайными и фиксированными эффектами, оценка Ареллано-Бонда, регрессия с инструментальными переменными, регрессия с автокоррелированными ошибками, …

· Непараметрические методы статистика Уилкоксона-Манна-Уитни, знаково-ранговый тест Уилкоксона, статистика Крускала-Уоллиса, коэффициенты корреляции Спирмена и Кендалла, тест Колмогорова-Смирнова, точные биномиальные доверительные интервалы, …

· Многомерные методы факторный анализ, метод главных компонент, канонические корреляции, многомерная регрессия.

· Кластерный анализ иерархические методы: одиночная, полная, средняя связи; методы k-средних и k-медиан, дендрограммы, два десятка метрик, расширение пользователями.

· Методы повторных выборок и статистического эксперимента бутстреп, метод складного ножа, метод Монте-Карло.

· Проверка гипотез и работа с оцененными моделямитесты Вальда, отношения правдоподобия, тесты на линейные ограничения, тесты на нелинейные ограничения, предельные эффекты, скорректированные средние, построение прогнозов, извлечение остатков, диагностика выделяющихся наблюдений, тест Хаусмана, тест множителей Лагранжа на пропущенные переменные.

· Максимизация функций правдоподобия, заданных пользователем

· Анализ обследований со сложной структурой выборки выборочные веса, стратификация, многоступенчатая кластерная структура выборки, линеаризованная оценка дисперсии, эффект дизайна, средние, пропорции, отношения, суммы, таблицы сопряженности, линейная регрессия, регрессия с инструментальными переменными, логит, пробит, полиномиальная логит-модели, …

· Модели выбытия модели Каплана-Мейера, Нельсона-Аалена, регрессия Кокса, параметрические модели, тесты на пропорциональность рисков, регрессоры, меняющиеся со временем, цензурирование слева и справа, модели Вейбулаа, экспоненциальная, Гомперца, логнормальная.

· Средства для эпидемиологов стандартизация темпов распространения, случай-контрольная группа, когорты, совмещенный анализ случаев и контрольных групп, модель Мантеля-Хеншеля, фармакокинетика, анализ кривых ROC, использование кодов ICD-9.

· Временные ряды и модели ARIMA, ARCH/GARCH, процедуры Кохрейна-Оркутта, Прейса-Винстена, оценка Ньюи-Веста, коррелограммы, периодограммы, тесты на белый шум, на единичные корни, операторы сдвига, разности, сезонных эффектов.

· Преобразования и тесты на нормальность преобразование Бокса-Кокса, степенные преобразования, тесты Шапиро-Уилка, Шапиро-Франсии, на асимметрию и эксцесс.

· Прочие статистические процедуры и методы размер выборки и мощность тестов, нелинейная регрессия, добавление пропущенных данных, пошаговая регрессия, статистические и математические функции, …

· Операции над данными преобразование данных, совмещение данных, обработка по группам наблюдений, присоединение файлов, сортировка, транспонирование данных, метки, работа со строками, …

· Матричные команды матричная арифметика, обращение матриц, задача на собственные значения, сингулярное разложение, произведение Кронекера, преобразование данные-матрица.

· Язык программирования добавление команд, условные выражения, синтаксический разбор, отладка, программирование меню и диалоговых окон, язык разметки и управления.

Графика

· диаграммы рассеяния, столбцовые и круговые диаграммы, диагностика регрессий, анализ выбытия, непараметрическое сглаживание, квантильные графики.

Internet-возможности

· установка новых программ, пополнение пакета, корпоративные новости, передача файлов.

Пакет SAS

· Пакет SAS содержит командный язык SAS.

· Пакет содержит обширный набор методов от простейшей статистической обработки, до обработки многомерной информации, включая:

· регрессионный анализ (regression analysis);

· дисперсионный анализ (ANalysis Of VAriance — ANOVA);

· компонентный анализ (categorical data analysis);

· факторный анализ (multyvariate data analysis);

· дискриминантный анализ (discriminant analysis);

· кластерный анализ, например, CLUSTER — самостоятельная программа, использующая командный язык SAS, содержит 11 методов;

· проверка значимости и надежности (survival analysis);

· анализ рисков при принятии решений;

· прогнозирование с использованием: экспоненциального сглаживания, моделей линейного роста, АРИСС-модели с учетом сезонности.

· Пакет SAS содержит интегрированные средства хранения и обработки информации, генерации и настройки пользовательских приложений (с использованием встроенного языка программирования).

Анализ пакета SAS показал нерациональность его использования при решении данной задачи ввиду их высокой стоимости (> 20 000 долл. США). Стоимость использования этого программного пакета невозможно снизить за счет использования небольшой группы возможностей, действительно необходимых для решений данной задачи, поскольку большинство компонент пакета взаимосвязаны. Например, большое внимание в пакете SAS уделяется организации масштабных хранилищ данных, что для данной задачи — излишне.

Анализ текстов показывает, программные пакеты SAS и S-PLUS занимают лидирующие позиции на рынке специализированных средств разработки приложений для статистического анализа данных. Однако, ввиду высокой стоимости и существенной функциональной избыточности использование SAS — нерационально. Возможность использования S-PLUS подлежит дальнейшему исследованию.

Существуют и другие мощные пакеты статистического анализа [8,9,10], позволяющие выявлять достаточно сложные зависимости и получать анализ поведения реальных систем, но их недостатками являются статичность, оторванность от реального процесса, ограниченность манипуляции с моделями. Иногда даже небольшое изменение входных данных в таких системах требует повторения всего цикла предварительной подготовки и сложного процесса пересчета модели. Число одновременно используемых статистических методов также ограничено.

Чрезвычайно трудно реализовать многоэтапную подстановку и передачу данных от одного метода к другому и многократное повторение этого процесса [8,10].

В соответствии с изложенным целью данной системы анализа технологических параметров производства является создание универсальной системы анализа, обеспечивающей получение адекватной информации о ходе технологического процесса и позволяющей наиболее точно анализировать полученные результаты. Под универсальностью понимается, что система позволит работать не с конкретным, а с практически любым процессом производства [8].

2. Характеристика информационного объекта и существующей системы обработки информации

2.1 Характеристика технологического процесса

Рис. 1. Технологический процесс производства крахмала

В настоящее время практически любой технологический процесс состоит из множества этапов. Одним из таких процессов является производство крахмала (рис. 1). Крахмальное производство относят к классу непрерывно-дискретных. Это означает, что четко может быть выделено отдельное порция продукции (кукурузная кашка, крахмальная суспензия и т. д.), которая перерабатывается последовательностью технологических агрегатов. Может быть осуществлено слежение за движением каждой порции и за изменением ее физико-химических и размерных параметров на каждом этапе технологического процесса. С другой стороны большинство агрегатов работают в непрерывном процессе, в течение которого в него последовательно задаются отдельные порции сырья. Непрерывно-дискретный характер крахмального процесса требует учета его специфических особенностей в проектируемой системе анализа технологических параметров производства продукции.

Готовый продукт любого производства изготавливается и поставляется потребителям в соответствии с требованиями ГОСТ, отраслевых и межотраслевых технических условий, а также внутризаводских технических условий (стандартов предприятия), регламентирующих требования к полупродукту при передаче его из одного цеха в другой для последующего передела.

Существующие стандарты (в рамках производственного процесса) можно разделить на три основные группы: стандарты на сортамент; стандарты на сортамент и технические требования; стандарты на технические требования. Стандарты, технические условия и другие нормативные документы регламентируют способ изготовления продукции, свойства и допускаемые отклонения свойств от нормы, состав и допускаемые отклонения по составу, механические свойства.

2.2 Характеристика существующей системы обработки информации

2.2.1 Функции и методы сбора, передачи, хранения, обработки, отображения информации и управления

Функции и методы работы с информацией представляют собой как автоматизированную, так и ручную обработку. На участках в каждом цехе ведется постоянный учет и контроль за количеством и свойствами произведенной продукции, что отражается в технологических журналах: журнал сухого крахмала, журнал замочного отделения, журнал технологий и др. Эти данные накапливаются и хранятся на бумажных и машинных носителях в отделах, которые занимаются задачами сбора и обработки информации, где и формируются соответствующие отчетные документы. Организация данных и информационных потоков соответствует определенным формам, документам, заранее выработанным и утвержденным в соответствующих органах управления в зависимости от их важности и уровня представления.

2.2.2 Средства сбора, передачи, хранения, обработки, отображения информации и управления

Сбор информации с объектов осуществляется при помощи специальных датчиков. Вся информация, собранная с объекта и полученная в результате работы системы, хранится в ЭВМ в виде массивов, файлов или баз данных на жестких дисках. Хранение резервных копий информации осуществляется на жестких или гибких дисках. Выходная информация представляется в виде бумажных документов, которые заполняются статистиками отделов технического контроля с определенной периодичностью.

2.2.3 Анализ недостатков в обработке информации

Организация любого процесса производства и функционирование автоматизированных информационных систем и систем реального времени предусматривает периодический контроль за способами анализа данных с целью выявления и устранения недостатков в обработке информации. Современное производство не может обойтись без постоянного слежения за уровнем контроля ведения информационной базы непосредственно снимаемой с объектов управления информации, так как это может привести к различным негативным последствиям, например, к утрате важной информации.

Также для решения многокритериальных производственных задач существующими системами необходимо привлечение большого количества экспертов по конкретной предметной области для корректного описания объекта управления. Это приводит к возрастанию материальных и временных затрат на получение решения.

Недостатками существующих систем анализа являются статичность, оторванность от реального процесса, ограниченность манипуляции с моделями. Иногда даже небольшое изменение входных данных в таких системах требует повторения всего цикла предварительной подготовки и сложного процесса пересчета модели. Число одновременно используемых статистических методов также ограничено.

3. Постановка задачи проекта, цели, критерии и основные ограничения создания автоматизированной системы

Разрабатываемая автоматизированная система анализа технологических параметров производства продукции предназначена для более глубокого контроля технологического процесса, и тем самым получения максимально приближенной к заданному качеству продукции и снижения процента брака.

Данная подсистема проектируется в рамках интегрированной системы управления технологическим процессом, которая предусматривает решение не только задачи выбора оптимальной технологии, но и моделирование технологических процессов, их статистический анализ, определение расходных коэффициентов по видам продукции и агрегатам; расчет затрат по переделам, расчет себестоимости с учетом незавершенного производства, анализ временных характеристик производства.

Автоматизированная система должна решать задачи ввода, проверки логической целостности и корректировки вводимой информации, ее обработки, представления результатов в различных формах, удобных для восприятия и обеспечения взаимодействия пользователя с системой с использованием дружественного интерфейса.

Основными целями создания автоматизированной системы анализа технологического производства направленных на устранение выполнения рутинных операций, являются:

· Статистический анализ входных данных;

· уменьшение диапазонов технологических факторов, что позволит снизить влияние нестабильности технологии;

· выбор технологических диапазонов с максимально возможной вероятностью получения качественной продукции в рамках заданного критерия качества для вида продукции, что с максимальной вероятностью гарантирует получение низкого процента брака;

· выбор наиболее значимых факторов, непосредственно влияющих на выходные свойства;

· поэтапная корректировка технологических диапазонов в соответствии с течением реального технологического процесса с учетом колебаний состава сырья и способов его обработки.

Одним из ограничений, накладываемым на разрабатываемую автоматизированную систему, являются вычислительные ресурсы. Оно связано с обработкой достаточно большого количества информационных массивов и с особенностями реализуемых математических методов и алгоритмов. Система должна обладать временем реакции, соответствующим темпам технологического процесса, поэтому она должна использовать быстрые средства обработки информации.

4. Исследование информационного объекта. Выявление основных свойств и закономерностей

4.1 Теоретическое изучение объекта управления. Построение теоретических математических моделей

Общие сведения.

Управление и анализ являются неотъемлемыми частями любого производственного процесса. В процессе исследования и проработки основной концепцией системы анализа технологических параметров производства стало создание достаточно универсальной системы анализа технологических факторов и свойств [1].

Свойства продукции составляют большую часть регламентируемых стандартами показателей качества и находятся в сложной зависимости от факторов. Отсутствие однозначных функциональных зависимостей между факторами и свойствами готовой продукции, наличие случайных величин, влияющих на технологический процесс и продукцию в целом, привели к необходимости задания технологии в виде разрешённых интервалов для каждого фактора. Исследования показали, что уровень выходных свойств в значительной мере определяется значениями выбранных диапазонов и для получения высоких потребительских характеристик необходимо решать задачу выбора оптимальных диапазонов технологических факторов [2].

Важным этапом в построении систем управления технологии является определение глобальной и локальной технологий [3,4,5,6].

Технология производства задается указанием разрешенных диапазонов технологических величин с помощью соотношений:

где — минимально и максимально допустимые значения технологической величины, i = 1, 2, …, I -номер этапа, на каждом из которых может контролироваться j = 1, 2, …, J технологических величин.

Задача состоит в том, чтобы определить оптимальные значения. Заданную таким образом технологию назовем глобальной.

Технологию, определяющую конкретный этап производства продукции, назовем локальной. Для того чтобы иметь возможность контролировать глобальную технологию, необходимо контролировать локальную.

Дисперсионный анализ.

В процессе наблюдения за исследуемым объектом качественные факторы произвольно или заданным образом изменяются. Конкретная реализация фактора (например, определенный температурный режим, выбранное оборудование или материал) называется уровнем фактора или способом обработки. Модель дисперсионного анализа с фиксированными (постоянными) уровнями факторов называют моделью I, модель со случайными факторами — моделью II. Благодаря варьированию фактора можно исследовать его влияние на величину отклика. В настоящее время общая теория дисперсионного анализа разработана для моделей I.

Дисперсионный анализ основан на разложении общей дисперсии (вариации) отклика на независимые слагаемые, каждое из которых характеризует влияние того или иного фактора или их взаимодействия. Оценив влияние факторов, дисперсионный анализ позволяет выбрать среди них наиболее важные. [11]

В зависимости от количества факторов, включенных в анализ, различают однофакторный, двухфакторный и многофакторный дисперсионный анализ. В данной системе было использовано влияние конкретного фактора на конкретное свойство используя метод однофакторного дисперсионного анализа.

Однофакторный дисперсионный анализ (ANOVA)

Методы однофакторного дисперсионного анализа предназначены для формирования статистических выводов применимо к гипотетической совокупности опытов, если совокупность данных имеет определенный вид, а выборка производится определенным образом.

Предположения:

1. результаты выбираются случайно

2. из нормальных совокупностей

3. с равными дисперсиями 2

4. различные выборки независимы

В результате формируется матрица Х (табл. 1):

Таблица 1. Разбиение исходных данных на уровни с равными n

1 группа

2 группа

m группа

X1. 1

X1. 2

X1. m

X2. 1

X2. 2

X2. m

Xn. 1

Xn. 2

Xn. m

ANOVA включает в себя 5 этапов:

1. Для объяснения данных постулируется линейная модель.

Xij=+j+eij, где 1+ 2+ 3+…+ J=0, а все eij — независимы

2. Формулируется нуль-гипотеза H0.

H0: 1=2=…=J=0 или 1=…=J (т.е фактор не влияет на свойство).

3.

4. Выбирается уровень, то есть исследователь решает, какую вероятность он присвоит отбрасыванию H0, когда она верна. Уровень обычно выбирается равным 10%, 5%, 1% или 0. 1%. Значения, превышающие 10%, вероятно, допускают слишком большой риск неверного отбрасывания H0, а значения, которые меньше 0,1%, вероятно, выбраны слишком осторожно.

5. Производится вычисления сумм квадратов, степеней свободы и средних квадратов.

Сумма значений для первого уровня обозначается так:

Сумма значений, деленная на n — среднее арифметическое первой группы.

Среднее обозначается как:

=(- означает, что суммирование происходит по i)

Общее среднее:

Выборочная дисперсия первой группы:

Полная сумма квадратов:

При расчленении полной суммы квадратов необходимо связать с каждой суммой целые числа, называемые степенями свободы — выражение, заимствованное из области физических наук, где оно характеризует движение объекта. Если объект имеет возможность двигаться прямолинейно, он обладает одной степенью свободы; мяч на корте для игры в гандбол обладает тремя степенями свободы.

Для степени свободы обозначим как

Для — как

6. Рассчитывается F- отношение и сравнивается с точкой процентиля 100*(1-) в распределении FJ-1, J(N-1). Проверка нуль-гипотезы осуществляется путем сравнения отношения с величиной, полученной из F-таблицы, которая должна быть выше табличной в случае отбрасывания нуль-гипотезы.

Сумма квадратов (SS), деленная на число степеней свободы (df), называется средним квадратом (MS). В дисперсионном анализе интересны только два квадрата — средний квадрат между (MSb) и средний квадрат внутри (MSw).

Таким образом, получается важное соотношение:

SSb+SSw=SSt

dfb+dfw=dft=JN-1

Ожидание MSw подразумевается как среднее по большой выборке MSw для многих экспериментов и обозначается как E (MSw). Величина MSw не зависит от средних значений совокупностей, из которых извлекаются группы при проведении эксперимента. MSw — «свободное от среднего», отражающее изменчивость только внутри групп. Тогда MSw=2. Для MSb нельзя утверждать тоже самое, что для MSw, так как если по крайней мере две из генеральных средних различны, то E (MSb) будет превышать 2.

E (MSb)= ,

где 2 — дисперсия каждой совокупности;

N — число элементов в каждой группе; J — число групп; - генеральное среднее j-ой совокупности, — среднее J генеральных средних.

Однофакторный дисперсионный анализ (ANOVA) с неравными n

Нередко в J ячейках однофакторного дисперсионного анализа ANOVA число результатов не равно. Таким образом получается план с неравным числом наблюдений N.

Поскольку в данном случае группы могут содержать различное число значений, необходимо предусмотреть число значений первой группы n1, второй n2, … и J-й группы — nJ. Данные собранные в плане можно представить следующим образом (табл. 2):

Таблица 2. Разбиение исходных данных на уровни с неравными n

1 группа

2 группа

3 группа

X1. 1

X1. 2

X1. 3

X2. 1

X2. 2

X2. 3

X3. 2

Модель

Предполагается, что Xij можно представить в виде следующей линейной модели:

Xij=+j+eij

где Xij — i-ое значение j-ой группы; - среднее J средних, j — разность между средним j-ой совокупности и eij — разность между Xij и, средним j-ой совокупности.

В j-ой группе индекс i принимает значения от 1 до nj. Общее число данных во всех группах обозначим N=n1+n2+… +nJ, n1*1+n2*2+… +nJ*J.

Нуль-гипотеза выглядит так:

H0: j=0 для всех j.

Определяются:

1. Сумма квадратов

2. Степени свободы и средние квадраты

Степени свободы для равны N-J, для — J-1. ,

3. В случае верности нуль-гипотезы отношение будет соответствовать центральному F-распределению с J-1 и N-J степенями свободы. Принимается, определяется точка процентиля 100*(1-) по таблице F-распределения с J-1 и N-J степенями свободы, затем отношение сравнивается с табличным и принимается решение о принятии или отвержении H0, а следовательно значим ли фактор или нет (влияет ли данный фактор на данное свойство).

Факторный анализ.

В современной статистике под факторным анализом понимают совокупность методов, которые на основе реально существующих связей признаков (или объектов) позволяют выявлять латентные обобщающие характеристики организационной структуры и механизма развития изучаемых явлений и процессов.

В факторный анализ состоит из двух этапов:

· решение задачи методом главных компонент (рис. 2);

· оценка уровня информативности;

Метод главных компонент.

Рис. 2. Алгоритм метода главных компонент

Оценка уровня информативности:

Алгебраическими преобразованиями матрицы данных, А выделяются значения информативности факторов.

Кластерный анализ.

Технологические режимы представляются в виде координат метрического пространства, каждый режим со своими значениями входных параметров будет отображаться в некоторую точку этого пространства. Два режима с почти одинаковыми значениями входов отображаются в две близкие точки, а режимы с сильно отличающимися входами будут представляются далекими друг от друга точками. Если имеются сгустки точек, отделенные промежутками от других сгустков, то они выделяются в отдельные структурные части множества — в «кластеры». Сходство или различие между классифицируемыми объектами устанавливается в зависимости от метрического расстояния между ними. В данном случае используется евклидово расстояние [1,2]:

,

где dij — расстояние между i-м и j-м объектами;

xij, xjl — значения i-й переменной соответственно у i-го и j-го объектов.

Методы кластерного анализа можно разделить на две большие группы: иерархический метод, включающий агломеративные (объединяющие), дивизимные (разделяющие) методы и итеративные методы (метод к-средних, FOREL, SKAT, KRAB). Каждый метод как объединяющего, так и разделяющего типа может быть реализован при помощи различных алгоритмов: метод ближнего соседа, метод дальнего соседа, метод средней связи, метод Уорда и метод Боннера. Особенность итеративных методов в том, что кластеры формируются исходя из задаваемых условий разбиения (параметров), которые в процессе работы алгоритма могут быть изменены пользователем для достижения желаемого качества разбиения[2].

Для получения сгустков, содержащих максимальное количество технологических режимов, возможно, использовать методы поиска сгущений: FOREL, KRAB [18]. Алгоритм FOREL предоставляет информацию о кластерах и точках, попавших в эти кластеры. Режимы (объекты), включенные в один таксон (кластер), попадают в гиперсферу с определенным центром С и радиусом R. Изменяя радиус, можно получать разное число таксонов K.

4.2 Экспериментальное изучение информационного объекта

Входы (факторы):

Влажность_зерна

Выборочные характеристики (рис. 4):

Математическое ожидание = 42. 712;

Дисперсия эмпирического распределения = 0. 238;

Дисперсия теоретического распределения = 0. 242;

Коэффициент вариации = 0. 006;

СК01 = 0. 487;

СКО2 = 0. 492;

Второй центральный момент = 0. 238;

Третий центральный момент = 0. 035;

Четвертый центральный момент = 0. 149;

Ассиметрия = 0. 305;

Несмещенная оценка ассиметрии = 0. 314;

S_As = 0. 330; Эксцесс = -0. 051;

Несмещенная оценка эксцесса = 0. 069;

S_Ek = 0. 650;

|As| = 0. 314; 3*S_As = 0. 991;

|Ek| = 0. 069 5*S_Ek = 3. 250

Гипотеза о нормальности распределения принимается

Рис. 4. Диаграмма интервалов для данных «Влажность зерна»

Измельченная кашка

Выборочные характеристики (рис. 5):

Математическое ожидание = 11. 965;

Дисперсия эмпирического распределения = 0. 674;

Дисперсия теоретического распределения = 0. 687;

Коэффициент вариации = 0. 057;

СК01 = 0. 821;

СКО2 = 0. 829;

Второй центральный момент = 0. 674;

Третий центральный момент = -0. 230;

Четвертый центральный момент = 0. 902;

Ассиметрия = -0. 416;

Несмещенная оценка ассиметрии = -0. 429;

S_As = 0. 330;

Эксцесс = -0. 354;

Несмещенная оценка эксцесса = -0. 266;

S_Ek = 0. 650;

|As| = 0. 429; 3*S_As = 0. 991;

|Ek| = 0. 266; 5*S_Ek = 3. 250;

Гипотеза о нормальности распределения принимается.

Рис. 5. Диаграмма интервалов для данных «Влажность зерна»

Суспензия_вещества

Выборочные характеристики (рис. 6):

Математическое ожидание = 33. 012;

Дисперсия эмпирического распределения = 0. 738;

Дисперсия теоретического распределения = 0. 752;

Коэффициент вариации = 0. 023;

СК01 = 0. 859;

СКО2 = 0. 867;

Второй центральный момент = 0. 738;

Третий центральный момент = 0. 019;

Четвертый центральный момент = 1. 304;

Ассиметрия = 0. 030;

Несмещенная оценка ассиметрии = 0. 031;

S_As = 0. 330;

Эксцесс = -0. 531;

Несмещенная оценка эксцесса = -0. 461;

S_Ek = 0. 650;

|As| = 0. 031; 3*S_As = 0. 991;

|Ek| = 0. 461; 5*S_Ek = 3. 250;

Гипотеза о нормальности распределения принимается.

Рис. 6. Диаграмма интервалов для данных «Суспензия вещества»

Кислотность

Выборочные характеристики (рис. 7):

Математическое ожидание = 11. 977;

Дисперсия эмпирического распределения = 1. 705;

Дисперсия теоретического распределения = 1. 739;

Коэффициент вариации = 0. 145;

СК01 = 1. 306;

СКО2 = 1. 319;

Второй центральный момент = 1. 705;

Третий центральный момент = 2. 346;

Четвертый центральный момент = 7. 702;

Ассиметрия = 1. 053;

Несмещенная оценка ассиметрии = 1. 085;

S_As = 0. 330;

Эксцесс = -83. 568;

Несмещенная оценка эксцесса = -92. 073;

S_Ek = 0. 650;

|As| = 1. 085; 3*S_As = 0. 991;

|Ek| = 92. 073; 5*S_Ek = 3. 250;

Гипотеза о нормальности распределения отвергается.

Рис. 7. Диаграмма интервалов для данных «Кислотность»

5. Эскиз технического задания на автоматизированную систему

5.1 Назначение и цели создания системы

5.1.1 Назначение, сфера функционирования АС. Вид автоматизируемой деятельности

Разрабатываемая автоматизированная система анализа технологических параметров производства продукции предназначена для более глубокого контроля технологического процесса, и тем самым получения максимально приближенной к заданному качеству продукции и снижения процента брака

Сфера функционирования разрабатываемой автоматизированной системы — крахмальное производство.

Данная система управления технологическим процессом предусматривает использование не только крахмального производства в качестве объекта, но и другие области, где необходим анализ, моделирование, контроль, прогнозирование технологии, на основе чего делаются конкретные выводы о корректности протекания технологического процесса.

Автоматизированная система должна решать задачи ввода, анализа и обработки, представления результатов в различных формах, удобных для восприятия и обеспечения взаимодействия пользователя с системой с использованием дружественного интерфейса.

По своему функциональному назначению подсистема относится к классу информационно-советующих систем, в иерархии управления она должна занимать один из верхних уровней.

5.1.2 Цели создания АС

Использование данной подсистемы позволит:

§ уменьшить диапазоны технологических факторов, что позволит снизить влияние нестабильности технологии;

§ выбирать технологические диапазоны с максимально возможной вероятностью получения качественной продукции в рамках заданного критерия качества для вида продукции, что с максимальной вероятностью гарантирует получение низкого процента брака;

§ выбирать наиболее значимые факторы, непосредственно влияющие на выходные свойства;

§ производить поэтапную корректировку технологических диапазонов в соответствии с течением реального технологического процесса с учетом колебаний состава сырья и способов его обработки.

В результате создания автоматизируемой системы должны быть достигнуты следующие показатели эффективности функционирования объекта автоматизации:

§ повышение точности производимых расчетов;

§ снижение числа ошибок в принимаемых решениях;

§ уменьшение затрат времени и труда группы лиц, занятых в работе по повышению качества производимой продукции.

Применение проектируемой системы целесообразно в нескольких случаях:

§ технологический процесс содержит большое количество этапов;

§ этапы включают большое количество технологических факторов;

§ получение результатов расчета другими способами не обеспечивает достаточной оперативности.

5. 2 Требования к системе в целом

5.2.1 Описание общей функциональной структуры автоматизированной системы

Автоматизированная подсистема анализа технологических параметров производства продукции должна представлять собой единый модуль, содержащий несколько блоков решающих различные подзадачи, для корректного функционирования всей подсистемы в целом (рис. 8).

Рис. 8. Функциональная схема АС

В соответствии с конкретными целями и задачами управления в состав разрабатываемой подсистемы входят следующие функциональные подсистемы:

· подсистема ввода исходных данных:

обеспечивает ввод исходных данных. Данная подсистема осуществляет считывание данных из файлов базы данных технологического производства для их непосредственного использования другими подсистемами;

· подсистема дисперсионного анализа:

позволяет выделить наиболее важные факторы, то есть те факторы, которые обеспечивают наибольшее влияние на конечные свойства. Результаты расчетов, которые представляют собой уровни значимости факторов, используются в подсистемах факторного и кластерного анализа;

· подсистема факторного анализа:

позволяет получить значимость факторов, используя эксперта. Также можно сопоставить данные, полученные по результатам дисперсионного анализа и проверить информативность выбранных факторов. Результатом работы данной подсистемы являются значимости факторов и также используются в подсистеме кластерного анализа;

· подсистема кластерного анализа:

используя данные, полученные в результате работы дисперсионного и/или факторного анализа, данная подсистема позволяет объединить различные опыты технологического процесса в некоторые сгустки технологического пространства (технологии), т.н. «кластеры» по сходным признакам. Также данная подсистема, используя критерий информации I, может выделить наиболее подходящую технологию, обладающую наибольшим количеством удачных экспериментов. Результатом работы данной подсистемы будут множества экспериментов сгруппированных в кластеры. Данная информация может быть использована при работе подсистемы дискриминантного анализа.

Вся подсистема должна функционировать в автоматизированном режиме, т. е. в режиме, предусматривающем совместные действия пользователя и системы для получения конечного результата работы. Во время работы с данной подсистемой пользователь может использовать те или иные методы в каждой из подсистем, используя существующие настройки. Структура системы должна предусматривать возможность расширения выполняемых функций, а также модернизацию действующих алгоритмов.

5.2.2 Описание требований к численности и квалификации персонала (пользователей) АС, режиму работы персонала

Функционирование автоматизированной подсистемы анализа технологических факторов производства будет происходить под управлением операционной системы из семейства Microsoft Windows, которая обладает интуитивно понятным интерфейсом и обеспечивает удобное взаимодействие пользователей с системой. Для эффективной работы пользователей с автоматизированной системой, персоналу необходимо:

· уметь работать с приложениями ОС Windows;

· быть знакомым с принципами функционирования системы;

· обладать специальными знаниями анализируемой предметной области.

Для работы с системой достаточно одного пользователя, в обязанности которого входит выполнение требований по работе с данной системой.

5.3 Требования к функциям

5.3.1 Описание информационных функций по каждой подсистеме и решаемых в рамках каждой функции задач

В соответствии с конкретными целями и задачами управления в состав разрабатываемой автоматизированной системы анализа технологических факторов производства должны входить следующие функциональные подсистемы:

· подсистема ввода исходных данных использует данные, находящиеся в файлах базы данных в виде значений факторов и свойств и должна:

— обеспечивать открытие файлов баз данных и чтение из них необходимой информации;

· подсистема статистического анализа

— обеспечивать статистический анализ данных;

· подсистема дисперсионного анализа может использовать данные, полученные через подсистему ввода и данные результатов работы подсистемы факторного анализа и должна:

— выделять наиболее значимые факторы, то есть те факторы, которые обеспечивают наибольшее влияние на конечные свойства;

· подсистема факторного анализа может использовать данные, полученные через подсистему ввода и данные результатов работы подсистемы дисперсионного анализа и должна:

— рассчитывать значимости факторов;

— сопоставляя данные, полученные по результатам дисперсионного анализа и проверять информативность выбранных факторов;

· подсистема кластерного анализа использует данные, полученные через систему ввода и данные о том, какие факторы и свойства должны использоваться (результат работы дисперсионного и/или факторного анализов) должна:

— объединять различные опыты технологического процесса в некоторые сгустки технологического пространства (технологии), т.н. «кластеры» по сходным признакам;

— используя критерий информации I, может выделять наиболее подходящую технологию, обладающую наибольшим количеством удачных экспериментов;

· подсистема формирования результатов используя результаты работы других подсистем должна;

— обеспечивать представление результатов работы системы в виде, понятном и удобном для пользователя (графики, гистограммы, таблицы).

Во время функционирования системы можно получить справочную информацию:

· помощь по программе, дающая возможность пользователю изучить особенности работы программы при первом запуске подсистемы;

· справочную информацию о принципах работы системы;

· общая информация о подсистеме, включающая в себя сведения об авторе проекта и его названии;

При функционировании каждой подсистемы и системы в целом имеют место следующие особенности:

· необходимая точность измерения обуславливается видами данных и в среднем составляет 10 знаков после запятой;

· диапазон возможных значений факторов технологического процесса лежит в пределах возможных значений используемых в системе;

В процессе разработки данной системы, необходимо исключить возможные ошибки в работе системы, исключить возможность аварийной ситуации, применив специальные обработки.

5.4 Требования к видам обеспечения

5.4.1 Требования к математическому обеспечению

При разработке проектируемой автоматизированной подсистемы анализа технологических факторов производства предполагается использовать следующие математические методы и алгоритмы, подробное описание которых приведено в п. 4.1. :

· алгоритм дисперсионного анализа:

· алгоритм факторного анализа:

— метод главных компонент;

· алгоритмы кластерного анализа:

— итеративные методы:

ѕ метод к-средних;

ѕ FOREL;

ѕ KRAB;

· алгоритм расчета количества информации на основе энтропии.

5.4.2 Требования к информационному обеспечению

Информационное обеспечение системы должно быть достаточным для выполнения всех функций системы.

Организация внутримашинного информационного обеспечения должна обеспечивать эффективные способы хранения, поиска и извлечения требуемых данных и не нарушать их целостность. Информационная база системы должна включать такое количество информационных массивов, которое необходимо для хранения и обработки всей совокупности данных используемых в ходе решения задачи.

Организация внемашинного информационного обеспечения должна обеспечивать достоверность, однозначность, своевременность и непротиворечивость входной и выходной информации. Перед использованием в системе исходная информация должна проходить проверку на достоверность.

Представление выходных результатов работы системы должно быть организовано в виде наглядных таблиц, графиков.

Средства и алгоритмы хранения и обработки данных в системе должны обеспечивать необходимую точность и быстродействие выполнения всех информационных функций.

Защита данных от разрушения при авариях, приводящих к потере данных на носителях, производится с помощью средств СУБД. Вред от аварийных остановов системы в результате отключения электроэнергии рекомендуется снижать с помощью использования специализированных устройств, обеспечивающих бесперебойную передачу электропитания, в случае сбоя в сети, а также передачу энергии из собственных ресурсов или полном отключении энергоснабжения (ИБП). ИБП обеспечивает работу компьютера после прекращения поступления электропитания в течение времени, необходимого для корректного завершения операций ввода-вывода, сохранения данных, сброса буферов, а также протокольных мероприятий выхода из системы.

5.4.3 Требования к лингвистическому и программному обеспечению

Лингвистическое обеспечение АС должно быть достаточным для создания и нормальной работы системы в целом и подсистемы анализа технологических факторов производства в частности. Взаимодействие оператора с системой должно быть организованно в диалоговом режиме посредством дружественного интерфейса, обеспечивающий понятный доступ ко всем функциям системы.

Для реализации данной системы было крайне затруднительным использование языков программирования низкого уровня (например Ассемблер) в следствии достаточной сложности, поэтому был использован язык программирования высокого уровня С++, используя среду разработки Borland Builder C++ 5.0.

Управление системой осуществляется с помощью клавиатуры для ввода данных и манипулятора типа «мышь» для перемещения по полям, закладкам, таблицам и т. п.

Необходимое программное обеспечение:

· Сертифицированная операционная система семейства MS Windows 9x/Me/NT/2000/XP с поддержкой русского и английского языков;

· программное обеспечение используемых ТС (драйверы устройств);

· ядро системы управления базами данных Borland DataBase Engine (BDE).

Программное обеспечение АС должно выполнять следующие требования к качеству программных средств, способам его обеспечения и контроля (ГОСТ_28 195−89, 28 806−90):

· выполнение всех функций, реализуемых с участием программируемых средств вычислительной техники;

· средства организации всех требуемых процессов обработки данных;

· возможность расширения с учетом перспектив развития пакета программ, т. е. иметь возможность добавить новые методы обработки информации;

· необходимый контроль вводимой информации, в том числе проверки на наличие запрещенных кодовых комбинаций, логическую непротиворечивость отдельных данных, соответствия полей и данных введенных в них;

· удовлетворение требования общей правильности, которое будет проверяться контрольными примерами. Правильность функционирования системы также может быть проверена двухэтапным доказательством правильности, когда сначала доказывается правильность выполнения отдельных подзадач, а затем правильность их взаимодействия в системе;

· в связи большого объёма входных данных необходимого для работы данной подсистемы, необходимо обеспечить такое действие алгоритмов, чтобы ограничение памяти не было критичным;

· обеспечение переносимости используемых математических алгоритмов;

· использование модульного принципа при создании данной системы позволит при необходимости добавить функции АС без существенной переделки её функциональной части;

· отсутствие зацикливаний, ошибочных остановок и аварийных выходов во время работы системы;

· время расчетов не должно занимать длительное время, в противном случае извещать об этом и в таких случаях, использовать индикатор хода расчетов.

5.4.4 Требования к техническому обеспечению

Состав и структура используемых технических средств должны обеспечивать:

· реализацию всех функций;

· возможность модернизации и развития пакета программ;

· взаимозаменяемость одноименных технических средств без каких-либо изменений или регулировок в остальных устройствах.

В соответствии с предварительной разработкой структуры информационной базы, необходим следующий примерный состав комплекса технических средств:

· Сертифицированного ПЭВМ типа IBM PC на базе процессора Pentium IV или его аналогов.

· ОЗУ не менее 256 Мб, что вызвано использованием ОС Windows 2000/XP, а также большим количеством динамически сформированных в процессе выполнения программы массивов и переменных.

· SVGA — адаптер и монитор обеспечат необходимое разрешение для обеспечения визуализации текстовой и графической информации.

· НЖМД — для хранения файлов операционной системы и информационной системы емкостью не менее 80 Гб, для обеспечения свободного места для установки сопутствующего программного обеспечения.

· Клавиатура — англо-русский тип клавиатуры.

· Манипулятор типа «мышь». Для обеспечения простого дружественного диалога пользователя с системой без специальной длительной подготовки.

Энергопитание средств вычислительной техники должно быть обеспечено в соответствии с требованиями ее технической эксплуатации.

Размещение технических средств должно производиться с учетом правил техники безопасности, условий эксплуатации, требований норм технической эстетики и других руководящих и нормативных документов.

5.4.5 Требования к организационному обеспечению

Для нормального функционирования системы с заданными временными и надежностными показателями необходимо обеспечить четкий порядок и последовательность выполнения операций процесса подготовки и обработки данных. В связи с этим должна быть разработана инструкция, содержащая сведения о процессе подготовке и обработки данных, а также процессе представления и использования выходных результатов. В инструкции необходимо привести перечень должностей, ответственных за процесс сбора информации, ввода исходных данных, получения и использования выходных результатов, а в соответствующие должностные инструкции необходимо внести обязанности и описания действий должностных лиц, связанных с функционированием системы.

Для обеспечения подготовки пользователей сотрудники, в должностные обязанности которых будет входить работа с системой, должны пройти обучение, организуемое разработчиком системы.

Для обеспечения эксплуатации системы: обслуживанию программных и технических средств системы, необходимо из штата соответствующего отдела АСУ предприятия выделить оператора, в должностные обязанности которого, наряду с работами, связанными с эксплуатацией других АС, должны быть включены работы по поддержанию информационной базы системы в работоспособном состоянии. Оператор также должен пройти обучение.

5.4.6 Требования к метрологическому обеспечению

Разрабатываемая подсистема при своем функционировании не использует измерительные каналы.

6. Логическое проектирование автоматизированной системы

ПоказатьСвернуть
Заполнить форму текущей работой