| |
Сегментация образцов топлива по данным лабораторного исследования
Объектом исследования является совокупность образцов топлива, подвергшихся лабораторному исследованию. Все переменные, содержащиеся в таблице, стандартизованы (вычитается средний, результат поделен на стандартное отклонение). Требуется сегментировать результаты исследований с различными образцами топлива (число сегментов изначально неизвестно).
Модели прогнозирования свойств сортов топлива, построенные на исходном множестве данных лабораторных исследований, не дают необходимой точности прогноза. Основная причина – разнородность сортов топлива. В данном примере воспользуемся технологией нейросетевого анализа для решения задачи сегментации. Заметим, что обычно при сегментировании какого-то набора объектов решают две задачи: проведение кластерного анализа, решение задачи идентификации группы по результатам лабораторных исследований. В данном примере мы займемся решением первой задачи.
Необходимо построить решающее правило, позволяющее отнести спектр к определенному кластеру с высокой степенью точности.
Структура данных
Исходные данные представлены в таблице системы STATISTICA. Фрагмент таблицы показан на рис.1. Данные являются модельными и иллюстрируют подход к решению задач.

Рис.1. Таблица исходных данных
Всего в таблице имеется 228 переменных, в которых содержатся данные измерений по каждому из 1810 образцов. Здесь все переменные – входные.
Единственной выходной переменной в данной задаче будет переменная, задающая результаты классификации. Значения этой переменной нам и требуется определить.
Построение модели
Шаг 1. Запускаем модуль Нейронные сети из меню Анализ. Для проведения кластерного анализа (когда итоговая классификация не известна) используется архитектура Нейронной сети, которая называется Самоорганизующиеся карты Кохонена.
В качестве типа анализа выбираем Кластерный анализ. Далее, заходим в диалог задания переменных и выбираем все 226 независимых переменных как непрерывные входные переменные.
Для построения карт Кохонена следует использовать инструмент Конструктор сетей. Стартовое окно модуля Нейронные сети принимает вид, показанный на рис.2:

Рис.2. Стартовое окно модуля Нейронные сети с необходимыми установками
Нажимаем кнопку OK и переходим к следующему этапу диалога: выбору сетевой архитектуры и заданию параметров.
Шаг 2. В окне конструктора сетей (рис.3) необходимо указать тип сети – Самоорганизующаяся карта Кохонена.

Рис.3. Окно задания параметров анализа для конструктора сетей, вкладка Быстрый
Перейдем на вкладку Элементы.

Рис.4. Окно задания параметров анализа для конструктора сетей, вкладка Элементы
Вначале сделаем на вкладке Элементы следующие установки: ширина – 5, высота – 5.
Нажимаем OK.
Шаг 3. Переходим к диалогу задания параметров обучения нейронной сети. Диалог задания параметров обучения представлен на рис.5.

Рис.5. Диалог задания параметров обучения самоорганизующейся карты
Величины параметров, задаваемые в этом окне, и их объяснение приведены в полной версии примера.
Шаг 4. Перейдем к изучению результатов. Карта, на которой были предварительно заданы имена кластеров, выглядит следующим образом.

Рис.6. Окно Топологическая карта
Подробнее о топологической карте можно прочитать в полной версии примера.
Шаг 5. После определения классов можно переходить к анализу качества модели. На текущем окне нажимаем Отмена.
Если исходная классификация известна, то наряду с таблицей предсказанных значений можно вывести таблицу описательных статистик (рис.7).

Рис.7. Таблица описательных статистик классификации
Как видно из таблицы, построенная модель дает большие ошибки при классификации 5-го и 3-го кластера.
Ошибки возникли из-за небольшой размерности топологической карты.
Шаг 6. Вернемся к начальному пункту анализа и укажем размерность карты 7x7. О результатах для большей размерности карты можно прочитать в полной версии примера.
| |