StatSoft Russia
   главная       о компании       продукты       консалтинг       отрасли       ресурсы       порталы       VIP   
Продукты

       STATISTICA
  »   Neural Networks
       Industrial System
       Data Miner
       Enterprise Solutions
       Каталог продуктов
       Интеграция

Сегментация образцов топлива по данным лабораторного исследования

Объектом исследования является совокупность образцов топлива, подвергшихся лабораторному исследованию. Все переменные, содержащиеся в таблице, стандартизованы (вычитается средний, результат поделен на стандартное отклонение). Требуется сегментировать результаты исследований с различными образцами топлива (число сегментов изначально неизвестно).

Модели прогнозирования свойств сортов топлива, построенные на исходном множестве данных лабораторных исследований, не дают необходимой точности прогноза. Основная причина – разнородность сортов топлива. В данном примере воспользуемся технологией нейросетевого анализа для решения задачи сегментации. Заметим, что обычно при сегментировании какого-то набора объектов решают две задачи: проведение кластерного анализа, решение задачи идентификации группы по результатам лабораторных исследований. В данном примере мы займемся решением первой задачи.

Необходимо построить решающее правило, позволяющее отнести спектр к определенному кластеру с высокой степенью точности.

Структура данных

Исходные данные представлены в таблице системы STATISTICA. Фрагмент таблицы показан на рис.1. Данные являются модельными и иллюстрируют подход к решению задач.

Рис.1. Таблица исходных данных

Всего в таблице имеется 228 переменных, в которых содержатся данные измерений по каждому из 1810 образцов. Здесь все переменные – входные.

Единственной выходной переменной в данной задаче будет переменная, задающая результаты классификации. Значения этой переменной нам и требуется определить.

Построение модели

Шаг 1. Запускаем модуль Нейронные сети из меню Анализ. Для проведения кластерного анализа (когда итоговая классификация не известна) используется архитектура Нейронной сети, которая называется Самоорганизующиеся карты Кохонена.

В качестве типа анализа выбираем Кластерный анализ. Далее, заходим в диалог задания переменных и выбираем все 226 независимых переменных как непрерывные входные переменные.

Для построения карт Кохонена следует использовать инструмент Конструктор сетей. Стартовое окно модуля Нейронные сети принимает вид, показанный на рис.2:

Рис.2. Стартовое окно модуля Нейронные сети с необходимыми установками

Нажимаем кнопку OK и переходим к следующему этапу диалога: выбору сетевой архитектуры и заданию параметров.

Шаг 2. В окне конструктора сетей (рис.3) необходимо указать тип сети – Самоорганизующаяся карта Кохонена.

Рис.3. Окно задания параметров анализа для конструктора сетей, вкладка Быстрый

Перейдем на вкладку Элементы.

Рис.4. Окно задания параметров анализа для конструктора сетей, вкладка Элементы

Вначале сделаем на вкладке Элементы следующие установки: ширина – 5, высота – 5.

Нажимаем OK.

Шаг 3. Переходим к диалогу задания параметров обучения нейронной сети. Диалог задания параметров обучения представлен на рис.5.

Рис.5. Диалог задания параметров обучения самоорганизующейся карты

Величины параметров, задаваемые в этом окне, и их объяснение приведены в полной версии примера.

Шаг 4. Перейдем к изучению результатов. Карта, на которой были предварительно заданы имена кластеров, выглядит следующим образом.

Рис.6. Окно Топологическая карта

Подробнее о топологической карте можно прочитать в полной версии примера.

Шаг 5. После определения классов можно переходить к анализу качества модели. На текущем окне нажимаем Отмена.

Если исходная классификация известна, то наряду с таблицей предсказанных значений можно вывести таблицу описательных статистик (рис.7).

Рис.7. Таблица описательных статистик классификации

Как видно из таблицы, построенная модель дает большие ошибки при классификации 5-го и 3-го кластера.

Ошибки возникли из-за небольшой размерности топологической карты.

Шаг 6. Вернемся к начальному пункту анализа и укажем размерность карты 7x7. О результатах для большей размерности карты можно прочитать в полной версии примера.


    e-mail    eiioaeou контакты   обратная связь   карта сайта © StatSoft Russia 2012
StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран.