Курсы лекцийВ начало

Развернутый курс по добыче данных

В течение двухдневного тренинга пользователь интенсивно и всесторонне освоит идеологию и инструментарий Data mining - Добычи данных, реализованные в STATISTICA Data Miner, мирового лидера разработки программного обеспечения для анализа данных StatSoft, и научится решать конкретные задачи добычи данных.

Результатом прослушивания курса является свободное овладение пакетом STATISTICA Data Miner - STATISTICA Добытчик данных, возможность самостоятельной работы и эффективного решения прикладных задач в STATISTICA Добытчик данных.

Требования к участникам: курс рассчитан на пользователей знакомых с работой в системе STATISTICA 6.

 

Часть 1

Что такое Data Mining - Добыча данных: парадигма Data Mining

  • Ключевые понятия и определения
  • Первое знакомство с системой STATISTICA Data Miner
    • STATISTICA Data Miner - Обзор
    • Уникальные возможности STATISTICA Data Miner
    • Построение системы Data Mining - Добычи Данных

Уникальные возможности STATISTICA Data Miner

  • Ключевые понятия и определения
  • Объекты анализов и узлы анализов STATISTICA
  • Создание проекта Добычи данных

Обзор используемых инструментов и технических возможностей (Часть 1: Построение выборки, создание потоков данных, клонирование потоков данных)

  • Ключевые понятия и определения
  • Построение выборки (простая, случайная, генеральная совокупность)
  • Контроль потока данных при помощи узлов: принятые соглашение и специализированные опции
  • Обработка текстовых переменных и текстовых значений

Обзор используемых инструментов и технических возможностей (Часть 2: Словарь, Параметры, Глобальный словарь)

  • Ключевые понятия и определения
  • Настройка параметров отдельного взятого анализа или узла
  • Настройка глобальных параметров (всего проекта Добычи данных)
  • Добыча данных для очень больших объемов данных (Базы данных): масштабируемость STATISTICA Data Miner

Часть 2

Специализированный инструментарий Data Mining - Добычи данных

  • Ключевые понятия и определения
  • Специализированный инструментарий Добычи данных
    • Отсеивание признаков
    • Обобщенные методы кластерного анализа
    • Общие деревья классификации и регрессии
    • Общие CHAID модели
    • Интерактивные деревья классификации и регрессии
    • Растущие деревья классификации и регрессии
    • Многомерные адаптивные сплайны (MAR - МАР сплайны)
    • Нейронные сети
    • Правила связи
    • Интерактивное бурение и расслоение

Развертывание моделей

  • Ключевые понятия и определения
  • Развертывание решений
  • Быстрое построение прогноза
  • Лифтовые карты выбора оптимальной модели
  • Развертывание решений (моделей) для новых данных

Поиск оптимальных моделей; реализация STATISTICA Data Miner моделей при помощи языка STATISTICA Visual Basic

  • Ключевые понятия и определения
  • Примеры разработанных проектов Добычи данных
    • Углубленные методы классификации
    • Обобщенное прогнозирование

Примеры

 

Вопросы и ответы

 

Длительность курса: 12 академических часов.

Заявку на этот курс можно оформить, позвонив в наш офис или отправив запрос по e-mail: sales@statsoft.ru.