Развернутый курс по добыче данных
В течение двухдневного тренинга пользователь интенсивно и всесторонне
освоит идеологию и инструментарий Data mining - Добычи данных, реализованные
в STATISTICA Data Miner, мирового лидера разработки программного
обеспечения для анализа данных StatSoft, и научится решать конкретные
задачи добычи данных.
Результатом прослушивания курса является свободное овладение пакетом
STATISTICA Data Miner - STATISTICA Добытчик данных, возможность
самостоятельной работы и эффективного решения прикладных задач в STATISTICA
Добытчик данных.
Требования к участникам: курс рассчитан на пользователей знакомых с работой
в системе STATISTICA 6.
Часть 1
Что такое Data Mining - Добыча данных: парадигма Data Mining
- Ключевые понятия и определения
- Первое знакомство с системой STATISTICA Data Miner
- STATISTICA Data Miner - Обзор
- Уникальные возможности STATISTICA Data Miner
- Построение системы Data Mining - Добычи Данных
Уникальные возможности STATISTICA Data Miner
- Ключевые понятия и определения
- Объекты анализов и узлы анализов STATISTICA
- Создание проекта Добычи данных
Обзор используемых инструментов и технических возможностей (Часть
1: Построение выборки, создание потоков данных, клонирование потоков данных)
- Ключевые понятия и определения
- Построение выборки (простая, случайная, генеральная совокупность)
- Контроль потока данных при помощи узлов: принятые соглашение и специализированные
опции
- Обработка текстовых переменных и текстовых значений
Обзор используемых инструментов и технических возможностей (Часть
2: Словарь, Параметры, Глобальный словарь)
- Ключевые понятия и определения
- Настройка параметров отдельного взятого анализа или узла
- Настройка глобальных параметров (всего проекта Добычи данных)
- Добыча данных для очень больших объемов данных (Базы данных): масштабируемость
STATISTICA Data Miner
Часть 2
Специализированный инструментарий Data Mining - Добычи данных
- Ключевые понятия и определения
- Специализированный инструментарий Добычи данных
Отсеивание признаков
Обобщенные методы кластерного анализа
Общие деревья классификации и регрессии
Общие CHAID модели
Интерактивные деревья классификации и регрессии
Растущие деревья классификации и регрессии
Многомерные адаптивные сплайны (MAR - МАР сплайны)
Нейронные сети
Правила связи
Интерактивное бурение и расслоение
Развертывание моделей
- Ключевые понятия и определения
- Развертывание решений
Быстрое построение прогноза
- Лифтовые карты выбора оптимальной модели
- Развертывание решений (моделей) для новых данных
Поиск оптимальных моделей; реализация STATISTICA Data Miner
моделей при помощи языка STATISTICA Visual Basic
- Ключевые понятия и определения
- Примеры разработанных проектов Добычи данных
- Углубленные методы классификации
- Обобщенное прогнозирование
Примеры
Вопросы и ответы
Длительность курса: 12 академических часов.
Заявку на этот курс можно оформить, позвонив в наш офис
или отправив запрос по e-mail: sales@statsoft.ru.
|