Введение в анализ данных, Data Mining & Scoring
Курс посвящен основам Data Mining - новейшим компьютерным технологиям
анализа данных и исследования больших массивов.
Технологии Data Mining наиболее широко применяются в области маркетинга
и исследования рынков. Многие алгоритмы были специально созданы для решения
задач кластеризации клиентов, выявления и наиболее полного удовлетворения
их потребностей.
В данном курсе в качестве областей применения Data Mining рассматриваются
маркетинговый анализ и исследования рынков. Слушатель научится с помощью
современных алгоритмов строить кластеры клиентов, решать задачи прогнозирования
спроса. Особое внимание уделяется проблеме "присвоения рангов"
клиентам - скорингу.
Курс рассчитан на слушателей, знакомых с работой в системе STATISITCA
6.
Что такое Data Mining - Добыча данных: парадигма Data Mining
- Ключевые понятия и определения
- Первое знакомство с системой STATISTICA Data Miner
- STATISTICA Data Miner - Обзор
- Уникальные возможности STATISTICA Data Miner
- Построение системы Data Mining - Добычи Данных
Уникальные возможности STATISTICA Data Miner
- Ключевые понятия и определения
- Объекты анализов и узлы анализов STATISTICA
- Создание проекта Добычи данных
Обзор используемых инструментов и технических возможностей (Часть
1: Построение выборки, создание потоков данных, клонирование потоков данных)
- Ключевые понятия и определения
- Построение выборки (простая, случайная, генеральная совокупность)
- Контроль потока данных при помощи узлов: принятые соглашение и специализированные
опции
- Обработка текстовых переменных и текстовых значений
Обзор используемых инструментов и технических возможностей (Часть
2: Словарь, Параметры, Глобальный словарь)
- Ключевые понятия и определения
- Настройка параметров отдельного взятого анализа или узла
- Настройка глобальных параметров (всего проекта Добычи данных)
- Добыча данных для очень больших объемов данных (Базы данных): масштабируемость
STATISTICA Data Miner
Маркетинговый инструментарий Data Mining - Добычи данных
- Ключевые понятия и определения
- Основные маркетинговые задачи и инструменты их решения
-
Обобщенные методы кластерного анализа как инструмент кластеризации
множества клиентов
-
Общие деревья классификации и регрессии
-
Растущие деревья классификации и регрессии
-
Нейронные сети
-
Правила связи и их использование для анализа потребительских корзин
Интерактивное бурение и расслоение
- Создание простейших OLAP-кубов
- Интерактивное бурение и расслоение как средство поиска закономерностей
в данных
Использование Data Miner для решения задач скоринга
- Ключевые понятия и определения
- Построение простейшей системы скоринга
- Априорный и апостериорный скоринг
- Использование логит регрессии для построения систем скоринга
- Использование нейронных сетей и деревьев классификации для построения
скоринга
Примеры
Вопросы и ответы
Длительность курса: 12 академических часов.
Заявку на этот курс можно оформить, позвонив в наш офис
или отправив запрос по e-mail: sales@statsoft.ru.
|