Курсы лекцийВ начало

Введение в анализ данных, Data Mining & Scoring

Курс посвящен основам Data Mining - новейшим компьютерным технологиям анализа данных и исследования больших массивов.
Технологии Data Mining наиболее широко применяются в области маркетинга и исследования рынков. Многие алгоритмы были специально созданы для решения задач кластеризации клиентов, выявления и наиболее полного удовлетворения их потребностей.
В данном курсе в качестве областей применения Data Mining рассматриваются маркетинговый анализ и исследования рынков. Слушатель научится с помощью современных алгоритмов строить кластеры клиентов, решать задачи прогнозирования спроса. Особое внимание уделяется проблеме "присвоения рангов" клиентам - скорингу.
Курс рассчитан на слушателей, знакомых с работой в системе STATISITCA 6.

 

Что такое Data Mining - Добыча данных: парадигма Data Mining

  • Ключевые понятия и определения
  • Первое знакомство с системой STATISTICA Data Miner
    • STATISTICA Data Miner - Обзор
    • Уникальные возможности STATISTICA Data Miner
    • Построение системы Data Mining - Добычи Данных

Уникальные возможности STATISTICA Data Miner

  • Ключевые понятия и определения
  • Объекты анализов и узлы анализов STATISTICA
  • Создание проекта Добычи данных

Обзор используемых инструментов и технических возможностей (Часть 1: Построение выборки, создание потоков данных, клонирование потоков данных)

  • Ключевые понятия и определения
  • Построение выборки (простая, случайная, генеральная совокупность)
  • Контроль потока данных при помощи узлов: принятые соглашение и специализированные опции
  • Обработка текстовых переменных и текстовых значений

Обзор используемых инструментов и технических возможностей (Часть 2: Словарь, Параметры, Глобальный словарь)

  • Ключевые понятия и определения
  • Настройка параметров отдельного взятого анализа или узла
  • Настройка глобальных параметров (всего проекта Добычи данных)
  • Добыча данных для очень больших объемов данных (Базы данных): масштабируемость STATISTICA Data Miner

Маркетинговый инструментарий Data Mining - Добычи данных

  • Ключевые понятия и определения
  • Основные маркетинговые задачи и инструменты их решения
    • Обобщенные методы кластерного анализа как инструмент кластеризации множества клиентов
    • Общие деревья классификации и регрессии
    • Растущие деревья классификации и регрессии
    • Нейронные сети
    • Правила связи и их использование для анализа потребительских корзин

Интерактивное бурение и расслоение

  • Создание простейших OLAP-кубов
  • Интерактивное бурение и расслоение как средство поиска закономерностей в данных

Использование Data Miner для решения задач скоринга

  • Ключевые понятия и определения
  • Построение простейшей системы скоринга
  • Априорный и апостериорный скоринг
  • Использование логит регрессии для построения систем скоринга
  • Использование нейронных сетей и деревьев классификации для построения скоринга

Примеры

 

Вопросы и ответы

 

Длительность курса: 12 академических часов.

Заявку на этот курс можно оформить, позвонив в наш офис или отправив запрос по e-mail: sales@statsoft.ru.