StatSoft Russia
   главная       о компании       продукты       консалтинг       отрасли       ресурсы       порталы       VIP   

Описание системы GeoStat

Введение

Уникальная система GeoStat предназначена для всестороннего анализа геологических данных.

Система GeoStat особенно полезна для геологов-исследователей, занимающихся нефтеразведкой, мониторингом и оценкой запасов полезных ископаемых.

Мониторинг участков недр сводится к построению адекватной трехмерной модели (геометризация).

Подобная модель позволяет на основе наблюдений и количественных измерений выявить форму и условия залегания залежей полезных ископаемых и вмещающих их горных пород, другими словами визуализировать геологическую структуру месторождений.

GeoStat разрабатывается как специализированная система анализа данных, позволяющая с помощью удобного интерфейса выбирать адекватные методы анализа, планировать действия и проводить законченные геостатистические исследования с визуальным представлением результатов, оценкой точности и значимости наблюдаемых эффектов, подготовкой подробного аналитического отчета.

Система GeoStat является узкоспециализированным приложением, содержит тщательно отобранные статистические функции, обеспечивающие анализ геологических данных. Система учитывает специфику геологических данных и обеспечивает выбор адекватных методов анализа и построение моделей в удобном для исследователя интерфейсе, отражающем интуитивное представление геолога о характере исследования.

В качестве источников исходных данных система может работать не только с большими базами данных, но и с относительно простым форматом MS Excel (.xls, .xlsx) или STATISTICA (.sta).

Анализы в системе GeoStat направлены не на вычисление какой-либо одной статистической величины или проверку определённого критерия, а на получение исчерпывающего ответа на запрос исследователя.

Система GeoStat рассчитана на самый широкий круг пользователей, занимающихся геостатистическими исследованиями, включая классификацию и кластеризацию проб, моделирование структуры геологических недр, выявление значимых факторов, оценку запасов, построение зависимостей:

  •  система рассчитана на геостатистиков, проводящих анализ текущих данных, формирующих базы данных, планирующих геологические исследования, анализирующих и описывающих результаты исследований.

  •  система рассчитана на студентов и преподавателей геологических факультетов, занимающихся анализом геологических данных.

  •  система позволяет подготовить отчёт о проведённом исследовании, таблицы и графики для диплома, презентации или выступления на конференции.

  •  система позволяет провести как начальное исследование, так и углубленный анализ данных.

Обзор системы GeoStat

Начальное меню системы GeoStat выглядит следующим образом:

Рис. 1 Начальное диалоговое окно системы GeoStat


Система состоит из нескольких модулей:

  •  Визуальный анализ:

    •  Одномерные гистограммы распределения

    •  Двумерные гистограммы распределения

    •  Диаграммы рассеяния

    •  Линейные графики

    •  Диаграммы размаха

    •  Диаграммы Вороного

    •  Трехмерные графики поверхности

    •  Карты линий уровня

  •  Описательный анализ:

    •  Вычисление основных описательных статистик (среднее, медиана, мода, дисперсия, ст. отклон, квартили, ошибки среднего доверительные интервалы, корреляции)

  •  Анализ вариограмм:

    •  Построение и оценивание трендов

    •  Определение меры анизотропии

    •  Построение и анализ вариограмм любого типа (круговые вариограммы, направленные вариограммы, подгонка экспериментальных моделей, перекрестная проверка)

  •  Интерполяция:

    •  одномерная

    •  двумерная

    •  трехмерная

    •  Методы интерполяции: скользящее среднее, «ближайший сосед», «дальний сосед», полиномиальная регрессия, сплайновая интерполяция, кригинг.

  •  Оценка запасов:

    •  Методы геологических блоков, разрезов, многоугольников, изолиний

    •  Оценка точности подсчета запасов

    •  Кригинговая оценка запасов

  •  Углубленные методы анализа:

    •  Кластерный анализ

    •  Факторный анализ

    •  Построение объяснительных моделей (дисперсионный анализ, дискриминантный анализ, множественная регрессия)

Система GeoStat обладает удобным интерфейсом, реализованным в виде диалоговых окон. Результаты проведённых анализов могут быть представлены непосредственно в системе или в виде аналитических отчётов (см. раздел Способы представления результатов).

Шаг 1. Выбор формата исходных данных

В системе GeoStat вы можете работать как с готовыми таблицами данных STATISTICA (файлы с расширением .sta), так и с файлами электронных таблиц Microsoft Excel (.xls, .xlsx). См. Рис.1.

Кроме того, система способна работать с данными, выгруженными из баз данных (БД). См. Рис.2.

Рис. 2 Пример импорта данных из БД

В том случае, если источником исходных данных является файл MS Excel или STATISTICA, необходимо просто указать месторасположения файла. См. Рис.3.

Рис. 3 Импорт данных из .sta

Шаг 2. Выбор метода

После выгрузки исходных данных в систему GeoStat пользователь попадает в Основное меню системы, в котором пользователь может выбрать метод для анализа данных. Структура каждого анализа подробно раскрыта в «Обзоре системы GeoStat» (см. выше). Далее пользователь выбирает конкретный метод для анализа и задает его параметры.

Рис. 4 Фрагмент основного меню системы GeoStat

На заднем плане вы можете видеть фрагмент данных, выгруженной MS Excel. Пример использования кригинговой интерполяции в системе GeoStat на основе представленных данных смотрите ниже.

Шаг 3. Способы представления результатов

Работая в системе GeoStat, вы можете сохранять результаты в виде аналитических отчётов, при этом часть наиболее важных результатов будет отображаться непосредственно в окне системы.

Oтчёты, созданные с помощью GeoStat, могут быть сохранены в различных форматах:

  •  RTF (Rich Text Format) - это стандартный метод кодировки форматированного текста и графики. Отчёт об исследовании, сохранённый в формате RTF (*.rtf), можно читать и редактировать в любом RTF-совместимом приложении (например, в Microsoft Word).
    Кроме того, доступна опция, при которой в rtf-отчет будут включаться объекты STATISTICA. Данная опция позволяет редактировать и дооформлять отчеты, даже когда они уже были получены. В таком случае, редактирование будет происходить через интерфейс системы STATISICA.

  •  HTML-формат (*.html, *.htm) – позволяет быстро адаптировать результаты исследований для публикации в Интернете.

Опция Способ представления результатов доступна в окне любого анализа GeoStat.


Пример 1: Визуальный анализ данных опробования скважин в системе GeoStat

Шаг 1. Импорт исходных данных

Предположим, вы имеете файл опробования, в котором собраны данные по всем известным пробам. Файл ProbeMet.xls.

В строчках содержится информация по каждой скважине. Помимо номера приводится номер пробы, длина пробы (от и до), содержание некоторых веществ в результате проведения химического анализа.

Рис. 5 Таблица с исходными данными в формате MS Excel

Исходные данные содержатся в таблице в формате .xls. Необходимо импортировать данные для дальнейшей работы в системе GeoStat.

Для корректной и удобной работы в системе, при импортировании в первой строчке таблицы .xls должны находиться названия факторов. См рисунок выше.

Рис. 6 Стартовое окно системы GeoStat

Импорт файла происходит автоматически, пользователю необходимо лишь указать в меню выбора файла, источник исходных данных.

Рис. 7 Основное меню системы GeoStat

После импортирования пользователь попадает в Основное меню системы GeoStat. Здесь помимо импортированной информации в верхнем меню находится инструменты для геостатистического анализа.

Шаг 2. Выбор метода визуального анализа

Следующий этап – статистическая обработка этого массива данных, для того чтобы получить первое представление об его основных свойствах. Рассмотрим инструменты для визуального анализа доступные в системе GeoStat.

Рис. 8 Меню Визуального анализа

Смотрите на рисунке выше меню Визуальный анализ.

Шаг 3. Выбор переменных и задание параметров

Далее выбираем переменные для анализа и задаем параметры графика (кнопка «Задание параметров»). Содержимое меню задания параметров определяется в зависимости от конкретного типа анализа.

Рис. 9 Меню задания параметров и выбора переменных

Можно указать целый список переменных, когда пользователя интересует сразу несколько графиков на выходе. Выбирая несколько переменных в обоих списках, вы можете получить всевозможные диаграммы рассеяния (между всеми выбранными парами переменных).

Шаг 4. Просмотр результатов и сохранение в отчет

После нажатия на кнопку «Построить график» пользователь перемещается в меню «Просмотр результатов». После просмотра и изучения графиков, можно сохранить график в отчет (меню Файл/Сохранить результат).

Одномерная гистограмма

Аналогичным образом можно построить одномерные и двумерные гистограммы. Гистограммы позволяют определить распределение вещества в пробе. С помощью выбора распределения для подгонки и значений статистических критериев пользователь сможет выбрать наиболее подходящее распределение, описывающие, скажем, содержание золота в руде. См. рисунок ниже.

Рис. 10 Одномерная гистограмма в окне результатов

По гистограмме, например, становится ясно, что чаще всего содержание золота в пробе равно 5-6%.
Красная кривая есть результат подгонки нормального распределения по представленным данным. Выбор функции подгонки доступен в меню Задание параметров.

Диаграмма рассеяния

Диаграммы рассеяния используется при исследовании регрессионной зависимости между содержанием различных химических веществ. В данном примере мы рассмотрим диаграмму рассеяния между содержаниями свинца и цинка.

Красная линия означает кривую подгонки, в данном случае была выбрана линейная регрессия. Однако в меню задания параметров доступны также полиноминальная, экспоненциальная, логарифмическая, подгонка сплайнами и д.р.

По ней можно судить о зависимости между содержаниями веществ. Уравнение кривой подгонки выводится в заголовке. По нему можно получить количественные результаты зависимости.

Рис. 11 Диаграмма рассеяния свинца и цинка

Также на диаграмме рассеяния выводится коэффициент корреляции и детерминации (R-квадрат). См. значения слева внизу.

Полученный коэффициент корреляции ( ) говорит о силе связи между переменными, а соответствующий p-уровень (<0.01) о ее значимости. Более подробно о корреляциях см. материал.

При построении диаграмм рассеяния также уместно строить и гистограммы по каждой переменной. Во-первых, гистограмма дает возможность получить распределение признака по каждой переменной, а во-вторых, проверить гипотезу о нормальности для правомерного использования уровня значимости при подсчете коэффициента корреляции.

Рис. 12 Одномерная гистограмма распределения свинца

Рис. 13 Одномерная гистограмма распределения цинка

Если распределение отлично от нормального, необходимо использовать непараметрические методы (расчет коэффициентов Спирмена и гамма доступен в меню задания параметров).

Далее пользователь может сохранить результат в rtf отчет. Для этого необходимо в верхнем меню выбрать Файл/Сохранить результаты.

Рис. 14 Сохранение результатов в системе GeoStat

Диаграмма размаха

Для анализа выбросов и сравнения выборок между собой в системе GeoStat доступны Диаграммы размаха.

Рис. 15 Диаграмма размаха по содержанию химических элементов

Этот график полезен для представления распределений переменных, которые он описывает с помощью следующих трех компонент:

  1.  Центральная точка или линия указывает на положение центральной области (т.е. на среднее или медиану);

  2.  Прямоугольник указывает на характер изменчивости вокруг центрального положения (т.е. квартили, стандартные ошибки или стандартные отклонения);

  3.  Отрезки вокруг прямоугольников указывают на диапазон значений переменной [например, размахи, стандартные отклонения, умноженные на 1.96 стандартные отклонения (95%-й доверительный интервал), умноженные на 1.96 стандартные ошибки среднего (95%-й доверительный интервал)].

Из графика вы видите, что медианы в группах существенно различаются. Медиана – это такое значение выборки, для которого 50 % наблюдений меньше, а 50% наблюдений больше. По сути, обнаруженное различие в медианах говорит о неоднородности признаков.

Также данный график позволяет определять выбросы (точки отмечены «кружочками») – значения нетипичные для выборки. Возможно, что при извлечении или анализе проб произошла ошибка, которая привела к существенным отклонениям в показаниях.

3М графики поверхности

Для создания различных типов трехмерных (3М) графиков, где расположение точек данных определяется тремя координатами, используются 3М графики поверхности.

Обычно при построении подобных графиков требуется пространственные координаты проб. Поэтому в качестве исходных данных используем другие данные.

Рис. 16 Основное меню системы GeoStat с выгруженными исходными данными

Проводится анализ данных полученных при бурении 100 (поле 10 на 10) скважин на глубину до 1000 метров.

Переменные X и Y условно кодируют координату скважины на поверхности, переменная Z – глубину скважина. Проба грунта снималась каждые 50 метров и анализировалась по следующим параметрам:

  1.  BK – боковой каротаж. Измерение удельного электрического сопротивления горных пород.

  2.  DT – акустический каротаж. Измерение интервального времени пробега продольной звуковой волны.

  3.  GR – гамма-метод. Регистрация интенсивности естественного гамма-излучения горных пород.

  4.  NGR – нейтронный гамма-метод. Измерение поглощения и рассеяния нейтронов горными породами.

После этого по комбинации данных показателей делалось заключение (переменная Класс) о структурном составе недр.

Рис. 17 3М график поверхности акустического каротажа

Данный тип графиков позволяет наглядно демонстрировать распределение того или иного параметра в пространстве. На графике по горизонтальным осям отложены координаты пробы, а по вертикальной – DT – акустический каротаж, измерение интервального времени пробега продольной звуковой волны. Акустический каротаж используется при структурном анализе состава недр.

Рис. 18 3М график поверхности акустического каротажа

Карты линий уровня

Также при анализе распределения параметра в плоскости используются карты линий уровня. На них откладываются поверхностные координаты проб, а затем строится линии уровней согласно значениям параметра в имеющихся точках. Различными цветами на графике обозначены различные значения параметра в пробах (например, содержание меди).

Рис. 19 Карты линий уровня по содержанию меди

На приведенном выше графике по 15 пробам построена карта линий уровня. Для ее построения использовался метод наименьших квадратов (опция также задается в меню Задание параметров). Мы видим, что в зоне геологоразведки существует «овражная область» - в центре расположен участок с малым содержанием меди.

Зонные графики

Все типы графиков из этой группы используются для представления последовательностей значений. Наложенный вид этих графиков специально разработан для представления большой категории множеств данных, в которых последовательные переменные представляют части ("порции") целого. В нашем примере это содержание различных веществ в пробе.

Рис. 20 Зонные графики для анализа структурного состава проб


Пример 2: Использование гридинга в системе GeoStat

Введение

Гридинг (griding) – это процедура перехода от неравномерного распределения точек исходных данных к равномерному, правильному в узлах сети (grid), размеры которой задаются геологом.

Цель гридинга – определение значений в узлах заданной правильной сети. Необходимые значение можно найти, используя уже имеющиеся исходные данные. Подобные процедуры называются интерполяцией.

Задачи интерполяции могут быть одномерные (данные по профилю), двумерные (карты) и трехмерные (в объеме). Все эти варианты встречаются в практике геологической разведки месторождений. Но, пожалуй, чаще всего геолог сталкивается с задачами интерполяции на плоскости, т.е. с двумерной интерполяцией.

Продемонстрируем, как с помощью системы GeoStat можно провести кригинговую интерполяцию двумерных данных.

Постановка задачи

Пусть имеются геологические данные из 15 вертикальных буровых скважин. Известны топографические координаты X и Y, а также значение параметра V (например, высота устьев скважин, или содержание определенного вещества, химического соединения, или показатель пористости). См. таблицу в формате STATISTICA ниже.

Рис. 21 Фрагмент исходных данных выгруженных в системе GeoStat

Здесь приведены данные по содержанию меди в пробе, взятой из скважины. Кроме того, имеются координаты месторасположения скважины в некоторой системе координат.

Требуется определить значение параметра в других точках местности, например, если речь идет о высоте, тогда задача сводится к построению топографической карты поверхности участка в изолиниях.

Ниже представлены результаты анализа данных в системе GeoStat.

Визуализация исходных данных

Используя метод наименьших квадратов (меню Визуальный анализ/Карты линий уровней), интерполируем и визуализируем исходные данные с помощью трехмерных карт линий уровня (Перейдем в меню Визуальный анализ/3M карты линий уровней)

Рис. 22 Меню выбора метода визуального анализа

Рис. 23 Меню задания параметров визуального анализа

В окне задания параметров, представленном на Рис.23, пользователь указывает переменные для анализа (в данном случае это горизонтальные и вертикальные координаты, а также соответствующие им концентрации).
Расширенное меню параметров графика доступно через опцию «Задать параметры».

Рис. 24 Трехмерная карта линий уровня из отчета системы GeoStat

Из графика видно, что содержание меди в пробах увеличивается от центра области к границам. 

Кроме того, заметно, что распределение содержания меди изотропно (равномерно изменяется по всем направлениям).
Для более тщательной проверки данного факта можно воспользоваться оценкой анизотропии, доступной в меню Анализа вариограмм.

Идея гридинга

Итак, интересующая нас площадь разбивается на правильные прямоугольники или квадраты. Образуется правильная, регулярная сеть, которая называется гридом. Наша задача найти значение содержания меди в пробе в узлах грида.

Пусть количество узлов – по вертикали 10 и по горизонтали 10. Всего мы должны определить значения показателя в 100 узлах и записать их в матрицу (грид-матрица).

Тем самым мы совершаем переход от 6-ти нерегулярно расположенных точек к 100 регулярно расположенным точкам в узлах грида. Определение значения содержания меди в каждом из узлов грида осуществляется выбранным методом интерполяции. А вся эта процедура перехода от нерегулярной разведочной сети к регулярной с попутным определением значений переменной в каждом узле сети называется гридингом.

 Методы интерполяции

Существует довольно много методов интерполяции: скользящим средним, методы ближнего и дальнего соседа, полиномиальная регрессия, набор локальных методов интерполяции, использование радиальных базисных функций и кригинг. Данные методы доступны в меню Интерполяция системы GeoStat.

Ниже мы рассмотрим именно метод кригинга – метод интерполяции с наименьшей дисперсией.

В большинстве методов интерполяции необходимо задать диаметр поискового круга. Все точки, попавшие в поисковый круг, используются для расчета искомого значения. При этом необходимо вычислить вес каждой точки (взвешивание), другими словами, ее вклад в искомое значение. Веса в той или иной мере зависят от узла до этой точки. Разные методы интерполяции – это разные способы взвешивания исходных данных в зависимости от расстояния.

Кригинг

Кригинг является линейным методом в том смысле, что необходимое значение  определяется с применением среднего взвешенного значений  точек попавших в поисковый круг:

.

 Значения  мы берем из исходной таблицы.

Веса  можно найти из следующего выражения:

При этом  показывает ошибку кригинга – чем меньше , тем лучше сработала кригинговая процедура.

Здесь - расстояние между i-й и j-й точками, попавшими в поисковый круг.

Функция - есть экспериментальная (модельная) вариограмма. Данная функция показывает общую изменчивость в данных в зависимости от расстояния.

Вариограмма

Вариограмма, построенная для рассматриваемого примера, приведена ниже (доступна через меню Анализ вариограмм/Круговая вариограмма). Здесь мы использовали предположение изотропности изучаемого параметра. В таком случае изменчивость содержания меди одинаковая в любом направлении. Это сильно упрощает картину, т.к. можно обходиться одной координатой, точнее говоря, расстоянием между точками.

Рис. 25 Круговая вариограмма (построен коэффициент вариации)

Скажем, если требуется оценить, как сильно вариабельны данные по содержанию меди в пробах взятых на расстоянии 30 условных единиц, то можно просто найти соответствующее значение на вариограмме. - сильная вариабельность.

Также на вариограммах по вертикали могут откладываться дисперсии – смысл от этого не меняется.

Для приведенной синей линии характерна сильная изломанность. Естественно желание заменить эту ломанную кривую какой-нибудь плавно, регулярно изменяющейся линией. Опытным путем геостатистики установили, что вариограммы могут быть подогнаны несколькими классами функций (сферические, экспоненциальные, степенные, логарифмические и др.). Они называются модельными вариограммами. Подгонка модельных вариограмм также доступна в меню Анализ вариограмм.

Результаты

Сравним результаты на картах линий уровня, построенных по исходным данным и в результате использования гридинга.

Рис. 26 Сравнение карт линии уровней в системе GeoStat

Обратите внимание, что в сетке отсутствуют некоторые узлы. Скорее всего, при расчете данных узлов ни одна точка из исходных данных не попала в соответствующий поисковый круг. Для получения информации по всем 100 узлам необходимо увеличить диаметр поискового круга.

В результате гридинга, поверхность стала более гладкой и адекватной, без резких всплесков по краям изучаемой области. Кроме того, получены данные по содержанию меди в 93 точках, которые были заданы геологом.

Список литературы

1. В.П.Боровиков. STATISTICA. Искусство анализа данных на компьютере: для профессионалов (2-е издание), СПб.: Питер, 2003.

2. О. Дюбрюль. Геостатистика в нефтяной геологии, Библиотека нефтяного инжиниринга.

3. Авдонин В.В. и др. Поиски и разведка месторождений полезных ископаемых, М. Фонд «Мир» 2007.

4. В.А. Ермолов. Геология. Часть II. Разведка и геологопромышленая оценка месторождений полезных ископаемых. М: МГГУ, 2005

5. Ю.А.Капутин Горные компьютерные технологии

Учебники и справочники:

1. Справочник по прикладной статистике(под ред. Э.Ллойда, У.Ледермана). – М.: Финансы и статистика, 1990.

2. Ю.А.Розанов. Теория вероятностей, случайные процессы и математическая статистика: Учебник для вузов. – М.: Наука, 1985. – 320 с.

3. Г.И.Ивченко, Ю.И.Медведев. Математическая статистика. – М.: Высшая школа, 1984. – 248 с.

4. Электронный учебник на www.statsoft.ru

Более подробную информацию Вы можете получить у наших специалистов, позвонив по телефону (495)787-77-33 или связавшись с нами по e-mail: sales@statsoft.ru.

Вы можете также заказать курсы по интересующей Вас тематике в
Академии Анализа Данных StatSoft.

В начало


    e-mail    eiioaeou контакты   обратная связь   карта сайта © StatSoft Russia 2012
StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран.