Автор: Булат Бадамшин Редактура: Иван Перминов
Один из главных инструментов для изучения земной коры с целью поиска полезных ископаемых в нефтянке — сейсморазведка.
Сейсморазведка — это геофизический метод исследования структуры, строения и состава горных пород.
Данный метод представляет собой возбуждение упругих колебаний и последующую регистрацию отклика от горных пород. Ниже показана условная схема сейсморазведки:
[Рисунок 1. Схема проведения сейсморазведки](https://lh7-us.googleusercontent.com/2BPlEawbaeB33A5Gi1mRobypFKMavRTgwoEMIt2ulavXtNlymjrs6Rf5z-XiT4AODUTn85I0Df8g8XUXyNkYUdAcuADG_tmtr_qVIJYwD0eB4CD0Sl1ahAiTGC9tdaraNzI8ygAGt45JIeEHyktJbh0)
Рисунок 1. Схема проведения сейсморазведки
Для возбуждения упругих колебаний могут использоваться направленные взрывы или другие источники, например, гидравлические вибраторы. А для регистрации колебаний применяют сейсмоприемники, расставленные на поверхности по определенной сетке. Сейсмоприемник регистрирует амплитуду волны, отраженной от границ горных пород, и время ее прохождения от источника до приемника. По записям этих волн строят сейсмические изображения геологических объектов, что позволяет определить их глубину и форму, а также прогнозировать литологический состав (состав, структура, происхождение и изменение осадочных пород). Сейсморазведка играет ключевую роль при поиске месторождений нефти и газа, а также угля и многих нерудных полезных ископаемых.
Интерпретация сейсмических данных — монотонная и очень трудозатратная процедура. Например, чтобы сейсмику-интерпретатору определить границы отражающих горизонтов, ему нужно «проследить» искомую фазу и пропикировать (проследить) экстремумы по всему кубу данных. А куб этот может содержать до нескольких миллиардов трасс!
Трасс — одномерный вектор, описывающий амплитуды волны во времени.
На интерпретацию одного, среднего по размеру куба у специалиста могут уйти месяцы работы. Поэтому задача ускорения обработки и интерпретации сейсмических данных является очень актуальной.
И, конечно же, сейсмика не упустила шанс воспользоваться благами deep learning 😊. Ведь по сути сейсмические данные — картинки, которые можно интерпретировать с помощью глубоких нейронных сетей. Но если для обычных изображений реального мира у нас есть множество датасетов с разметкой (миллионы картинок, тысячи классов), то для сейсмики таких привилегий нет. Данные в сейсморазведке очень дорогие — раз. Их практически нет в открытых источниках с разметкой — два.
Здесь можно провести аналогию с медицинскими данными. Их тоже трудно найти в открытом доступе, а уж тем более с разметкой. Более того, в сейсмике, как и в медицине, очень субъективная разметка данных, которая сильно зависит от конкретного аннотатора. Еще одна немаловажная особенность: в обеих областях на исследуемых изображениях те объекты, которые необходимо интерпретировать, не имеют ничего общего с объектами из популярных открытых computer vision датасетов (ImageNet, COCO, CitiScapes и др.).
Поэтому здесь не получится обойтись простым файнтюном предобученных чекпоинтов. Например, геология какого-нибудь месторождения в Сибири может сильно отличаться от месторождения на Урале. Значит, обученные на этих участках модели применимы только к тем месторождениям, на которых они обучались. Сейчас пытаются создать универсальную foundation модель за счет предобучения на синтетических данных, но они все равно требуют этапа дообучения на конкретном месторождении.
Один из самых известных открытых датасетов в сейсмике — Netherlands F3 Dataset. По сути это сейсмический ImageNet. Его используют, чтобы тестировать новые подходы, архитектуры для интерпретации сейсмических данных.
В этой статье мы рассмотрим сейсмические данные на примере куба F3. Но это еще не все — мы также разберем данные двух известных соревнований по интерпретации сейсмики и самые топовые решения.
Нидерландский сейсмический куб F3 — это месторождение площадью 384 квадратных километра в Северном море, в 180 км от побережья Нидерланд (см. Рисунок 2).
Рисунок 2. Месторождение, где был снят куб F3
Рисунок 2. Месторождение, где был снят куб F3
Этот сейсмический куб представляет собой трехмерный массив данных (см. Рисунок 3). Для каждой точки массива с координатами x и y содержится сейсмическая трасса — амплитуда зарегистрированного сигнала и время его регистрации. То есть ось z — это ось времени двойного «пробега» волны от земной поверхности до границы и обратно.
Рисунок 3. Netherlands Offshore F3 Block
Рисунок 3. Netherlands Offshore F3 Block