Атомарные операции и lockless программирование. Реализация многопоточности с

Использованием технологии OpenMP, блокировки и синхронизация потоков в OpenMP .

Атомарные операции и lockless программирование.

Lockless программирование – разработка неблокирующих многопоточных приложений.

Отказ от использования блокирующих примитивов типа мьютексов и даже критических секций для доступа к разделяемым данным. Достоинство – повышенная производительность многопоточных приложений на многоядерных процессорах. Простейшим способом lockless-программирования является активное использованием атомарных операций при конкурентном доступе нескольких потоков к общим переменным. В достаточно частых случаях необходимо обеспечить конкурентный доступ к какой-либо целочисленной переменной, являющейся счетчиком. Тогда бывает достаточно просто обеспечить атомарность выполнения операций увеличения, уменьшения или изменения значения переменной.

Виды атомарных операций:

· Все инструкции вида Операция Регистр-Регистр можно считать атомарными так как регистры за пределами вычислительного процессорного ядра не видны.

· Загрузка данных из памяти по выровненному адресу в регистр общего назначения.

· Сохранение данных из регистра общего назначения в память по выровненному адресу.

· Специальные операции для атомарной работы (например, cmpxchg).

· Многие команды вида Чтение-Модификация-Запись могут быть сделаны искусственно атомарными с помощью операции блокировки шины (префикс lock).

Реализация атомарных операций в Windows 2000-2003.

· Для увеличения значения целочисленных переменных –InterlockedIncrement, InterlockedIncrement64.

· Для уменьшения значения целочисленных переменных – InterlockedDecrement, InterlockedDecrement64.

· Для изменения значений целочисленных переменных – InterlockedExchange, InterlockedExchange64, InterlockedExchangeAdd, InterlockedExchangePointer.

· Для изменения значений целочисленных переменных со сравнением – InterlockedCompareExchange, InterlockedCompareExchangePointer.

Пример использования атомарной операции:

static DWORD array [100];

for (int i = 0; i < 100; i++)

InterlockedIncrement(array+i);

Эффект переупорядочивания.

Атомарные операции и lockless программирование. Реализация многопоточности с - student2.ru

Атомарные операции и lockless программирование. Реализация многопоточности с - student2.ru

Чтение или запись не всегда будет происходить в том порядке, который указан в вашем коде.

Переупорядочивать операции могут компилятор, исполняемая среда и процессор. Говоря о переупорядочивании, мы приходим к термину модели памяти (memory consistency model или просто memory model). Модель памяти, в которой нет переупорядочивания, чтения и записи будет считаться сильной (strong), а модель памяти, где возможны любые переупорядочивания чтения и записи принято считать слабой (weak). При этом слабые модели обеспечивают наибольшую производительность за счет возможных оптимизаций, но и порождают большое количество проблем при программировании.

Барьеры памяти.

Для борьбы с переупорядочиванием применяются так называемые барьеры памяти (memory barrier или memory fence). В случае барьера для компилятора применяют еще и термин барьер оптимизации (optimization barrier).

Барьеры могут быть как явными, так и не явными (с точки зрения программиста). Кроме того барьеры могут быть полными, двухсторонними и односторонними.

· Полный барьер (full fence) предотвращает любые переупорядочивания операций чтения или записи через него. Таким образом, можно говорить о том, что все операции чтения и записи до барьера будут завершены, по отношению к операциям, расположенным после барьера. Данный барьер предлагает инструкцию mfence в x86/x64 архитектуре.

· Двусторонние барьеры (Store fenceиLoad fence) предотвращают переупорядочивание лишь одного вида операций.

· Барьер записи (store fence) не позволяет переупорядочивать через себя операции записи.

· Барьер чтения(load fence) не позволяет переупорядочивать через себя операции чтения соответственно.

На x86/x64 архитектурах данные барьеры реализованы в инструкциях lfence и sfence.

· Односторонние барьеры обычно реализуют одну из двух семантик – write release (store release) или read acquire (load acquire).

· Write release семантика предотвращает любое переупорядочивание чтения и записи через барьер до барьера (запрет ↓), но не предотвращает переупорядочивания после него.

· Read acquire семантика предотвращает переупорядочивание чтения и записи через барьер после барьера (запрет ↑), но не предотвращает переупорядочивание до него.

Наши рекомендации