Scientific journal
Научное обозрение. Педагогические науки
ISSN 2500-3402
ПИ №ФС77-57475

MANAGING RESOURCES AND WORKLOAD IN THE ADAPTIVE MODELS OF COMPUTING SYSTEMS

Tereshkin D.O. 1 Martyshkin A.I. 1
1 Penza State Technological University
The article is devoted to the problems of description and selection of initial parameters of mathematical models of computer systems with virtualization for specific classes of tasks, adaptation of the systems and Queuing networks used for the study and calculation of models of computer systems with virtualization, as well as issues related to resource management and workload of virtual servers. The analysis of modern works on the subject of the article allows us to note that in the world practice analytical methods are used to obtain results in design tasks that require less resources and allow to solve important problems of analysis and optimization of parameters. The procedure of decision-making in real computing systems work on the basis of the user-defined resource management policies in PLM (Partition Load Manager Manager download sections), and given the priorities of the applications. The resource management policy for each partition group is specified in a policy file that defines both the managed environment and the resource management policy settings. The parameters defined for the management of resources in fact are the criteria of optimization of the structure of the virtual server. The main part of the necessary information for decision-making is collected in the form of statistics during the operation of the system. At the end of the article, the authors give the main results.
resource virtualization
virtual server
computing system
decision procedure
processor pool
workload
resource
adaptability trigger
resource management

Сервера IBM System p, в совокупности с ОС AIX и опцией Advanced POWER Virtualization [1], дают возможность выбора из трех механизмов управления ресурсами и рабочей нагрузкой: Общие процессоры, разделы без ограничений (uncapped). Гипервизор POWER передает неиспользованные процессорные такты тем разделам без ограничений, которые могут получить от них пользу. Workload Manager (Менеджер рабочей нагрузки, WLM). Устанавливает приоритеты приложений на доступ к: ЦП, памяти и подсистеме в/в в пределах раздела. Partition Load Manager (Менеджер загрузки разделов, PLM) [5, 6]. Добавляет в раздел и перемещает между разделами ресурсы ЦП и памяти, используя динамические операции LPAR. Два режима работы: мониторинга и управления.

Для улучшения использования системных ресурсов PLM автоматизирует миграцию ресурсов между разделами, основываясь на загрузке и приоритетах разделов; разделы с большими запросами будут получать ресурсы, добровольно отданные или принудительно отобранные у разделов с меньшими запросами. Определяемые пользователями политики управляют тем, как будут перемещаться ресурсы. Приложение PLM использует модель «клиент-сервер», показанную на рисунке 1, для предоставления совместного доступа к системной информации, такой как события процессора и памяти, всем одновременно работающим логическим разделам [2, 3].

tereshk-1.tif

Рис. 1. Архитектура PLM

Так как каждый раздел контролируется локально, и агенты взаимодействуют с сервером PLM только при возникновении события, PLM потребляет незначительное количество системных и сетевых ресурсов. Политика управления ресурсами (resource management policy) для каждой группы разделов (partition group) указывается в файле политики (policy file), который определяет, как управляемое окружение, так и параметры политики управления ресурсами [4, 5]. Файл политики управления ресурсами содержит: 1) описание основных ресурсов виртуального сервера; 2) макс., мин. и гарантированные значения ресурсов: ЦП и память; 3) шаг наращивания или уменьшения выделенных ресурсов; 4) список виртуальных серверов в пуле, которые будут выступать в роли доноров или акцепторов дополнительных ресурсов; 5) описание интервалов опроса ЦП и памяти на предмет необходимости корректирования объема выделенных ресурсов; 6) пороговые (мин/макс) значения загрузки ЦП и памяти. Каждый раз, когда преодолевается пороговое значение, PLM получает событие Системы управления и контроля – Resource Management and Control (RMC). Когда загрузка ресурса превышает верхнее пороговое значение, раздел PLM считает, что раздел нуждается в дополнительных ресурсах; такой раздел называется requestor (реципиент). Когда загрузка раздела становится меньше, чем нижнее пороговое значение, раздел становится потенциальным донором (donor). При нормальном стечении обстоятельств ресурсы перемещаются от доноров только тогда, когда другой раздел переходит в состояние requestor для того же ресурса. Когда загрузка ресурса находится между двумя пороговыми значениями, PLM считает, что доступных ресурсов достаточно. 7) опции необходимости немедленного освобождения ресурсов, которые больше не используются, поскольку можно «придержать» ресурсы во избежание слишком частых операций по перемещению ресурсов, которые также требуют времени.

Часть определения политики – относительный приоритет каждого раздела в группе. Это достигается путем использования механизма «общих ресурсов» (shares) аналогичного WLM. Чем больше «shares» выделено разделу, тем выше его приоритет. Чтобы предотвратить полное истощение количества ресурсов в некоторых разделах, PLM модулирует приоритет раздела на основе его текущего количества ресурсов.

Когда PLM оповещается о том, что раздел перешел в состояние реципиента, он ищет свободные ресурсы в следующем порядке: свободный пул неразмещенных ресурсов; донор ресурсов; раздел с наименьшим количеством общих (требуемых) ресурсов, имеющий при этом больше ресурсов, чем указано в параметре настройки «guaranteed» (гарантировано).

Количество перемещаемых ресурсов – либо минимальное дельта значение для обоих разделов, либо количество, которое даст им приоритет, указанный в политике.

Определение, какой из узлов больше или меньше требуется в ресурсах, выполняется путем сравнения того, каким количеством ресурсов владеет раздел относительно его приоритета, определяемого, в свою очередь, по количеству «общих ресурсов». PLM ранжирует разделы, включая раздел requestor, в списке разделов с количеством ресурсов, превышающих гарантированное значение. Приоритеты разделов определяются по следующему соотношению [2, 3]:

te1.wmf. (1)

Наименьшее результирующее значение означает наивысший приоритет; разделы с меньшим значением могут получать ресурсы от разделов с большим значением. На рис. 2 показан процесс перемещения ресурсов ЦП для трех разделов. Раздел 3, загруженный, является просителем. В пуле нет свободных ресурсов, нет и разделов доноров. PLM ищет разделы с избыточным количеством ресурсов (большим, чем им гарантировано). Остальные два раздела в группе имеют избыточные ресурсы. Раздел 1 имеет наибольшее соотношение «избыточные–общие ресурсы» из всех трех разделов, и ресурсы будут перемещаться от раздела 1 к разделу 3.

tereshk-2.tif

Рис. 2. Распределение ресурсов PLM

Если запрос ресурсов не может быть выполнен, он помещается в очередь и проходит повторную оценку, когда появятся свободные ресурсы.

PLM управляет памятью, перемещая логические блоки памяти LMB (Logical Memory Blocks) между разделами. Размер LMB зависит от количества памяти, установленной в хост-платформе (CEC). Для определения потребности в памяти PLM использует две метрики:

– Процент утилизации (соотношение используемой и установленной памяти).

– Скорость замещения страниц (page replacement rate).

ОС AIX использует всю доступную ему память. Он не будет выгружать страницы из памяти, если ему не потребуется загрузить другие страницы с диска. Это означает, что если есть избыток памяти, то AIX 5L будет использовать ее и она будет показана как используемая инструментами ОС, даже если нет приложений, использующих ее. По этой причине разделы редко становятся донорами.

Для разделов с выделенными процессорами PLM перемещает физические процессоры (по одному) от разделов, которые не используют их или имеют больший вес избыточности, разделам, которые имеют потребность в них. Это позволяет активным разделам с выделенными процессорами лучше использовать свои ресурсы, например, выравнивая переход от транзакций конца дня к ночным пакетным работам.

Для разделов в общем процессорном пуле PLM управляет выделенной мощностью и количеством виртуальных процессоров (VP). Когда раздел запрашивает больше процессорной мощности, PLM увеличит выделенную мощность для запрашивающего раздела, если дополнительная процессорная мощность доступна. PLM может увеличить количество виртуальных процессоров для увеличения потенциальной возможности раздела потреблять процессорные ресурсы при сильной загрузке для разделов с ограничением (capped) и без ограничения (uncapped). PLM может также, наоборот, уменьшить выделенную мощность и количество виртуальных процессоров при низкой нагрузке для более эффективного использования физических процессоров.

Далее на рис. 3 и 4 показаны основные этапы задания параметров файла политики управления ресурсами.

tereshk-3.tif

Рис. 3. Общие характеристики файла политики

tereshk-4.tif

Рис. 4. Критерии управления ресурсами

Другими словами, заданные параметры управления ресурсами – являются критериями оптимизации структуры виртуального сервера, причем основная часть необходимой информации для принятия решения собирается в виде статистики в ходе работы системы.

Аналогичным образом, в моделях таких ВС задаются триггеры адаптивности с критериями специфичными для модели [6], например, можно задать следующие условия срабатывания триггеров адаптивности:

1) Коэффициент загрузки в заданных пределах или больше/меньше определенного значения, т. о. можно управлять эффективностью загрузки ресурсов;

2) Среднее время пребывания заявки в СМО – аналогично среднему времени пребывания заявки в том или ином компоненте реальной ВС и соответственно нужно стремиться к тому, чтобы расчетное время не превышало более чем в 2 раза заданное время обслуживания, иначе получается, что заявка слишком трудоемка для полной обработки за один проход и из-за этого начнут образовываться очереди;

3) Среднее время ожидания в очереди – аналогично среднему времени ожидания заявки в каком-либо буфере, например, ОП по отношению к ЦП или буфер В/В по отношению к УВВ, а поскольку объем буферов в реальной ВС ограничен, то следует стремиться к тому, чтобы значение этого параметра не превышало N-го числа раз от заданного времени обслуживания.

Таким образом, адаптивные модели выгодны тем, что в процессе выработки решения используется информация, поступающая как от самой модели, так и от исследователя, в виде схем принятия решения, которые задаются исследователем.