← На главную itfresh.ru
Серверное оборудование iDRAC9 🕑 ~9 минут чтения
Data center server cooling rack

Dell PowerEdge R640 и iDRAC9: как взять управление охлаждением в свои руки

Типичная серверная в небольшом офисе — это перманентный шумовой фон, к которому привыкаешь быстро, но который никуда не исчезает. Dell PowerEdge R640 в стандартной конфигурации держит вентиляторы на 28–31% PWM в состоянии покоя и может легко поднять их до 80–100% при кратковременном росте нагрузки или просто при появлении незнакомой PCI-карты. Инженеры Dell заложили такое поведение намеренно: лучше перестраховаться, чем получить тепловой отказ дорогостоящего железа. Но у системного администратора или IT-аутсорсера, который обслуживает парк таких машин, нередко возникает ровно противоположная задача — снизить шум без риска для компонентов, либо, наоборот, обеспечить более агрессивное охлаждение нестандартных GPU-ускорителей и PCIe-карт, которые штатная автоматика не знает как правильно обслуживать.

Серверное охлаждение Dell PowerEdge

iDRAC9 — встроенный контроллер управления Dell — предоставляет несколько инструментов тонкой настройки теплового режима: Thermal Profile (общий алгоритм охлаждения), Fan Speed Offset (коэффициентный буст автоматики) и Minimum Fan Speed (нижний порог оборотов). Вместе эти три рычага дают достаточно контроля, чтобы найти баланс между акустическим комфортом, энергопотреблением и надёжным отводом тепла. В этой статье разберём каждый инструмент детально — с практическими примерами, командами racadm и рекомендациями по мониторингу.


Что такое Thermal Profile и почему Default не всегда хорош

Thermal Profile — это верхнеуровневая политика, которая определяет, как контроллер iDRAC9 реагирует на изменения температуры. Dell реализует четыре режима, и важно понимать реальную разницу между ними, а не только маркетинговые названия.

Default Thermal Profile

Стандартный режим балансирует производительность охлаждения и энергопотребление. Алгоритм отслеживает температуру Inlet (входящего воздуха), процессоров, VRM и памяти, плавно увеличивая обороты по мере приближения к тепловым порогам. Для большинства типовых нагрузок этот режим оптимален — но он абсолютно не учитывает нестандартные карты расширения. Если вы установили GPU или PCIe SSD от стороннего производителя, iDRAC9 не имеет о них термических данных и либо игнорирует нагрев, либо паникует и гонит вентиляторы на максимум.

Maximum Performance

Режим максимальной производительности поддерживает вентиляторы на более высоких оборотах постоянно, не дожидаясь, пока температура начнёт расти. Это означает лучший тепловой запас для burst-нагрузок, но заметно более высокий шум и увеличенное энергопотребление блока питания. Подходит для серверов в хорошо вентилируемых ЦОД, где шум не критичен, и для машин с постоянно высокой вычислительной нагрузкой — например, рендеринг, ML-инференс, компиляция.

Minimum Power (Energy Optimized)

Режим энергоэффективности снижает обороты до минимально допустимых значений и агрессивно использует управление питанием процессора (P-states, C-states). Звучит привлекательно для сервера в офисе — но на практике у него есть важный изъян: при резких скачках нагрузки вентиляторы не успевают раскрутиться достаточно быстро, что создаёт кратковременный тепловой стресс для компонентов. Использовать только если нагрузка предсказуемая и равномерная.

Sound Cap

Специальный режим ограничения шума — iDRAC9 ограничивает максимальные обороты вентиляторов, принося в жертву часть охлаждающей мощности ради тишины. Важно понимать: Sound Cap не гарантирует безопасную температуру. Если сервер работает в плохо вентилируемом помещении с высокой температурой воздуха или несёт пиковую нагрузку, этот режим может привести к тепловому дросселированию CPU. Применяйте только в помещениях с кондиционированием и при умеренной нагрузке.

Практический совет: для большинства серверов в офисных серверных рекомендуем оставить Default Thermal Profile и управлять охлаждением через Fan Speed Offset и Minimum Fan Speed — это даёт более тонкий контроль без рисков Sound Cap.

Fan Speed Offset — коэффициентный буст автоматики

Fan Speed Offset — это не фиксированное значение оборотов, а добавка к вычисленному алгоритмом значению. Иначе говоря, если автоматика решила крутить вентиляторы на 35%, а вы выставили Medium Offset, реальное значение составит примерно 35% + 15% = 50%. Это принципиально важно: смещение не отменяет алгоритм охлаждения, а лишь поднимает всю кривую выше.

Dell предоставляет четыре уровня смещения:

УровеньДобавка к PWMКогда использовать
Low+5–8%Нестандартные PCIe-карты с умеренным тепловыделением
Medium+13–18%Дополнительные GPU без встроенной термической обратной связи
High+25–30%Высокотепловыделяющие карты, плотная компоновка корзины
Max+35–40%Крайние случаи: множество GPU, отсутствие циркуляции воздуха

Точные цифры варьируются в зависимости от ревизии прошивки iDRAC9 и конкретной конфигурации шасси. Реальный эффект стоит всегда проверять через мониторинг температур после изменения настройки.

Важно: Fan Speed Offset применяется поверх любого выбранного Thermal Profile. При Sound Cap смещение ограничено потолком акустического режима — т.е. High Offset в Sound Cap даст меньший эффект, чем в Default.

Минимальная скорость вентиляторов: когда 35% лучше 28%

Параметр Minimum Fan Speed задаёт нижний порог оборотов — значение, ниже которого вентиляторы не опустятся никогда, вне зависимости от температуры окружающей среды и алгоритма охлаждения. По умолчанию этот порог составляет около 28–30% PWM, что соответствует примерно 5000–6000 об/мин для штатных вентиляторов R640.

Зачем повышать минимальный порог? Несколько практических сценариев:

Рекомендуемый диапазон для нагруженных серверов в офисных условиях: 33–40% PWM. Значения выше 50% обычно избыточны и дают заметный шум без реальной термической пользы при нормальной нагрузке.


Пошаговая настройка через веб-интерфейс iDRAC9

Интерфейс iDRAC9 меняется от версии к версии прошивки, но структура меню остаётся стабильной начиная с версии 3.x. Приводим путь для актуальных версий (4.x и 5.x).

  1. Откройте браузер и перейдите по IP-адресу iDRAC вашего сервера. Войдите под учётными данными администратора (по умолчанию root / calvin, но для промышленных серверов должны быть изменены).
  2. В левом меню выберите ConfigurationSystem Settings.
  3. Раскройте раздел Hardware Settings.
  4. Найдите подраздел Fan Speed Settings (или Thermal Settings в старых версиях прошивки).
  5. В поле Thermal Profile выберите нужный режим из выпадающего списка.
  6. В поле Fan Speed Offset установите нужный уровень смещения.
  7. В поле Minimum Fan Speed введите значение в процентах (допустимый диапазон — от 26% до 100%).
  8. Нажмите Apply. Изменения вступают в силу немедленно, без перезагрузки сервера.
Обратите внимание: если поле Minimum Fan Speed недоступно или затенено — скорее всего, выбран режим Maximum Performance или Sound Cap, который переопределяет ручные настройки. Переключитесь на Default Thermal Profile.

Настройка через racadm (CLI)

Командная строка racadm незаменима, когда нужно применить одинаковые настройки охлаждения на десяти серверах разом или интегрировать конфигурирование в систему управления инфраструктурой (Ansible, скрипты деплоя). Racadm доступен как локально (установленный на самом сервере), так и удалённо через SSH к iDRAC.

Подключение к iDRAC по SSH

ssh admin@192.168.1.10

Просмотр текущих тепловых настроек

racadm get System.ThermalSettings

Установка Thermal Profile

# Default
racadm set System.ThermalSettings.ThermalProfile 0

# Maximum Performance
racadm set System.ThermalSettings.ThermalProfile 1

# Minimum Power
racadm set System.ThermalSettings.ThermalProfile 2

# Sound Cap
racadm set System.ThermalSettings.ThermalProfile 3

Установка Fan Speed Offset

# Без смещения (None)
racadm set System.ThermalSettings.FanSpeedOffset 0

# Low
racadm set System.ThermalSettings.FanSpeedOffset 1

# Medium
racadm set System.ThermalSettings.FanSpeedOffset 2

# High
racadm set System.ThermalSettings.FanSpeedOffset 3

# Max
racadm set System.ThermalSettings.FanSpeedOffset 4

Установка минимальной скорости вентиляторов

# Установить минимум 35% PWM
racadm set System.ThermalSettings.MinimumFanSpeed 35

Массовое применение на нескольких серверах

#!/bin/bash
SERVERS=("192.168.1.10" "192.168.1.11" "192.168.1.12")
IDRAC_USER="admin"
IDRAC_PASS="your_password"

for server in "${SERVERS[@]}"; do
  echo "Configuring $server..."
  racadm -r "$server" -u "$IDRAC_USER" -p "$IDRAC_PASS" \
    set System.ThermalSettings.ThermalProfile 0
  racadm -r "$server" -u "$IDRAC_USER" -p "$IDRAC_PASS" \
    set System.ThermalSettings.FanSpeedOffset 1
  racadm -r "$server" -u "$IDRAC_USER" -p "$IDRAC_PASS" \
    set System.ThermalSettings.MinimumFanSpeed 35
done
echo "Done."

Мониторинг температур через iDRAC

Настроить охлаждение — это только полдела. Важно убедиться, что изменения не создали проблем, и продолжать отслеживать тепловые показатели в штатном режиме. iDRAC9 собирает показания со множества датчиков, но для ежедневного мониторинга принципиальны три группы.

Inlet Temperature (температура входящего воздуха)

Это температура воздуха, поступающего в переднюю часть шасси. Именно она является исходной точкой для алгоритма охлаждения. Норма для серверной комнаты: 18–27°C. Если Inlet превышает 30°C — срочно улучшайте вентиляцию помещения, никакие настройки iDRAC не компенсируют горячий воздух на входе.

CPU Temperature

Температура процессора — наиболее очевидный показатель. Для Intel Xeon Scalable (установленных в R640) рабочий диапазон: до 70°C при нагрузке — отлично, 70–85°C — допустимо, выше 85°C — повод для анализа. Критический порог (TjMax) у большинства Xeon — 95–105°C, при его достижении начинается принудительное снижение частоты (thermal throttling).

VRM Temperature

Температура регуляторов напряжения процессора часто упускается из виду, но именно VRM при перегреве первыми выходят из строя или вызывают нестабильность системы. Норма — до 80°C. Если VRM регулярно превышают 85°C — поднимайте Minimum Fan Speed или Fan Speed Offset.

Просмотр температур через racadm

# Все датчики температуры
racadm getsensorinfo

# Только температура
racadm getsensorinfo | grep -i temp

Алёрты на перегрев

Проактивное оповещение о тепловых проблемах экономит тысячи рублей потенциального ущерба. iDRAC9 поддерживает несколько механизмов уведомлений.

Email-уведомления

Путь в веб-интерфейсе: ConfigurationAlerts and Remote System LogAlert Settings. Включите события категории Temperature и Fan, укажите SMTP-сервер и адрес получателя. Рекомендуем подписываться как минимум на события уровня Warning (предупреждение) и Critical (критический).

SNMP-трапы

Если в вашей инфраструктуре есть система мониторинга (Zabbix, PRTG, Nagios) — настройте получение SNMP-трапов от iDRAC. Dell публикует актуальные MIB-файлы на сайте поддержки. Минимальный набор OID для мониторинга температур: 1.3.6.1.4.1.674.10892.5.4.700.20 (inlet), процессорные и VRM-датчики.

Через racadm

# Настройка email-алёрта
racadm set iDRAC.EmailAlert.1.Enable 1
racadm set iDRAC.EmailAlert.1.Address "admin@company.ru"

# Проверка SNMP-трапов
racadm get iDRAC.SNMP
Рекомендуем: настроить порог предупреждения на 5–10°C ниже критического. Это даёт время отреагировать до того, как сервер начнёт дросселировать или аварийно отключаться.

Типичные ошибки и мифы

Миф 1: «Чем тише, тем лучше»

Тишина в серверной — не самоцель. Вентиляторы стоят дёшево по сравнению с процессором или материнской платой. Агрессивное снижение оборотов ради тишины при высокой нагрузке — это реальный риск сокращения срока службы компонентов. Ищите баланс, отталкиваясь от фактических температурных показателей, а не от субъективного ощущения шума.

Миф 2: «Inlet Temp не важна — главное CPU»

Если температура входящего воздуха высокая, никакие обороты вентиляторов не смогут обеспечить нормальное охлаждение: вы гоняете горячий воздух через горячий процессор. Inlet Temp — это первичный показатель здоровья серверной комнаты. Следите за ней в первую очередь.

Ошибка: игнорирование нестандартных карт

При установке PCIe-карт (GPU, RAID-контроллеры, сетевые адаптеры) от производителей, не входящих в список сертифицированных опций Dell, iDRAC9 может не иметь термических данных о них. В этом случае либо выставляйте Fan Speed Offset на High/Max, либо используйте внешний мониторинг температур карты через её собственные инструменты (nvidia-smi для GPU и т.д.).

Ошибка: Sound Cap при нестабильном электропитании

Некоторые инженеры включают Sound Cap на серверах, питающихся от ИБП с нестабильным выходным напряжением. При скачках напряжения нагрузка на VRM возрастает, а ограниченные обороты вентиляторов не успевают компенсировать рост тепловыделения. Это один из самых частых сценариев выхода VRM из строя на серверах Dell в российских офисах.


Рекомендуемые настройки: сводная таблица

На основе практики обслуживания парка серверов Dell PowerEdge в офисных и небольших серверных условиях — рекомендации для типовых сценариев использования:

Нужна помощь специалистов?

ООО «АйТи Фреш» возьмёт это на себя

Не хватает времени или своих специалистов — мы настроим, оптимизируем и возьмём вашу IT-инфраструктуру на постоянное сопровождение. Работаем с юридическими лицами в Москве и регионах. Собственный дата-центр, команда из 8 серверов Dell Xeon Platinum 8280 на базе МТС.

15+лет опыта
25+клиентов
40Gсвоя сеть
24/7поддержка