1.T-RACK: более быстрый механизм восстановления для TCP в сетях центров обработки данных(arXiv)

Автор: Ахмед М. Абдельмонием, Брахим Бенсау

Выдержка. Облачные интерактивные приложения, управляемые данными, генерируют множество небольших потоков TCP, которые конкурируют за небольшое буферное пространство в коммутаторах центра обработки данных. Такие приложения требуют короткого времени завершения потока (FCT) для эффективного выполнения своей работы. Однако TCP не обращает внимания на составной характер данных приложений и искусственно завышает FCT таких потоков на несколько порядков. Это связано с ориентированной на Интернет конструкцией TCP, в которой тайм-аут повторной передачи (RTO) фиксируется как минимум на сотни миллисекунд. Чтобы лучше понять эту проблему, в этой статье мы используем эмпирические измерения на небольшом испытательном стенде для изучения на микроскопическом уровне влияния различных типов потерь пакетов на производительность TCP. В частности, мы выделяем потери пакетов, которые влияют на хвостовую часть небольших потоков, а также пакетные потери, которые охватывают значительную часть небольшого окна перегрузки потоков TCP в центрах обработки данных, чтобы показать существенное влияние на ПКТ. Исходя из этого, мы предлагаем так называемые своевременно ретранслируемые ACK (или T-RACK), простой механизм восстановления после потерь, чтобы скрыть недостатки длинного RTO даже при больших потерях пакетов. Интересно, что T-RACKS достигает этого прозрачно для самого TCP, поскольку не требует каких-либо изменений в TCP на виртуальной машине (ВМ) арендатора. T-RACK могут быть реализованы как уровень программного обеспечения в гипервизоре между виртуальными машинами и сетевой картой сервера или аппаратно как сетевая функция в SmartNIC. Моделирование и результаты реальных испытаний показывают, что T-RACK обеспечивает значительное улучшение производительности.

2. Энергоэффективное размещение рабочих нагрузок в сетях компонуемых центров обработки данных (arXiv)

Автор: Опейеми О. Аджибола, Тайсир Э. Х. Эль-Гораши, Джаафар М. Х. Эльмиргани

Аннотация. В этом документе изучается энергоэффективность инфраструктур компонуемых центров обработки данных (ЦОД) по сетевым топологиям. Используя модель смешанного целочисленного линейного программирования (MILP), мы сравниваем производительность дезагрегации в масштабах стоек и блоков в выбранных электрических, оптических и гибридных сетевых топологиях по сравнению с традиционным ЦОД. По сравнению с контроллером домена в масштабе модуля результаты показывают, что физической дезагрегации в масштабе стойки достаточно для достижения оптимальной эффективности, когда принята топология оптической сети и компоненты ресурсов распределены соответствующим образом. Топология оптической сети также обеспечивает оптимальную энергоэффективность компонуемых ЦОД. В статье также исследуется логическое разделение традиционных серверов ЦОД по топологии оптической сети. По сравнению с физической дезагрегацией в масштабе стойки, логическая дезагрегация серверных ресурсов в каждой стойке обеспечивает незначительное снижение общего энергопотребления постоянного тока (TDPC) благодаря улучшенному размещению требований к ресурсам. Следовательно, включается адаптируемая компонуемая инфраструктура, которая может поддерживать как чувствительные к задержке в памяти (доступ), так и нечувствительные рабочие нагрузки. Мы также проводим исследование внедрения микросервисной архитектуры как в традиционных, так и в компонуемых ЦОД. Наши результаты показывают, что повышение модульности рабочих нагрузок повышает энергоэффективность традиционных ЦОД, но сохраняется непропорциональное использование ресурсов ЦОД. Сочетание дезагрегации и микросервисов позволило снизить TDPC до 23 % по сравнению с традиционными ЦОД, обеспечив оптимальное использование ресурсов и энергоэффективность. Наконец, мы предлагаем эвристику для энергоэффективного размещения рабочих нагрузок в компонуемых ЦОД, которая воспроизводит тенденции, созданные моделью MILP, сформулированной в этой статье.

3. Разработка и внедрение справедливого контроля перегрузки для сетей центров обработки данных (arXiv)

Автор:Ахмед М. Абдельмонием, Брахим Бенсау

Вывод:в центрах обработки данных характер составного скачкообразного трафика вместе с небольшим произведением пропускной способности на задержку и буферами коммутатора приводит к нескольким проблемам с перегрузкой, с которыми плохо справляются традиционные механизмы управления перегрузкой, такие как TCP. Существующие работы пытаются решить проблему путем изменения протокола TCP в соответствии с операционным характером центров обработки данных. Это практически осуществимо в частных условиях, однако в общественных местах такие модификации запрещены. Поэтому в этой работе мы разрабатываем простое управление очередями на основе коммутаторов, чтобы адекватно справляться с такими проблемами перегрузки. Этот подход не влечет за собой модификации алгоритмов отправителя и получателя TCP, что обеспечивает простое и беспрепятственное развертывание в общедоступных центрах обработки данных. Мы представляем теоретический анализ, чтобы показать стабильность и эффективность схемы. Мы также представляем три разные реальные реализации (в качестве модуля ядра Linux и в качестве дополнительной функции OpenvSwitch) и приводим численные результаты как моделирования NS-2, так и экспериментов реального развертывания в небольшом тестовом кластере, чтобы показать его эффективность в достижении высокая пропускная способность в целом, хорошая справедливость и короткое время завершения потока для чувствительных к задержке потоков.