Информационные технологии УДК 004.032.24:004.272 Архитектура комплекса конвейерно-параллельной Федеральное государственное бюджетное учреждение науки Институт программных систем им. <...> 4а Гетерогенная вычислительная среда использует различные типы вычислительных блоков. <...> Примером такой среды является GPU-кластер, содержащий процессоры общего назначения (central processing unit, CPU) и графические процессоры специального назначения (graphics processing unit, GPU). <...> Современные GPU уже сейчас значительно превосходят по производительности CPU и, несмотря на ограничения, накладываемые на разрабатываемые в рамках концепции GPGPU-вычислений (general-purpose graphics processing units), параллельные алгоритмы находят свое применение при решении задач, требующих интенсивных вычислений. <...> Организация так называемого «GPU-кластера» может стать эффективным решением, обладающим приемлемым соотношением «цена/производительность» и, что самое важное, возможностью легкого наращивания производительности вычислительной системы. <...> Известно несколько видов параллелизма высокопроизводительных алгоритмов, актуальных и для GPU-кластеров, в том числе параллелизм задачи и параллелизм данных. <...> Исследованы варианты создания высокопроизводительных алгоритмов, предложена схема адаптации ранее разработанного программного комплекса к новым условиям. <...> Библиотека алгоритмов GPU-вычислений в первую очередь должна обладать потокобезопасной реализацией (программный код является потокобезопасным, если он функционирует корректно при использовании нескольких параллельно запущенных вычислительных потоков). <...> Важным и требующим внимания остается вопрос совместного использования ресурсов конкурирующими потоками. <...> Сделаны оценки порога эффективного наращивания числа вычислительных потоков, предполагающего дальнейшее ускорение счета. <...> Компания NVIDIA Для анализа GPGPU-вычислений следует в первую очередь рассмотреть имеРабота выполнена в рамках Программы фундаментальных исследований <...>