Многоядерные архитектуры современных вычислительных комплексов

Тип работы:
Курсовая
Предмет:
Программирование


Узнать стоимость

Детальная информация о работе

Выдержка из работы

Содержание:

Введение

1. Структура многоядерных вычислительных комплексов

1.1 Структура процессора

1.2 Структура многоядерных процессоров

1.3 Основные проблемы создания многоядерных процессоров

1.4 Преимущества многоядерных систем

1.5 Недостатки многоядерных систем

2. Программное обеспеченье многоядерных ОС

2.1 Особенности перехода к параллельным вычислениям

2.2 Инструментальные средства разработки ПО

3. Перспективы развития

Заключение

Список литературы

Введение

На сегодняшний день процессоры стали частью нашей жизни. Они используются в электронных приборах практически во всех сферах человеческой жизни: в армии, медицине, образовании, коммерческой деятельности, быту и т. п. В быту процессоры применяются в телевизорах, телефонах, холодильниках и т. д. Развитие микропроцессоров увеличивает функциональные и вычислительные возможности электронных приборов. Уменьшающейся размер микропроцессоров позволяет встраивать их в более мелкие приборы (такие как телефоны и планшетные компьютеры и т. п), а увеличивающаяся вычислительна мощность процессора позволяет решать более сложные задачи. Для увеличения производительности процессоров используют многоядерные архитектуры.

В первой главе данной курсовой работы я описана структура процессора и почему необходимо развивать вычислительную мощность. Структура многоядерной архитектуры ее достоинства и недостатки.

Во второй главе курсовой работы описаны особенности реализации многоядерной архитектуры: параллельные вычисления, программное обеспечение. В подразделе «Программное обеспечение» я описываю инструментарий для разработки многопоточных приложений (компиляторы, программные и аппаратные отладчики) поддержку многопоточности на уровне ОС (операционной системы).

И в последней главе курсовой работы описаны новейшие классификации и перспективы развития многоядерных процессоров, по мнению крупнейших производителей процессоров.

1. Структура многоядерных вычислительных комплексов

1.1 Структура процессора

Процессор, центральное устройство вычислительной машины, выполняющее заданные программой преобразования информации и осуществляющее управление всем вычислительным процессом и взаимодействием устройств вычислительной машины [1]. На рисунке 1 представлена структура процессора

Структура процессора (Рисунок 1).

многоядерный процессор архитектура приложение

В центре современного центрального микропроцессора находится ядро — кристалл кремния площадью примерно один квадратный сантиметр, на котором посредством микроскопических логических элементов реализована принципиальная схема процессора, так называемая архитектура [2]. Ядро связано с остальной частью чипа (называемой «упаковка», CPU Package) по технологии «флип-чип» (flip-chip, flip-chip bonding — перевернутое ядро, крепление методом перевернутого кристалла). Эта технология получила такое название потому, что обращенная наружу — видимая — часть ядра на самом деле является его «дном», — чтобы обеспечить прямой контакт с радиатором кулера для лучшей теплоотдачи. С обратной (невидимой) стороны находится сам «интерфейс» — соединение кристалла и упаковки. Соединение ядра процессора с упаковкой выполнено с помощью столбиковых выводов (Solder Bumps). Ядро расположено на текстолитовой основе, по которой проходят контактные дорожки к «ножкам» (контактным площадкам), залито термическим интерфейсом и закрыто защитной металлической крышкой.

1.2 Структура многоядерных процессоров

Многоядерный процессор — это центральный микропроцессор, содержащий 2 и более вычислительных ядра на одном процессорном кристалле или в одном корпусе [1].

Первый (естественно, одноядерный!) микропроцессор Intel 4004 был представлен 15 ноября 1971 г. Корпорацией Intel. Он содержал 2300 транзисторов, работал на тактовой частоте 108 кГц и стоил $ 300.

Требования к вычислительной мощности центрального микропроцессора постоянно росли и продолжают расти. Но если раньше производителям процессоров приходилось постоянно подстраиваться под текущие насущные (вечно растущие!) запросы пользователей ПК, то теперь чипмейкеры идут с бо-о-о-льшим опережением!

Долгое время повышение производительности традиционных одноядерных процессоров в основном происходило за счет последовательного увеличения тактовой частоты (около 80% производительности процессора определяла именно тактовая частота) с одновременным увеличением количества транзисторов на одном кристалле. Однако дальнейшее повышение тактовой частоты (при тактовой частоте более 3,8 ГГц чипы попросту перегреваются!) упирается в ряд фундаментальных физических барьеров (поскольку технологический процесс почти вплотную приблизился к размерам атома: сегодня процессоры выпускаются по 45-нм технологии, а размеры атома кремния — приблизительно 0,543 нм):

* во-первых, с уменьшением размеров кристалла и с повышением тактовой частоты возрастает ток утечки транзисторов. Это ведет к повышению потребляемой мощности и увеличению выброса тепла;

* во-вторых, преимущества более высокой тактовой частоты частично сводятся на нет из-за задержек при обращении к памяти, так как время доступа к памяти не соответствует возрастающим тактовым частотам;

* в-третьих, для некоторых приложений традиционные последовательные архитектуры становятся неэффективными с возрастанием тактовой частоты из-за так называемого «фон-неймановского узкого места» — ограничения производительности в результате последовательного потока вычислений. При этом возрастают резистивно-емкостные задержки передачи сигналов, что является дополнительным узким местом, связанным с повышением тактовой частоты.

Применение многопроцессорных систем также не получило широкого распространения, так как требует сложных и дорогостоящих многопроцессорных материнских плат. Поэтому было решено добиваться дальнейшего повышения производительности микропроцессоров другими средствами. Самым эффективным направлением была признана концепция многопоточности, зародившаяся в мире суперкомпьютеров, — это одновременная параллельная обработка нескольких потоков команд.

Так в компании Intel родилась Hyper-Threading Technology (HTT) — технология сверхпоточной обработки данных, которая позволяет процессору выполнять в одноядерном процессоре параллельно до четырех программных потоков одновременно[3]. Hyper-threading значительно повышает эффективность выполнения ресурсоемких приложений (например, связанных с аудио- и видеоредактированием, 3D-моделированием), а также работу ОС в многозадачном режиме.

Процессор Pentium 4 с включенным Hyper-threading имеет одно физическое ядро, которое разделено на два логических, поэтому операционная система определяет его, как два разных процессора (вместо одного)[3].

Hyper-threading фактически стала трамплином к созданию процессоров с двумя физическими ядрами на одном кристалле. В 2-ядерном чипе параллельно работают два ядра (два процессора!), которые при меньшей тактовой частоте обеспечивают большую производительность, поскольку параллельно (одновременно!) выполняются два независимых потока инструкций.

Способность процессора выполнять одновременно несколько программных потоков называется параллелизмом на уровне потоков (TLP — thread-level parallelism). Необходимость в TLP зависит от конкретной ситуации (в некоторых случаях она просто бесполезна!).

1.3 Основные проблемы создания многоядерных процессоров

* каждое ядро процессора должно быть независимым, — с независимым энергопотреблением и управляемой мощностью;

* рынок программного обеспечения должен быть обеспечен программами, способными эффективно разбивать алгоритм ветвления команд на четное (для процессоров с четным количеством ядер) или на нечетное (для процессоров с нечетным количеством ядер) количество потоков;

1.4 Преимущества многоядерных процессоров

* возможность распределять работу программ, например, основных задач приложений и фоновых задач операционной системы, по нескольким ядрам;

* увеличение скорости работы программ;

* процессы, требующие интенсивных вычислений, протекают намного быстрее;

* более эффективное использование требовательных к вычислительным ресурсам мультимедийных приложений (например, видеоредакторов);

* снижение энергопотребления;

* работа пользователя ПК становится более комфортной;

1.5 Недостатки многоядерных процессоров

Возросшая себестоимость производства многоядерных процессоров (по сравнению с одноядерными) заставляет чипмейкеров увеличивать их стоимость, а это отчасти сдерживает спрос. Так как с оперативной памятью одновременно работают сразу два и более ядра, необходимо «научить» их работать без конфликтов. Возросшее энергопотребление требует применения мощных схем питания. Требуется более мощная система охлаждения. Количество оптимизированного под многоядерность программного обеспечения ничтожно мало (большинство программ рассчитаны на работу в классическом одноядерном режиме, поэтому они просто не могут задействовать вычислительную мощь дополнительных ядер). Операционные системы, поддерживающие многоядерные процессоры (например, Windows XP SP2 и выше) используют вычислительные ресурсы дополнительных ядер для собственных системных нужд.

Следует признать, что в настоящее время многоядерные процессоры используются крайне неэффективно. Кроме того, на практике n-ядерные процессоры не производят вычисления в n раз быстрее одноядерных: хотя прирост быстродействия и оказывается значительным, но при этом он во многом зависит от типа приложения. У программ, которые не рассчитаны на работу с многоядерными процессорами, быстродействие увеличивается всего на 5%. А вот оптимизированные под многоядерные процессоры программы работают быстрее уже на 50%.

Лидеры процессоростроения, компании Intel и AMD, считают, что будущее за параллельными вычислениями и продолжают последовательно наращивать количество ядер в процессорах.

Появление многоядерных процессоров стимулирует появление операционных систем и прикладного программного обеспечения, поддерживающего многоядерность.

По сообщению пресс-службы AMD, на сегодня рынок 4-ядерных процессоров составляет не более 2% от общего объема. Очевидно, что для современного покупателя приобретение 4-ядерного процессора для домашних нужд пока почти не имеет смысла по многим причинам. Во-первых, на сегодня практически нет программ, способных эффективно использовать преимущества 4-х одновременно работающих потоков; во-вторых, производители ПК позиционируют 4-ядерные процессоры, как Hi-End-решения, добавляя к оснастке ПК самые современные видеокарты и объемные жесткие диски, — а это в конечном счете еще больше увеличивает стоимость и без того недешевых ПК

Разработчики Intel говорят: «…в процессе развития количество ядер будет становиться всё больше и больше…».

Раздел 2. Программное обеспеченье многоядерных вычислительных комплексов

Расчёт увеличения производительности за счет распараллеливания процессов.

Для расчета увеличения производительности используют закон Амдала. Закон Амдала гласит, что прирост производительности (S) системы зависит от количества процессоров (N) и доли последовательных операций © в программе: S?1/(с+(1-с)/N). Граничные значения c соответствуют полностью параллельным (c=0) и полностью последовательным (c=1) программам. Если лишь 1/10 часть программы выполняется последовательно, то в принципе невозможно ускорение в десять раз вне зависимости от числа используемых процессоров (ядер)[4]. Важное следствие закона Амдала состоит в том, что максимальный рост производительности (в N раз при N процессорах) недостижим. В противном случае последовательно исполняемая часть программы должна быть равна нулю, что невозможно. Еще одно следствие закона таково: чем меньше доля последовательно исполняемой части программы, тем больше прирост производительности (рис. 1).

Рис. 1. Следствия закона Амдала

Сегодня только небольшая часть программного обеспечения может выполняться на многоядерных процессорах, что подтверждают результаты тестов синтетических и предназначенных для конкретных классов приложений (см., например, www. 3dnews. ru/cpu/dualcore-cpu/index03. htm). Реальный рост производительности дают лишь программы, оптимизированные под много поточность, такие как Adobe Premiere Pro 1.5 и 3DMax. Очень важны разработка и внедрение драйверов устройств, поддерживающих многопоточность. При переходе с одноядерных процессоров на многоядерные приходится принимать во внимание проблему последовательного выполнения.

2.1 Особенности перехода к параллельным вычислениям

В ней выполнение считается последовательным, если в какой-то момент одно или более ядер не могут выполнять код одновременно с другими ядрами. Такая ситуация может возникнуть по разным причинам: блокировка при доступе к ресурсам, необходимость синхронизации процессов или потоков на ядрах, поддержка когерентности кэш-памяти, неравномерность загрузки.

Блокировки возникают из-за невозможности (например, в момент «сбора мусора») одновременного доступа приложений на разных ядрах к жесткому диску, к устройствам ввода/вывода или данным приложений. Очень часто параллельные процессы, выполняемые на разных ядрах, нужно синхронизировать в определенные моменты. Например, приложение на одном из ядер должно использовать промежуточные данные, которые получает приложение (поток, процесс) на другом ядре. Первое приложение не может продолжить работу до получения этих данных, то есть находится в состоянии ожидания. В такой ситуации неизбежны накладные расходы на синхронизацию приложений (процессов, потоков), выполняемых на разных ядрах. В свою очередь, это обусловливает снижение эффективности параллельной работы, что находит отражение в сетевом законе Амдала. Возникает необходимость в поддержке когерентности (согласованности) кэш-памяти для всех ядер при использовании разделяемой памяти.

Можно упомянуть об исследованиях Intel, посвященных динамическому регулированию интенсивности выполнения инструкций (energy per instruction, EPI) в зависимости от степени параллелизма реализации программного обеспечения [2]. Специалисты корпорации опытным путем показали эффективность регулирования тактовой частоты асимметричной многопроцессорной системы в зависимости от активности вычислительных ядер. Для обеспечения многопоточности используются различные инструменты.

2.2 Инструментальные средства многоядерных систем

Для обеспечения многопоточности используют следующие инструменты: компиляторы, аппаратные отладчики, программные отладчики, поддержка многопоточности на уровне ОС.

Компиляторы

Чтобы получить максимальную выгоду от использования многоядерной архитектуры требуется поддержка на уровне компилятора. Так, в 2005 году Intel выпустила версию 9.0 компилятора языков C++ и Фортран для платформ Linux и Windows. Этот компилятор позволяет эффективно использовать возможности технологии Hyper-Threading и многоядерных процессоров. Он поддерживает возможность автопараллелизма, то есть автоматического обнаружения в приложениях возможности создания множества параллельных потоков с поддержкой спецификации OpenMP 2.5.

Благодаря поддержке стандарта OpenMP компилятор Microsoft Visual C++ 2005 обеспечивает параллельную многопоточную обработку. Для этого требуется либо указать параметр компилятора «/openmp», либо установить в конфигурации флаг «OpenMP Support». С ноября 2005 года компилятор gcc для языков Cи, C++ и Фортран 95 поддерживает OpenMP с помощью опции «-fopenmp». Следует упомянуть и набор компиляторов EKOPath компании PathScale, предназначенных для 64-разрядных систем на базе Linux (AMD64 и EM64T).

Программные отладчики

Программисты хорошо знают, как трудно отлаживать многопоточные приложения. При аварийном завершении программы зачастую требуется проанализировать стек вызовов функций во всех потоках, но обычный отладчик показывает только стек потока, на котором произошло аварийное завершение программы. Например, стандартные средства gdb плохо приспособлены для отладки многопоточных приложений, поэтому предлагаются специальные версии этого отладчика для конкретных операционных систем: в их ядра включаются дополнительные возможности отладки многопоточных приложений.

Одна из таких реализаций отладчик компании Etnus TotalView, предназначенный для платформ Linux, Unix и LynxOS. Он поддерживает многопоточность, MPI, OpenMP, языки программирования Cи/C++ и Фортран, а также смешанные коды с использованием разных языков программирования. Полезным средством оптимизации и отладки параллельных программ является пакет Intel Threading Tools. Он обеспечивает диагностику ошибок и анализ производительности многопоточных приложений, использующих модели потоков Win32 и OpenMP. Отладчик позволяет обнаруживать взаимные блокировки (deadlock) и гонки (race condition) между потоками, локализовать проблемы на уровне исходного кода, анализировать эффективность способов повышения производительности OpenMP-программ.

Аппаратные отладчики

Для работы с виртуальными машинами аппаратный отладчик должен поддерживать ряд специальных функций (в частности, определять, к какой виртуальной машине относятся те или иные процессы и нити). Их обеспечивает, например, TRACE32 компании Lauterbach. Благодаря полной поддержке встроенных аппаратных блоков управления памятью можно одновременно отлаживать процессы на нескольких виртуальных машинах и даже два варианта одного процесса на разных виртуальных машинах. В частности, Lauterbach объявила о выпуске программного инструментария интегрированной поддержки ядра (kernel awareness) для операционной системы LynxOS-178. Чтобы получить доступ ко всем функциями TRACE32, не нужно изменять прикладные программы или ядро (применять заплаты, перехватчики, инструментальные «довески» и др.). Отлаживается именно то приложение, которое будет действовать в конечном продукте, что очень важно для его сертификации.

Среди других аппаратных отладчиков, поддерживающих работу с многоядерными конфигурациями, назовем Green Hills Probe и SuperTrace компании Green Hills, WindPower ICE компании Wind River, RealView ICE от ARM.

При разработке параллельных программ используются специализированные библиотеки и системы параллельного программирования PVM, LAM, CHMP и др. Три основных подхода к реализации этих систем различаются методами взаимодействия параллельных задач. Первый подход базируется на концепции обмена сообщениями, второй — на использовании разделяемой памяти, третий опирается на стандарт POSIX и объединяет эти два подхода.

Наиболее известным представителем первой группы является спецификация MPI (Message Passing Interface) для языков Cи и Фортран, первый вариант которой появился в 1994 году. MPI обеспечивает примерно 200 функций, охватывает множество компиляторов и операционных систем. Среди наиболее распространенных ее реализаций библиотека MPICH. Кроме того, предлагаются несколько коммерческих реализаций MPI, например MPI/Pro компании Verari Systems Software. MPI/Pro оптимизирует время работы параллельных приложений и поддерживает их масштабируемость за счет балансировки параметров производительности и использования ресурсов. Verari предлагает версии MPI/Pro для разных операционных систем, в том числе Windows, Linux, Mac OS X, LynxOS, и таких коммуникационных сред, как Gigabit Ethernet, Myrinet и InfiniBand.

Ко второй группе относится спецификация OpenMP (Open specifications for Multi-Processing). Ее первая версия (www. openmp. org), которая была выпущена в 1997 году, предназначалась для языка Фортран. К появлению OpenMP «приложили руку» компании IBM, Intel, Sun Microsystems и Hewlett-Packard. В 1998 году были созданы варианты OpenMP для языков Cи/C++, а последней является версия 2.5. Поддержка спецификации OpenMP обеспечена во всех компиляторах Intel начиная с шестой версии, в Microsoft Cи/C++ начиная с Visual Studio 2005, а также в GCC.

OpenMP — это набор специальных директив компилятору (pragma), библиотечных функций и переменных среды. Наиболее оригинальны директивы компилятору, которые используются для обозначения областей в коде и могут выполняться параллельно. Компилятор, поддерживающий OpenMP, преобразует исходный код и вставляет соответствующие вызовы функций для параллельного выполнения этих областей кода.

В третью группу входит спецификация POSIX (Portable Operating System interface for unIX), первое описание которой было опубликовано в 1986 году (www. pasc. org). Основная спецификация разработана как IEEE 1003.1 и одобрена как международный стандарт ISO/IEC 9945−1: 1990. С точки зрения организации параллельных вычислений наибольший интерес представляют три части стандарта 1003. 1a (OS Definition), 1003. 1b (Realtime Extensions) и 1003. 1c (Threads). В рамках POSIX можно реализовать параллельные вычисления на основе обмена сообщениями (аналогично MPI) или разделяемой памяти (как в OpenMP). Естественно, в POSIX допустима и любая комбинация этих методов. В наибольшей степени стандарту POSIX соответствуют (и соответствующим образом сертифицированы) операционные системы реального времени LynxOS и Integrity.

Поддержка на уровне ОС

Многоядерные процессоры потребуют от операционных систем поддержки разных архитектур многопроцессорной обработки. Компания QNX Software Systems объявила о выпуске комплекта разработчика QNX Momentics Multi-Core Edition. Этот набор инструментов предназначен для создания программного обеспечения и его миграции на многоядерные аппаратные решения нового поколения, в том числе процессоры BCM12xx и BCM14xx компании Broadcom, процессор MPC8641D компании Freescale и многоядерные процессоры Intel. Будут поддерживаться несколько моделей многопроцессорности для многоядерных архитектур: асимметричная AMP (обеспечение полного управления и отказоустойчивости); симметричная SMP (максимальные параллелизм и масштабируемость); «исключительная» BMP (поддержка миграции кода и снижение сложности разработки).

Поддержку многоядерных систем на базе процессоров AMD64, Sun UltraSPARC T1 и Intel обеспечивает ОС Solaris 10. Например, встроенная система виртуализации и защиты информации Solaris Containers позволяет системному администратору организовывать в рамках единой операционной системы несколько виртуальных системных разделов «зон». Каждой зоне допустимо назначить свой контейнер -набор локализованных системных ресурсов. Контейнеры могут служить основой для управления ресурсами на уровне ядер. Реализованные в Solaris 10 функции так называемого «прогнозируемого самовосстановления» (Predictive Self-Healing) обеспечивают автоматическое определение сбоев в работе ядер и их перевод в пассивный режим без влияния на работу остальных ядер процессора. Поддержка многоядерных систем реализована в некоторых дистрибутивах ОС Linux, например Red Hat Enterprise Linux 4.

Появление многоядерных процессоров даст мощный дополнительный толчок массовому внедрению технологий виртуализации. Назовем некоторые из известных подходов[5]. ARINC-653 (Avionics Application Software Standard Interface). Стандартный интерфейс, разработанный компанией ARINC в 1997 году, вводит концепцию изолированных разделов на основе универсального программного интерфейса APEX (Application/Executive) между операционной системой и прикладным программным обеспечением[5]. Требования интерфейса определены так, чтобы разрешить приложениям контролировать диспетчеризацию, связь и состояние внутренних обрабатываемых элементов.

В 2003 году принята новая редакция ARINC-653, в которой введена концепция изолированных виртуальных машин (разделов, рис. 2). Ее особенностью является жесткое и заранее определенное квантование времени между виртуальными машинами, а целью -обеспечение гарантий того, что не возникнут общие отказы системы. Стандарт ARINC-653 реализован для операционных систем реального времени LynxOS-178, VxWorks, Integrity, CsLeos и др.

Рис. 2. Реализация ARINC-653 в LynxOS-178

UML ОС Linux в пользовательском режиме -самый универсальный эмулятор, позволяющий создавать виртуальное оборудование, которого может и не быть на физическом компьютере. Это весьма удобно для тестирования конфигураций аппаратного обеспечения. UML состоит из набора заплат к ядру Linux, которые позволяют запускать другие операционные системы в консольных окнах, и каждый пользователь может независимо загружать сколько угодно операционных и оконных систем, вплоть до X11. User-Mode Linux допускается применять для устройств с архитектурой IA-32 и PowerPC G5.

Программные среды виртуальных машин. Наиболее популярными из них являются Microsoft Virtual PC и группа программных продуктов VMware. Система виртуальных машин позволяет запускать на компьютере сразу несколько разных операционных систем и переключаться с одной на другую без перезапуска компьютера. На компьютере, работающем под управлением основной (базовой) операционной системы, создаются один или несколько виртуальных компьютеров, на каждом из которых можно запустить «гостевую» ОС.

VMWare Workstation позволяет запустить несколько экземпляров Windows, Linux и NetWare. Реализованы полноценная поддержка сети, переносимость окружений и гибкий подход к работе с окружением. Проект Virtual PC изначально разрабатывала компания Connectix, но в начале 2003 года его купила корпорация Microsoft. К сожалению, после этого Virtual PC лишился поддержки «гостевых» Unix-подобных систем (в том числе, Linux) и был полностью ориентирован на установку Windows-cистем на других платформах.

Технология виртуализации Intel. VT, компонент многоядерной технологии поддержки виртуализации на аппаратном уровне [3], обеспечивает поддержку виртуальных машин на уровне процессора с помощью нового режима VMX (Virtual Machine Extensions) и десяти команд vmptrld, vmptrst, vmclear, vmread, vmwrite, vmcall, vmlauch, vmresume, vmxoff и vmxon. При этом повышаются как надежность и производительность работы приложений, так и уровень общей безопасности.

Архитектура VT поддерживает два класса ПО: монитор виртуальной машины VMM и «гостевое» программное обеспечение. Используются два режима работы root operation и non-root operation. Как правило, VMM работает в первом режиме, а «гостевые» программы во втором. Поддержку технологии виртуализации Intel намерены организовать такие производители операционных систем, как RedHat, SuSe и MontaVista. Она будет обеспечена и в других программных средствах виртуализации, например в Vmware. Появление многоядерных процессоров вызвало опасения, что пользователям придется платить гораздо больше (пропорционально числу ядер) за лицензии на программное обеспечение. В частности, до недавнего времени такую позицию занимала корпорация Oracle. Недавно произошли позитивные изменения: стоимость лицензий на продукты Oracle для многоядерных процессоров AMD и Intel начали рассчитывать путем умножения числа ядер на коэффициент 0,5, для микропроцессоров UltraSPARC T1 на 0,25, а для многоядерных процессоров других производителей (в том числе, IBM) на 0,75. При лицензировании своих программных продуктов IBM считает двухъядерные процессоры AMD и Intel одним процессором, но продолжает рассматривать каждое ядро процессоров POWER как отдельный процессор. Понимая сложность задач массового перехода на многоядерные решения, основные поставщики аппаратных и программных средств организовали ассоциацию Multicore. Ее цель — создание промышленных стандартов для многоядерных систем. Сейчас Multicore работает над четырьмя самостоятельными, но взаимосвязанными стандартами: Resource Management (RAPI), Communication API (CAPI), Debug API и Transparent interprocess communication (TIPC). В рабочих встречах принимают участие представители компаний Xilinx, Express Logic, Wind River, Freescale, ARC, MIPS Technologies, Synopsys и PolyCore Software.

Несомненно, распространение многоядерных процессоров будет зависеть от реализации соответствующего программного обеспечения. Если она окажется эффективной, существенно вырастет инсталляционная база многоядерных систем.

Раздел 3. Перспективы развития многоядерных архитектур процессоров

В корпорации Intel уже говорят не о «Мультиядерности» (Multi-Core) процессоров, как это делается в отношении 2-, 4-, 8-, 16- или даже 32-ядерных решений, а о «Многоядерности» (Many-Core), говоря о размещении сотнях ядер на одном киристале.

Структура такого Many-Core-чипа подразумевает работу с тем же набором инструкций, но с помощью мощного центрального ядра или нескольких мощных CPU, «окруженных» множеством вспомогательных ядер, что поможет более эффективно обрабатывать сложные мультимедийные приложения в многопоточном режиме. Кроме ядер «общего назначения», процессоры Intel будут обладать также специализированными ядрами для выполнения различных классов задач — таких, как графика, алгоритмы распознавания речи, обработка коммуникационных протоколов.

Именно такую архитектуру представил Джастин Раттнер (Justin R. Rattner), руководитель сектора Corporate Technology Group Intel, на пресс-конференции в Токио. По его словам, таких вспомогательных ядер в новом многоядерном процессоре может насчитываться несколько дюжин. В отличие от ориентации на большие, энергоемкие вычислительные ядра с большой теплоотдачей, многоядерные кристаллы Intel будут активизировать только те ядра, которые необходимы для выполнения текущей задачи, тогда как остальные ядра будут отключены. Это позволит кристаллу потреблять ровно столько электроэнергии, сколько нужно в данный момент времени. В июле 2008 г. Корпорация Intel сообщила, что рассматривает возможность интеграции в один процессор нескольких десятков и даже тысяч вычислительных ядер. Ведущий инженер компании Энвар Галум (Anwar Ghuloum) написал в своем блоге: «В конечном счете, я рекомендую воспользоваться следующим моим советом… разработчики уже сейчас должны начать думать о десятках, сотнях и тысячах ядер». По его словам, в настоящий момент Intel изучает технологии, которые смогли бы масштабировать вычисления «на то количество ядер, которые мы пока не продаем».

По мнению Галума, в конечном счете успех многоядерных систем будет зависеть от разработчиков, которым, вероятно, придется изменить языки программирования и переписать все существующие библиотеки.

Преимущества многоядерности (или параллелизма) описаны в статье «Платформа 2015: развитие процессоров и платформ Intel® в ближайшие 10 лет». Авторы статьи сообщают, что Intel в течение нескольких следующих лет планирует выпустить процессоры, которые будут содержать множество ядер — в некоторых случаях сотни. По словам специалистов, архитектура с поддержкой многопроцессорной обработки на уровне кристалла (CMP — Chip-level multiprocessing — многопроцессорная обработка на уровне кристалла) является будущим микропроцессоров, так как «позволяет достичь высокой производительности и в то же время обеспечить эффективное управление питанием и эффективный режим охлаждения».

Заключение

В этой курсовой работе рассмотрено архитектуру многоядерных вычислительных комплексов, их преимущества и недостатки и особенности их проектирования.

Но для эффективного использования многоядерных систем необходимо распараллеливать процессы, а значить на рынке должны присутствовать приложения поддерживающие многопоточность. Для достижения высокой производительности очень важно, что бы в многопоточность поддерживалась, а уровне операционной системы. Я рассмотрел особенности отладки средств поддерживающих многопоточность.

Также при проектировании многоядерных вычислительных комплексов важно помнить, что многоядерные процессоры выделяют много тепла и нуждаются в более мощном охоложденни.

Одной из проблем является лицензирование продуктов из-за цены, но на сегодняшний день это уже не вызывает столько опасений.

Еще одной рассмотренной проблемой является переход с одноядерных систем на многоядерные, вследствие чего появилась ассоциация Multicore.

Подводя итоги, хочу подчеркнуть, что многоядерные архитектуры плотно вошли в нашу жизнь и в дальнейшем будут развиваться.

Список литературы:

1. Флорес А., Организация вычислительных машин, пер. с англ., М., 1972; Каган Б. М., Каневский М. М., Цифровые вычислительные машины и системы, 2-е изд., М., 1973;

2. Справочник по цифровой вычислительной технике, под ред. Б. Н. Малиновского, К., 1974.

3. Григорьев В. Л. «Микропроцессор i80486». — М.: БИНОМ, 2003 277 с.

4. Статья Сергея Золотарева, Алексей Рыбакова: «Програмное обеспечение многоядерных систем»

5. Басманов А. С. «МП и ОЭВМ». — М.: «Мир», 2002 321с.

6. Статья А. В. Калачёв «Многоядерные процессоры» (Интернет университет информационных технологий www. intuit. ru)

www.

ПоказатьСвернуть
Заполнить форму текущей работой