Термінова допомога студентам
Дипломи, курсові, реферати, контрольні...

Аналіз розвитку суперЕОМ

РефератДопомога в написанніДізнатися вартістьмоєї роботи

Асоціативної пам’яті на допомогу пошуку готові до роботі пар операндов і систем. Архітектурних рішень містить резерв підвищення продуктивності сталася на кілька. Архітектури та схемотехники обчислювальних машин, високочастотних інтегральних. Векторного устрою (VU), блоку пам’яті та внутрішнього облаштування поєднання. Для. Однієї архітектурі, що впливає на конфігурації архітектур і… Читати ще >

Аналіз розвитку суперЕОМ (реферат, курсова, диплом, контрольна)

СРАВНИТЕЛЬНЫЙ АНАЛІЗ І ОЦІНКА СОСТОЯНИЯ РІВНЯ, ТЕНДЕНЦІЙ І ПЕРСПЕКТИВ РОЗВИТКУ.

СУПЕРЭВМ.

Нині перехід до нових поколінням обчислювальних коштів набуває.

як ніколи актуальними. Це з потребами розв’язання складних завдань великих.

розмірностей. Безперервне зростання характеристик нових зразків озброєнь вимагає.

розробки і створення принципово нових обчислювальних коштів на підтримки.

їхньої ефективної функціонування. У зв’язку з цим, дедалі більше зростають.

вимоги до продуктивності й надійності обчислювальних коштів на рішення.

військово-прикладних завдань. Однопроцессорные обчислювальні системи не.

виходить із рішенням більшості військово-прикладних завдань у часі,.

для підвищення продуктивності обчислювальних систем військового.

призначення дедалі більше використовуються многопроцессорные обчислювальні системи (МВС).

Найбільший внесок у розвиток обчислювальних коштів завжди вносили.

технологічні рішення, у своїй основної характеристикою покоління.

обчислювальних систем була елементна база, оскільки перехід нові.

елементну базу добре корелюється з новими рівнем показників.

продуктивності й надійності обчислювальних систем. Бурхливий розвиток.

технології СБИС, розробка нових і нових поколінь мікропроцесорів.

кілька призупинило пошуки принципово нових архітектурних рішень. У той.

водночас стає зрозуміло, що суто технологічні рішення втратили своє.

монопольне становище. Приміром, в найближчій перспективі помітно зростає.

значення проблеми подолання розриву між апаратними коштами Німеччини та методами.

програмування. Ця проблема вирішується суто архітектурними засобами, при.

цьому роль технології є непрямої: високий рівень інтеграції створює.

умови для реалізації нових архітектурних рішень. У цьому стала очевидною,.

що кардинальної перебудови архітектурних принципів підтримувати.

інтенсивні темпи розвитку засобів обчислювальної техніки вже невозможно.

По самим оптимістичним прогнозам тактовые частоти сучасних американських і перспективних.

СБИС може бути збільшено найближчому майбутньому до 5 ГГц. У той самий час,.

досягнутий рівень інтеграції дозволяє будувати паралельні системи, у яких.

число процесорів може становити десятків тисяч. У сфері підвищення.

продуктивності обчислювальних систем резерв технологічні рішення.

обмежується одним порядком. Освоєння ж масового паралелізму і нових.

архітектурних рішень містить резерв підвищення продуктивності сталася на кілька.

порядков.

Основними вимогами, що висуваються до многопроцессорным системам з масовим.

паралелізмом, є: необхідність високої продуктивності нічого для будь-якого.

алгоритму; узгодження продуктивності пам’яті з продуктивністю.

обчислювальної частини; здатність мікропроцесорів узгоджено працювати у.

непередбачуваних затримках даних від будь-якої джерела і, нарешті,.

машинно-независимое программирование.

Збільшення ступеня паралелізму викликає збільшити кількість логічних схем, що.

супроводжується збільшенням фізичних розмірів, у результаті зростають.

затримки сигналів на межсоединениях. Цей чинник наводить або до їх зниження.

тактовою частоти, або до створення додаткових логічних щаблів й у.

результаті, до втрати продуктивності. Зростання числа логічних схем також.

призводить до зростання споживаної енергії і відведеного тепла. З іншого боку, слід.

підкреслити, що як високочастотні логічні схеми за інших рівних.

умовах споживають велику потужність однією вентиль. Через війну виникає.

теплофизический бар'єр, обумовлений двома чинниками: високої удільної.

щільністю теплового потоку, що потребує застосування складних коштів відводу.

тепла, і високої загальної потужністю системи, що зумовлює необхідність.

використання складної системи енергозабезпечення і спеціальних помещений.

Іншим чинником, впливає на архітектуру високопродуктивних обчислювальних.

систем, є взаємозалежність архітектури та алгоритмів завдань. Цей чинник.

часто призводить до необхідність створення проблемно-орієнтованих систем, при.

цьому можна досягти максимальна продуктивність для даного класу.

завдань. Зазначена взаємозалежність є стимулом на допомогу пошуку алгоритмів,.

найкраще відповідних можливим формам паралелізму лише на рівні.

апаратури. Оскільки для написання програм використовуються мови високого рівня,.

необхідні певні кошти автоматизації процесів розпаралелювання і.

оптимізації программ.

Класифікація паралельних обчислювальних систем, запропонована Т. Джоном,.

полягає в поділі МВС за двома критеріями: способу побудови пам’яті (загальна.

чи розподілена) і способу передачі. Основні типи машин по.

класифікації Т. Джона представлені у таблиці 1. Тут прийнято такі.

позначення: pелементарний процесор, M — елемент пам’яті, Kкомутатор, З ;

кэш-память.

Паралельна обчислювальна система із загальною пам’яттю і шинної організацією обміну.

(машина 1) дозволяє кожному процесору системи «бачити », як вирі-шується завдання в.

цілому, Не тільки ті частини, з яких він працює. Загальна шина, що з.

пам’яттю, виникають серйозні проблеми задля забезпечення високої пропускної.

здібності каналів обміну. Однією з способів обійти цю ситуацію є.

використання кеш-пам'яті (машина 2). І тут виникають проблеми.

когерентності вмісту кеш-пам'яті і основний. Іншим засобом підвищення.

продуктивності систем є відмови від центральної пам’яті (машина 3).

Таблиця 1 — Класифікація МВС за типами пам’яті і передачі сообщенийТипы.

передачиТипы памяти.

СообщенийОбщая памятьОбщая і распределеннаяРаспределенная память.

Шинні соединения1.

2.

3.

Фіксовані перехресні соединения4.

5.

6.

Комутаційні структуры7.

8.

9.

Ідеальною машиною є обчислювальна система, що має кожен процесор

має прямі канали зв’язки з іншими процесорами, але нинішнього разі потрібно.

надзвичайно великий обсяг устаткування організації межпроцессорных обмінів.

Певний компроміс представляє мережу з фіксованою топологією, у якій.

кожен процесор з'єднаний із деяким підмножиною процесорів системи. Якщо.

процесорам, які мають безпосереднього каналу обміну, необхідно.

взаємодіяти, вони передають повідомлення через проміжні процесори. Одне.

з переваг такий підхід — не обмежується зростання кількості процесорів в.

системі. Недолік — потрібно оптимізація прикладних програм, щоб.

забезпечити виконання паралельних процесів, котрим необхідно активне.

вплив на сусідні процессоры.

Найцікавіший варіантом для перспективних паралельних обчислювальних.

комплексів є поєднання гідності архітектур з розподіленої пам’яттю і.

каналами межпроцессорного обміну. Одна з імовірних методів побудови таких.

комбінованих архітектур — конфігурація з комутацією, коли процесор має.

локальну пам’ять, а з'єднуються процесори між собою з допомогою комутатори.

(машина 9). Комутатор може дуже корисним для групи процесорів з.

распределяемой пам’яттю (машина 8). Ця конфігурація справляє враження машину із загальною.

пам’яттю (машина 7), але тут виключені проблеми пропускну здатність шини.

Недоліками класифікації Т. Джона є приховання рівня паралелізму в.

системі.

Паралелізм будь-якими вимагає одночасної роботи, по крайнього заходу, двох.

пристроїв. Такими пристроями може бути: арифметико-логические устрою.

(АЛУ), устрою управління (УУ). У ЕОМ класичної архітектури УУ і АЛУ.

утворюють процесор. Збільшення числа процесорів чи числа АЛУ у кожному їх.

призводить до відповідному зростанню паралелізму. Наявність у ЕОМ кількох.

процесорів означає, що водночас (паралельно) можуть виконуватися кілька.

програм чи кілька фрагментів однієї програми. Робота кількох АЛУ під.

управлінням одного УУ означає, що багато даних може оброблятися.

паралельно за однією програмі. Відповідно до цим опис структур

паралельних систем можна як упорядкованим трійки:

.

де k — кількість пристроїв управління, тобто. найбільше незалежно і.

одночасно виконуваних програм, у системе;

d — кількість АЛУ, що припадають одне пристрій управління;

w — кількість розрядів, вміст яких обробляється одночасно.

(паралельно) одним арифметико-логическим устройством.

Інша форма розпаралелювання — конвейеризация, також вимагає наявності.

кількох ЦП чи АЛУ. Тоді, як безліч даних обробляється однією.

устрої, інше безліч даних може оброблятися ось на чому устрої.

тощо., причому у процесі обробки виникає потік даних від однієї.

устрою (ЦП чи АЛУ) ось до чого. Протягом усього процесу над одним.

безліччю даних виконується одне одним n дій. Водночас у.

конвеєрі різних стадіях обробки можуть бути від 1 до n данных.

Паралелізм і конвейеризацию так можна трактувати на різних рівнях,.

поданих у таблиці 2. Шість основних форм паралелізму, у сенсі.

цього терміну, дозволяють побудувати схему класифікації, у межах яких можна.

описати розмаїтість високопродуктивних обчислювальних систем відбити їх.

эволюцию.

Таблиця 2 — Класифікація МВС на кшталт распараллеливания.

Рівень параллелизмаПараллелизмКонвейеризация.

ПрограммыМультипроцессор

Макроконвейер

КомандыМатричный процессор

Конвеєр команд.

ДанныеМножество разрядов.

Арифметичний конвейер

У векторних суперЕОМ забезпечена гранична продуктивність для процесів.

скалярной і векторної обробки, яка є переважно завдань.

Завдання, містять високий рівень внутрішнього паралелізму, може бути добре.

адаптовані до систем масового паралелізму. Реальні завдання й, тим паче,.

пакети завдань містять низку алгоритмів, які мають різні рівні.

параллелизма.

Усе це свідчить, що замість спроб пристосувати всі типи алгоритмів до.

однієї архітектурі, що впливає на конфігурації архітектур і супроводжується не.

завжди коректними порівняннями пікової продуктивності, продуктивнішим.

є взаимодополнение архітектур у єдиній системі. Серед перших прикладів.

такої системи є об'єднання векторної системи Cray Y-XM і системи Cray.

T3D. Проте, воно з допомогою високошвидкісного каналу призводить до.

необхідності розбивки завдань на великі блоки і до втрат часу й пам’яті на.

обмін информацией.

Ситуація у тому випадку подібна тієї, яка була до появи.

векторних машин. Аби вирішити завдань, що містять велику кількість операцій над.

векторами і матрицями, використовувалися звані матричні процесори,.

наприклад, фірми FSP, які підключалися до універсальної машині з допомогою.

каналу ввода/вывода. Інтеграція скалярной і векторної обробки одному.

процесорі поруч із забезпеченням високу швидкість роботи синхронного конвеєра.

забезпечила успіх векторних машин.

Наступним логічним кроком є скалярной, векторної і.

паралельної обробки. Завдяки цьому, можна досягти висока реальна.

продуктивність з допомогою розподілу окремих частин програми з.

підсистемам з різноманітною архітектурою. Природно, цей розподіл роботи.

має бути підтримане аппаратно-программными засобами автоматизації.

програмування. Ці цифри повинні містити можливість інтерактивного.

втручання програміста на етапі аналізу завдання й можливість моделювання.

чи пробного запуску програми з виміром параметрів ефективності. Слід.

підкреслити, що форми паралелізму в алгоритми досить різноманітні,.

тому й їх апаратне відбиток не завжди однаковий. До простим можна.

віднести системи з однією потоком команд і множинними потоками даних, системи.

з множинними потоками команд і передачею даних, систолические системы.

Однією з багатообіцяючих підходів, які забезпечують автоматичне.

розпаралелювання, є принцип потоку даних, у якому.

послідовність чи одночасність обчислень визначається не командами, а.

готовністю операндов і наявністю вільного функціонального арифметичного.

устрою. Проте, й у разі ступінь реального розпаралелювання залежить.

від внутрішнього паралелізму алгоритму і, вочевидь, потрібні ефективні засоби.

підготовки завдань. З іншого боку, для реалізації таких систем необхідно створення.

асоціативної пам’яті на допомогу пошуку готові до роботі пар операндов і систем.

розподілу обчислень із великої кількості функціональних пристроїв.

Апаратна реалізація паралельних підсистем залежить від вибраних.

мікропроцесорів, БІС пам’яті та інших компонентів. Нині по.

економічних причин доцільно використовувати найбільш.

високопродуктивні мікропроцесори, розроблені для унипроцессорных машин.

Разом про те, існують підходи, пов’язані із застосуванням спеціалізованих.

мікропроцесорів, орієнтованих використання у паралельних системах.

Типовим прикладом є серія транспьютеров фірми Inmos. Проте, через.

обмеженого ринку цієї серії продуктивністю різко відставала.

універсальних мікропроцесорів, як-от Alpha, Power PC, Pentium.

Спеціалізовані мікропроцесори зможе бути конкурентоспроможними лише за.

умови скорочення витрат проектування й освоєння у виробництві, що у.

великою мірою залежить від продуктивності інструментальних обчислювальних.

коштів, які у системах автоматизованого проектирования.

У різних обчислювальних машинах використовувалися різні підходи,.

створені задля досягнення, насамперед, одній з наступних цілей:

— максимальна арифметична продуктивність процессора;

— ефективності роботи операційної системи й зручність спілкування із нею для.

программиста;

— ефективність трансляції з мов високого рівня життя та виняток написання.

програм на автокоде;

— ефективність розпаралелювання алгоритмів для паралельних архитектур.

Проте, у будь-якій машині необхідна за тій чи іншій формі розв’язувати всі зазначені.

завдання. Зазначимо, спочатку цього намагалися досягти з допомогою однієї чи.

кількох однакових процессоров.

Диференціація функцій і спеціалізація окремих підсистем почала розвиватися з.

появи окремих підсистем і процесорів обслуговування ввода/вывода,.

комунікаційних мереж, зовнішньої пам’яті і т.п.

У суперЕОМ крім основного процесора (машини) включалися зовнішні машини. У.

різних системах можна спостерігати елементи спеціалізації у пріоритетних напрямках.

автономного виконання функцій ОС, системи програмування і.

підготовки заданий.

По-перше, ці допоміжні функції можуть виконуватися паралельно з основними.

обчисленнями. По-друге, для реалізації зайві чимало тих коштів,.

що забезпечують високу продуктивність основного процесора, наприклад,.

можливість операцій з плаваючою коми і векторних операцій. У.

подальшому, при інтеграції скалярной, векторної і паралельної обробки.

межах єдиної обчислювальної підсистеми склад цих допоміжних функцій.

має бути доповнений функціями аналізу програм з метою забезпечення необхідного.

рівня паралелізму і розподілу окремих частин програми з різним.

гілкам обчислювальної подсистемы.

Поява суперЕОМ супроводжувалося підвищенням загальній потужності споживання (вище.

100 кВт) та збільшенням щільності теплових потоків різних рівнях.

конструкції. Їх створення над останню стало можливим, завдяки.

використанню ефективних рідинних і фреоновых систем охолодження. Чи є.

значна потужність істотним ознакою суперЕОМ? Відповідь це питання.

залежить від цього, що в поняття суперЭВМ.

Якщо брати, що суперЕОМ чи, точніше, суперсистема — це система з найвищої.

можливої продуктивністю, то енергетичний чинник залишається однією з.

визначальних цю продуктивність. З розвитком технології потужність одного.

вентиля в мікропроцесорах зменшується, але за підвищенні продуктивності.

процесора з допомогою паралелізму загальна потужність часом зростає. При.

об'єднанні значної частини мікропроцесорів у системі з масовим паралелізмом.

інтегральна міць і тепловиділення стають сумірними з.

показниками для векторно-конвейерных систем. Проте, іноді у рекламних цілях.

паралельні системи з гаком числом процесорів порівнюються з.

суперкомпьютерами попереднього чи більше раннього поколінь, щоб показати їх.

переваги себто простоти і зручності експлуатації. Природно, з такої.

некоректного порівняння не можна дійти невтішного висновку про створення.

сучасних суперсистем.

Основним стимулом створення суперсистем є потреби рішення великих.

завдань. Натомість, дослідження і розробки по суперсистемам стимулюють.

ціле пасмо фундаментальних і прикладних досліджень, результати яких.

використовують у подальшому за іншими областях. Насамперед, це ж стосується.

архітектури та схемотехники обчислювальних машин, високочастотних інтегральних.

схем і коштів межсоединений, ефективних систем відводу тепла. Так само важливі.

результати методами розпаралелювання і під час окремих операцій та.

ділянок програм на апаратній рівні, методам побудови паралельних.

алгоритмів, мов і культур програмних систем для розв’язання великих задач.

У розвитку обчислювальних коштів можна назвати три основні проблемы:

— підвищення производительности;

— підвищення надежности;

— покриття семантичного разрыва.

Етапи розвитку обчислювальних коштів прийнято розрізняти по поколінням машин.

Характеристика покоління визначається конкретними показниками, що відбивають.

досягнутий рівень у рішенні трьох перелічених проблем. Оскільки пригнічує.

внесок у розвиток обчислювальних коштів завжди належав технологічним.

рішенням, основної характеристикою покоління машин вважалася елементна.

база. І це дійсно, перехід нові елементну базу добре корелюється з.

новим рівнем показників продуктивності, надійності та скорочення.

семантичного разрыва.

Нині актуальне перехід до нових поколінням обчислювальних.

коштів. За традицією вирішальна роль відводиться технології виробництва.

елементної бази. У той самий час стає зрозуміло, що технологічні рішення.

втратили монопольне становище. Приміром, в найближчій перспективі помітно.

зростає значення проблеми покриття семантичного розриву, що впливає в.

необхідність створення высокосложных програмних продуктів і вимагає.

кардинального зниження трудоемкотси програмування. Проблема вирішується.

переважно архітектурними засобами. Роль технології тут то, можливо.

лише непрямої: високий рівень інтеграції створює умови для реалізації.

архітектурних решений.

Нині однією з доминируюших напрямів розвитку суперЕОМ є.

обчислювальні системи з MIMD-параллелизмом з урахуванням матриці мікропроцесорів.

До сформування подібних обчислювальних систем, які з сотень і тисяч.

пов’язаних процесорів, знадобилося подолати ряд складних проблем як і.

програмне забезпечення (мови Parallel Pascal, Modula-2, Ada), і у.

апаратних засобах (ефективна комутаційна середовище, високошвидкісні.

кошти обміну, потужні мікропроцесори). Елементна база сучасних.

выcокопроизводительных систем характеризується выcокой ступенем інтеграції (до.

3,5 млн. транзисторів на кристалі) і високими тактовими частотами (до 600 МГц).

Нині все фірми і всі університети США, Західної Європи — й Японії,.

розробляють суперЕОМ, ведуть інтенсивні дослідження у сфері.

багатопроцесорних суперЕОМ з масовим паралелізмом, створюють безліч їх типів,.

організують їх виробництво і прискорено освоюють світовий ринок у цій.

області. Многопроцессорные ЕОМ з масовим паралелізмом вже нині істотно.

випереджають продуктивністю традиційні суперЕОМ з векторно-конвейерной.

архітектурою. Системи з масовим паралелізмом пред’являють менші вимоги до.

микропроцессорам і елементної базі і мають значно меншу вартість при.

рівні продуктивності, ніж векторно-конвейерные суперЕОМ. Вже.

поточному десятилітті продуктивність суперЕОМ з масовим паралелізмом.

досягне колосальної величини — десятків тисяч мільярдів операцій на секунду з.

плаваючою коми над 64-разрядными числами (десятків Тфлопс).

На щорічної конференції у Чепел-Хилл (Сев.Каролина) подано проекту фірми.

IBM, метою якого є створення гиперкубического паралельного процесора в.

одному корпусі. Конструкція, названа Execube, має 8 16-разрядных.

микропроцесоров, вмонтованих у кристал 4Мбит динамічного ЗУ (ДЗУ). У цьому.

ступінь интеграци становить 5 млн. транзисторів. Мікросхема виготовлено по.

КМОП-технологии із трьома рівнями металізації заводу IBM Microelectronic.

(Ясу, Япония). Execube є спробу підвищення ступеня інтеграції.

процесора з пам’яттю шляхом ефективнішого доступу до інформації ДЗУ. По.

суті, пам’ять перетворюється на розширені регістри процесорів.

Продуктивність мікросхеми становить 50 млн оп/с.

Фірма CRAY Research оголосила початок випуску суперкопьютеров CRAY T3/E.

Основна характеристика, де наголошували розробники ;

масштабованість. Мінімальна конфігурація становить 8 мікропроцесорів,.

максимальна- 2048. У порівняні з попередньої моделлю T3/D співвідношення.

цена/производительность знижена вчетверо і як 60 долл/Мфлопс, чому.

сприяло застосування недорогих процесорів DEC Alpha EVC, виготовлених по.

КМОП-технологии. Ймовірна вартість моделі Т3/Е з урахуванням 16 процесорів з.

1-Гбайт ЗУ становитиме 900 тис. доларів, а ціна найпотужнішої конфігурації (1024.

процесора, ЗУ 64 Гбайт) -39,7 млн. доларів, за пікової продуктивності 600.

Гфлопс.

Однією з способів подальшого підвищення продуктивності обчислювальної.

системи є об'єднання суперкомп’ютерів в кластери з допомогою.

оптоволоконних сполук. Для цього він комп’ютери CRAY T3/E обладнані каналами.

ввода/вывода з пропускною здатністю 128 Гбайт/с. Потенційні замовники.

виявляють підвищений інтерес до нової розробці фірми. Бажання придбати.

комп’ютер виявили такі організації, як Pittsburgh Supercomputer Center, Mobile.

Оіл, Департамент по океанографії і атмосферним дослідженням США. У цьому.

підписано кілька контрактів на виготовлення кількох комп’ютерів.

512-процессорной конфигурации.

Серед японських компаній слід виділити фірму Hitachi, що випустила.

суперкомп’ютер SR2201 з масовим паралелізмом, у якому до 2048 процесоров. У.

основі системи оброблена компанією процесорна архітектура RA-RISC від.

фірми Hewlett-Paccard. Псевдовекторный процесор функціонує під керівництвом.

ОС HP-UX/MPP Mash 3.0. У комп’ютері, ще, використана система підтримки.

паралельного режиму роботи Express, створена корпорацією Parasoft і одержала.

назва ParallelWare. Продуктивність нового комп’ютера становить 600.

Гфлопс. До березня 1999 р. фірма планує продати 30 суперкомпьютеров.

Однією з наймасштабніших проектів у галузях створення обчислювальних коштів.

з масовим паралелізмом є проект фірми Intel для розробки самого.

швидкодіючого комп’ютера з урахуванням мікропроцесорів шостого покоління P6.

Нова система, яку планується встановити Sandia National Laboratories.

складатиметься з 9000 процесорів Pentium P6 плюс пікову продуктивність.

1000 ГФлопс. Замовником системи є міністерство енергетики США. У цьому.

основний областю застосування буде моделювання підземних ядерних.

вибухів, що дозволить витрачати 25 млн. доларів замість 300 млн.

Впродовж останнього десятиліття має місце наступна динаміка зростання дитячих продуктивності.

паралельних обчислювальних систем в США:1987 р. — 50 Мфлопс.

1989 р. — 1 Гфлопс (суперкомпьютеры СМ).

1991 р. — 10 Гфлопс (векторные процесори і процесори серії 528).

1994 р. — 100 Гфлопс (CRAY, PARAGON).

1996;1997 рр. — 200−500 Гфлопс (комбінація векторного процесора і куба потокової.

обработки).

1998;1999 рр. -1000−3000 Гфлопс (ASCI, T3E).

Особливо видатними характеристиками відрізняються суперкомп’ютери у середині 1990;х.

років: — Фірма IBM ALPS (1024 процесора RS6000, продуктивність 50 Гфлопс);

— Intel Paragon XPS (1872 процесора, продуктивність 72,9 Гфлопс);

— Thinking Mashines CM5 (512 процесорів Super Spark, продуктивність 83.

Гфлопс);

— NCube 2SM80 (8192 процесора, продуктивність 84Гфлопс);

— Numerical Wind Tunnel (140 процесорів, продуктивність 124 Гфлопс на.

тестах LINPACK);

— Intel Paragon XPS Supercomputer (4000 процесорів 1860XP, продуктивність.

300 Гфлопс).

— Сray Research MPP System (2048 процесорів Alpha, продуктивність — 300.

Гфлопс).

— Thinking Mashines CM5 (16 384 процесора Super Spark, продуктивність 1000.

Гфлопс).

Стислі харатеристики найпоширеніших сучасних суперкомп’ютерів.

наведено ниже.

IBM RS/6000 SP2.

ВиробникInternational Business Machines (IBM), відділення RS/6000.

Клас архітектури: Масштабируемая массивно-параллельная обчислювальна система.

(MPP).

Вузли мають архітектуру робочих станцій RS/6000. Є кілька типів.

" SP-узлов ", що комплектуються різними процесорами: PowerPC 604e/332MHz,.

P2SC/160MHz, POWER3/MHz (попередні системи комплектувалися процесорами.

POWER2/66 і 77MHz). Можлива установка вузлів з SMP-архитекутурой — до запланованих 4.

процесоров PowerPC. Обсяг пам’яті для POWER3-узлов — до 4GB, для PowerPC-узлов ;

до 3GB.

Доступні конфігурації SP від 2 до 128 вузлів (і по 512 на замовлення).

Вузли встановлюються в «стійки «(до 16 вузлів у кожному). Одна SP-система може.

утримувати вузли різних типів.

Вузли пов’язані між собою високопродуктивних комутатором (IBM.

high-performance switch), який має многостадийную структуру і зі.

комутацією пакетів.

Cистемное ПО: OC AIX (встановлюється кожному вузлі). LoadLeveler — система.

підтримки пакетної обробки. Паралельні докладання виконуються під.

управлінням Parallel Operating Environment (POE).

Кошти програмування: поставляється оптимизированная реалізація інтерфейсу.

MPI (раніше — MPL).

HP 9000 (Exemplar).

Виробник: Hewlett-Packard, High-performance systems division.

Класс:многопроцессорные серверу із загальною пам’яттю (SMP).

Нині доступні кілька «класів «систем сімейства HP 9000: серверу.

початкового рівня (D, K-class), середній рівень (N-class) і найпотужніші.

системи (V-class).

Процесорам: 64-битные процесори з архітектурою PA-RISC 2.0 (PA-8200, PA-8500).

Кількість процесорів: N-class — до 8 процесорів. V-class — до 32 процесорів. У.

подальшому очікується збільшити кількість процесорів до 64, та був до 128.

Можливо об'єднання до 16 SMP-гиперузлов V-class чи K-class в кластер «HP.

Enterprise Parallel Server ". Для зв’язку вузлів використовується комутатор HP.

HyperFabric.

Системне ПО: встановлюється операційна система HP-UX (сумісна лише на рівні.

двоичного коду з ОС SPP-UX комп’ютерів Convex SPP).

Кошти програмування: HP MPI — реалізація MPI 1.2, оптимизированная до.

архітектурі Exemplar. Распараллеливающие компілятори Fortran/C, математична.

бібліотека HP MLIB. CXperf — засіб аналізу продуктивності програм.

Cray T3E.

Виробник: Silicon Graphics.

Клас архітектури: масштабируемая массивно-параллельная система, складається з.

процессорных елементів (PE).

Нині є дві модифікації: T3E-900 і T3E-1200.

Процесорний елемент PE складається з процесора, блоку пам’яті та внутрішнього облаштування.

поєднання з мережею. Використовуються процесори Alpha 21 164 (EV5) з тактовою.

частотою 450 MHz (T3E-900) і 600 MHz (T3E-1000), пікова продуктивність.

яких складає 900 і 1200 MFLOP/sec відповідно. Процесорний елемент.

володіє своєю локальної пам’яттю (DRAM) обсягом від 256MB до 2GB.

Системи T3E масштабируются до 2048 PE.

Процессорные елементи пов’язані високопродуктивної мережею з топологією.

тривимірного тору і двунаправленными каналами. Швидкість обмінів через мережу сягає.

480MB/sec у кожному напрямі.

Використовується операційна система UNICOS/mk.

Підтримується явне паралельне програмування з допомогою пакета Message.

Passing Toolkit (MPT) — реалізації інтерфейсів передачі повідомлень MPI, MPI-2 і.

PVM, бібліотека Shmem. Для Фортран-программ можливо також неявний.

розпаралелювання в моделях CRAFT і HPF. Середовище розробки входять також набір

візуальних коштів на аналізу та налагодження паралельних програм.

Cray T90.

Виробники: Silicon Graphics, Cray Research.

Клас архітектури: многопроцессорная векторна система (кілька векторних.

процесорів працюють на спільної па-м'яті).

Моделі Серія T90 включає моделі T94, T916 і T932.

Процесор Системи серії T90 базуються на векторно-конвейерном процесорі Cray.

Research з пікової продуктивністю 2GFlop/s.

Кількість процесорів Система T932 може охоплювати до 32 векторних процесорів (до.

4-х в моделі T94, до 16 моделі T916), забезпечуючи пікову продуктивність.

більш 60GFlop/s.

Можливо об'єднання кількох T90 в MPP-системы.

Система T932 містить від 1GB до 8GB (до 1 GB в моделі T94 і по 4GB в моделі.

T916) оперативної пам’яті і відданість забезпечує швидкість обмінів з пам’яттю до 800MB/sec.

Використовується операційна система UNICOS.

Cray SV1.

Виробник: Silicon Graphics.

Клас архітектури: масштабируемый векторний суперкомп’ютер.

Використовуються 8-конвейерные векторні процесори MSP (Multi-Streaming Processor).

з пікової продуктивністю 4.8 GFLOP/sec; кожен MSP то, можливо подразделен.

на виборах 4 стандартних 2-конвейерных процесора з пікової продуктивністю 1.2.

GFLOP/sec. Тактова частота процесорів — 250MHz.

Процесорам об'єднують у SMP-узлы, кожен із яких може містити 6 MSP і побачили 8-го.

стандартних процесорів. Система (кластер) може містити до 32 таких вузлів.

SMP-узел може містити від 2 до 16GB пам’яті. Система може містити до 1TB.

пам’яті. Уся пам’ять глобально адресуема (архітектура DSM).

Використовується операційна система UNICOS.

Поставляється векторизующий і распараллеливающий компілятор CF90. Підтримується.

також явне паралельне програмування з допомогою інтерфейсів MPI,.

OpenMP чи Shmem.

Cray Origin2000.

Виробник Silicon Graphics.

Клас архітектури: модульну систему із загальною пам’яттю (cc-NUMA).

Використано 64-разрядные RISC-процессоры MIPS R10000, R12000/300MHz.

Основний компонент системи — модуль Origin, до складу якого від 2 до 8 процесорів.

MIPS R10000 і по 16GB оперативної пам’яті. Поставляються системи Origin2000,.

містять до 256 процесорів (тобто. до 512 модулів). Уся пам’ять системи (до.

256GB) глобально адресуема, апаратно підтримується когерентність кэшей. Модулі.

системи з'єднані з допомогою мережі CrayLink, побудованої на маршрутизаторах.

MetaRouter.

Використовується операційна система SGI IRIX. Поставляється распараллеливающий.

компілятор Cray Fortran 90. Підтримується стандарт OpenMP.

Onyx2 InfiniteReality2.

Виробник Silicon Graphics.

Клас архітектури: многопроцессорная система візуалізації; по апаратної.

архітектурі дуже справляє враження Origin2000.

Система може охоплювати до 128 процесорів MIPS R10000.

Графічні можливості системи забезпечують спеціальні устрою трьох типів:

геометричні (векторні) процесори, растрові процесори, генератори.

аналогових сигналів. Система то, можливо обладнана 16 незалежними каналами.

графічного виведення (visualization pipelines). На апаратній рівні.

підтримується графічний інтерфейс OpenGL.

Використовується операційна система SGI IRIX.

Sun HPC 10 000 (StarFire).

Виробник Sun Microsystems, серія Sun HPC.

Клас архітектур: многопроцессорный SMP-сервер.

Процесор UltraSPARC II/336MHz.

Система StarFire об'єднує від 16 до 64 процесорів.

Система включає від 2GB до 64GB пам’яті.

Системне ПО: ОС Solaris, ПО розподілу ресурсів Load Sharing Facility (LSF).

Поставляється пакет підтримки паралельних додатків Sun HPC 2.0, до складу якого.

такі величезні кошти як HPF, MPI, PVM, PFS (паралельна файлова система), Prism.

(візуальна середовище розробки), S3L (бібліотека математичних підпрограм), і.

ін.

NEC SX-5.

Виробник NEC, серія SX.

Клас архітектури: паралельний векторний суперкомп’ютер (PVP).

Кожен вузол системи є векторно-конвейерным SMP-суперкомпьютером,.

що об'єднує до 16 індивідуальних векторних процесорів (кожен із пікової.

векторної продуктивністю 8 Gflop/s і скалярной продуктивністю 500.

MFlop/s).

Обсяг пам’яті кожного вузла — до 128GB, продуктивність обмінів з пам’яттю.

сягає 1TB/sec. Система може охоплювати до 32 вузлів, забезпечуючи сукупну.

пікову продуктивність до запланованих 4 TFlop/s.

Для зв’язку вузлів використовується високошвидкісної комутатор (IXS Internode Crossbar.

Switch).

Використовується операційна система SUPER-UX.

Поставляються компілятор мови HPF, реалізація інтерфейсу MPI, компілятори.

Fortran77/SX і Fortran90/SX з автоматичним розпаралелюванням і векторизацией,.

і навіть інтегрована середовище розробки та оптимізації PSUITE.

Fujitsu VPP.

Виробник Fujitsu.

Клас архітектури паралельний векторний суперкомп’ютер (PVP).

Модифікації VPP300, VPP700, VPP5000.

Кожен процесорний елемент (PE) системи VPP700E полягає скалярного устрою.

(SU), векторного устрою (VU), блоку пам’яті та внутрішнього облаштування поєднання. Для.

VPP700: VU складається з 7 конвеєрів і відданість забезпечує пікову продуктивність до.

2.4 GFLOP/sec. Обсяг пам’яті - до 2GB. Для VPP5000: VU складається з 4-х конвеєрів,.

пікова продуктивність — 9.6 GFLOP/sec. Обсяг пам’яті - до 16GB.

Для VPP700: cистема може охоплювати від 8 до 256 PE, сумарна пікова.

продуктивність до 14.4 GFLOP/sec Для VPP5000: до 512 PE, сумарна пікова.

продуктивність до 4.9 TFLOP/sec.

Процессорные елементи пов’язані комутатором (crossbar network), який.

виробляти двосторонні обміни, не перериваючи обчислень. Пропускна здатність.

каналів комутатори: для VPP700 — 615MB/sec, для VPP5000 — 1.6GB/sec.

Використовується операційна система UXP/V, джерело якої в UNIX System VR4.

Серед коштів розробки поставляються: распараллеливающий і векторизующий.

компілятор Fortran90/VPP, оптимизированная для VPP бібліотека математичних.

підпрограм SSLII/VPP, бібліотеки передачі сообшений MPI-2 і PVM 3.3.

AlphaServer.

Виробник Compaq, Digital.

Високопродуктивну SMP-сервер, AlphaServer Array — кластерна система.

Процесорам GS140 і GS60 — Alpha 21 264, 8400 і 8200 — Alpha 21 164.

Кількість процесорів GS140 і 8400 — до 14, GS60 і 8200 — до 6.

Обсяг пам’яті GS140 — до 28GB.

Кластери AlphaServer Array можуть об'єднувати до 8 вузлів AlphaServer, тобто. у спільній.

складності до 112 процесорів. Можуть комбінуватися вузли різних типів. Вузли.

зв’язуються між собою комутатором MEMORY CHANNEL, що забезпечує.

швидкість обмінів до 66MB/sec і латентність порядку 3 мкс.

На платформі AlphaServer підтримуються операційні системи Tru64 UNIX (це.

ім'я Digital UNIX), OpenVMS і Windows NT. Поставляється ПО кластеризації.

TruCluster Software.

Використовуються комунікаційні бібліотеки TruCluster MEMORY CHANNEL Software і.

MPI. Підтримується розпаралелювання у стандарті OpenMP.

Особливо видатними характеристиками відрізняються суперкомп’ютери наприкінці 1990;х років.

предстиавлены в таблиці 3.

Таблиця 3 — найбільш швидкодіючі.

суперекомпьютеры№ИзготовительСуперкомпьютерСтранаГод созданияЧисло.

процессоровПиковая производи-тельность, ГфлопсРеальная производи-тельность.

на пакеті LINPAK, Гфлопс.

1 Intel ASCI Red USA 1 999 947 231 542 121.3.

2 SGI ASCI Blue Mountain USA1998614430721608.

3SGIT3E1200USA199810841300.8891.5.

4HitachiSR8000/128Japan19991281024873.6.

5SGIT3E900USA199713241191.6815.1.

6SGIORIGIN2000USA199920481024690.9.

7SGIT3E900UK1997876788.4552.92.

8 IBM SP Silver USA 199 819 521 296 547.

9 SGI T3E900 USA 1 999 812 730.8515.1.

10SGIT3E1200UK1998612734509.9.

11IBMASCI Blue Pacific CTR SP SilverUSA 19 981 344 892 468.2.

12HitachiSR8000/64Japan199964512449.7.

Показати весь текст
Заповнити форму поточною роботою