Мікроархітектура Nehalem

Тип работы:
Курсовая
Предмет:
Программирование


Узнать стоимость

Детальная информация о работе

Выдержка из работы

ВСТУП

В сучасному світі спостерігається тенденція розвитку високих технологій. Людина починає перекладати «непотрібну роботу» на сучасну техніку: на комп’ютер, на побутові прилади тощо. Комп’ютери в наш час для людини є і помічником в роботі, і відпочинком, і засобом масової інформації. Мабуть, найголовнішою частиною комп’ютеру, його «серцем», є процесор. Компанія Intel налічує більш як сто різних моделей процесорів. Першим з них був i4004, перший процесор, реалізований на одному кристалі з частотою 740 кГц та техпроцесом 10 мкм. Сучасні ж процесори мають частоти до 3,8 ГГц та 32 нм техпроцес.

Політика компанії Intel у відношенні до настільних процесорів полягає в щорічному поновленні продуктової лінійки. Це здійснюється двома способами — переходом на новий технологічний процес та зміною архітектури. І перше, і друге — доволі затратні операції, тому щороку Intel вибирає щось одне. Зокрема, в 2007 році компанія перейшла на 45-нм технологічний процес та представила нові продукти на ядрах Yorkfield и Wolfdale. В 2008 році підійшла черга зміни архітектури і Intel представила свою останню розробку — Nehalem.

Перед нами чергова революційна платформа, яка может підняти планку продуктивності на ще більший рівень. Nehalem — нова мікроархітектура для процесорів Bloomfield у виконанні LGA 1366, а також для процесорів Lynnfield у виконанні LGA 1156. Мікропроцесори продаються під торговою маркою Core i7 і Core i5 відповідно.

Процесори на ядрі Bloomfield відрізняються влаштованим контролером пам’яті. Перші настольні процесори з влаштованим контролером пам’яті представила компанія AMD, і цей крок привів да значного росту продуктивності. Тому можна чекати подібного эфекту і від найновішої розробки Intel. Втім, влаштований контролер пам’яті - це головна, та не єдина інновація Intel. Архітектура процесору набула кардинально нової модульної структури, яка характеризується новим обчислювальним ядром, новою процессорною шиною, вбудованим триканальным контролером пам’яті DDR3, можливістю інтеграції графічного ядра, новою технологиєю багатопоточності Hyper-Threading та додатковим контролером PCU, який відповідає за управління напругою та частотою кожного з ядер.

Intel Core i7 має 7 моделей з чотирма ядрами та один з шістьма. Назва Core i7 визначає покоління процесору (Core 2 Duo/Quad/Extreme були шостого покоління) та продовжує використовувати успішну серію брендов: Core 2 і Core.

1 ЗАГАЛЬНИЙ РОЗДІЛ

1.1 Складові частини мікропроцесорної системи на базі Intel Core i7

Процесори Intel Core i7 — остання розробка Intel. На даний момент — це найкращі у світі процесори, які поступають у продаж. На базі цих процесорів будують як настільні ПК, так і ноутбуки. Для цих процесорів використовується новий чіпсет — Intel X58.

Рисунок 1.1 — Логотипи платформи Intel Core™ i7

1.1.1 Процесори

Нова лінійка процесорів Core i7, випущена за 45-нанометровим процесом яка отримала назви Lynnfield та Bloomfield (рисунок 1. 2). У порівнянні з попередниками ці процесори стали менше споживати енергії і менше виділяти тепла, що дуже критично для створення ноутбуків та портативних ПК.

Усі моделі підтримують: MMX, SSE, SSE2, SSE3, SSSE3, SSE4. 1, SSE4. 2, Enhanced Intel SpeedStep Technology, Intel 64, XD bit (an NX bit implementation), TXT, Intel VT-x, Intel VT-d, Hyper-Threading, Turbo Boost, Smart Cache

Рисунок 1.2 — Процессор серії Intel Core i7

Ці процесори мають наступні характеристики:

1) FSB замінена на QuickPath. Це означає, що материнська плата має використовувати чіпсет, що підтримує QuickPath. По стану на квітень 2010 тільки один чіпсет підтримує цю шину — Intel X58.

2) Контролер пам’яті знаходиться в самому процесорі, а не в окремому чіпсеті. Таким чином, процесор має прямий доступ до пам’яті. Частина де знаходиться контролер називається позаядерною, тому контролер функціонує на відмінній від ядер тактовій частоті.

3) Як наслідок розміщення контролера пам’яті, Core i7 підтримує лише DDR3.

4) Контролер пам’яті підтримує до 3-х каналів пам’яті, і в кожному може бути один або два блоки пам’яті DDR3 DIMM. Тому материнські плати для Core i7 підтримують до 6 планок пам’яті, а не 4, як Core 2.

5) Intel Core™ i7 має:

— 32 КБ L1 кешу для інструкцій і 32 КБ L1 кешу для даних на кожне ядро;

— 256 КБ L2 кешу (комбіновано для інструкцій і даних) на кожне ядро;

— 8 МБ L3 кешу (комбіновано для інструкцій і даних) на всі ядра.

6) Core i7 є однокристальним: всі чотири ядра, контролер пам’яті, і всі кеші знаходяться на одному кристалі.

7) «Turbo Boost» технологія, що дозволяє всім активним ядрам інтелектуально збільшувати свою частоту кроками по 133 MHz понад базову частоту допоки процесор не перевищив норм по тепловиділенню і енергоспоживанню.

8) Ядра Core i7 можуть використовувати Hyper-threading, коли за один раз іноді виконуються інструкції двох різних ниток виконання. Ця можливість була представлена в архітектурі NetBurst (Pentium 4), але від неї відмовились в Core.

9) Core i7 не призначений для багатопроцесорних материнських плат, тому присутній лише один інтерфейс QuickPath.

Процесори Intel Core™ i7 підтримують наступні набори інструкцій: MMX, SSE, SSE2, SSE3, SSSE3, SSE4. 1, SSE4. 2, Enhanced Intel SpeedStep Technology (EIST), Intel 64, XD bit (an NX bit implementation), TXT, Intel VT-x, Intel VT-d, Hyper-Threading, Turbo Boost, Smart Cache. Характеристики процесорів зведені у таблиці 1. 1−1.3.

Таблиця 1.1 — Процесори сімейства Lynnfield (45 нм, мікроархітектура Nehalem)

Модель процесора

Кількість Ядер (потоків)

Тактова частота, ГГц

Сокет

TDP, Вт

Core i7−860

4 (8)

2,800 ГГц

LGA1156

95 Вт

Core i7−860S

4 (8)

2,533 ГГц

LGA1156

82 Вт

Core i7−870

4 (8)

2,933 ГГц

LGA1156

95 Вт

Core i7−875K

4 (8)

2,933 ГГц

LGA1156

95 Вт

Core i7−880

4 (8)

3,076 ГГц

LGA1156

95 Вт

Процесори сімейства Lynnfield мають 774 млн. транзисторів, площа чіпа 296 мм2.

Таблиця 1.2 — Процесори сімейства Bloomfield (45 нм, мікроархітектура Nehalem)

Модель процесора

Кількість Ядер (потоків)

Тактова частота, ГГц

Сокет

TDP, Вт

Інтерфейс QPI, ГТ/с

Core i7−920

4 (8)

2,667 ГГц

LGA1366

130 Вт

4,8

Core i7−930

4 (8)

2,800 ГГц

LGA1366

130 Вт

4,8

Core i7−940

4 (8)

2,933 ГГц

LGA1366

130 Вт

4,8

Core i7−950

4 (8)

3,067 ГГц

LGA1366

130 Вт

4,8

Core i7−960

4 (8)

3,200 ГГц

LGA1366

130 Вт

4,8

Core i7−965 Extreme Edition

4 (8)

3,200 ГГц

LGA1366

130 Вт

6,4

Core i7−975 Extreme Edition

4 (8)

3,333 ГГц

LGA1366

130 Вт

6,4

Процесори сімейства Bloomfield мають 731 млн. транзисторів, площа чіпа 263 м2.

Таблиця 1.3 — Шестиядерний процесор сімейства Gulftown (32 нм, мікроархітектура Westmere)

Модель процесора

Кількість

Ядер (потоків)

Тактова

частота, ГГц

Сокет

TDP, Вт

Інтерфейс QPI, ГТ/с

Core i7−980X Extreme Edition

6 (12)

3,333 ГГц

LGA1366

130 Вт

6,4

Процесор сімейства Core i7−980X Extreme Edition має 1170 млн. транзисторів та площу чіпа 248 мм2. Навідміну від попередників, цей процесор також підтримує Intel® Advanced Encryption Standard Instructions Set (AES-IS).

1.1.2 Чіпсет

На даний момент, існує усього один чіпсет, який підтримує серію процесорів — Intel X58.

Цей чіпсет має наступні характеристики:

— 2 графічних інтерфейсу PCI Express 2.0×16, з можливістю розбити кожний на два графічних інтерфейсу з половинною швидкістю або навіть на чотири з четвертної швидкістю;

— додатковий інтерфейс PCI Express 2.0×4, з можливістю розбити його на два інтерфейси з половинною швидкістю;

— шина DMI (із пропускною здатністю ~ 2 ГБ / с) до південного моста ICH10/R.

Північний міст чіпсета X58 називається IOH (Input / Output Hub), а не як у минулих моделях X48, X38, P45 — MCH (Memory Controller Hub). Відносно процесорної підтримки чіпсет має порт QPI, і будь-які процесори, що використовують цю шину (ядро Bloomfield), в платах на базі Intel X58 запрацюють. Правда, максимальна пропускна спроможність порту QPI може відрізнятися: 4,8 або 6,4 GT / s (мільярдів пересилань в секунду), що відповідає 9,6 або 12,8 ГБ / с у кожному з двох напрямків одночасно.

Різниця в пропускної здатності визначається типом використаного процесора (більше — для Core i7 Extreme Edition), причому більша пропускна здатність забезпечується не за рахунок підвищеної базової частоти (як це було в Quad-Pumped Bus FSB), а за рахунок збільшення множника відносно базової BCLK (133 МГц). Графічний інтерфейс X58 забезпечує в такій конфігурації: 2 незалежних порту PCI Express 2. 0×16. Але точно такими ж можливостями володіли X38 і X48, а також старші чіпсети NVIDIA — але, під Nehalem це перший чіпсет з такими характеристиками.

Причому для Bloomfield це не тільки перший, але й, швидше за все, єдиний чіпсет взагалі: Intel молодші продукти в лінійці 5x випустить тільки для підтримки Havendale і Lynnfield. NVIDIA також відмовилася від ідеї розробляти чіпсет під Bloomfield (незважаючи на наявність ліцензії на шину QPI, так що технічно в змозі це зробити), але планує випустити нову лінійку під молодші процесори мікроархітектури Nehalem. Важливим наслідком цієї відмови NVIDIA стала новина: вперше чіпсет сторонньої компанії отримав ліцензію на підтримку SLI. Також Intel X58 є чіпсетом з офіційною одночасною підтримкою SLI і CrossFireX. По суті, північний міст чіпсета X58 — це один великий контролер PCI Express 2.0 для підключення зовнішньої графіки. Ще він займається арбітражем даних від / для периферійних контролерів південного мосту, а також має зайві 4 лінії PCI Express 2.0 для підключення периферії.

Рисунок 1.3 — Блок-схема чіпсета Intel X58

Тепловиділення X58 зменшилося в порівнянні з попередніми топовими чіпсетами Intel, за рахунок видалення контролера пам’яті, але в цілому не сильно (враховуючи QPI).

Таблиця 1.4 — Характеристики та переваги чіпсета Intel X58 над попередниками.

Чіпсет (північний міст)

X58 IOH

X48 MCH

X38 MCH

P45 MCH

Процесорна шина, пропускна здатність

QPI, 25,6 ГБ / с

FSB, 12,8 ГБ / с

FSB, 10,7 ГБ / с

FSB, 10,7 ГБ / с

Контролер пам’яті, максимальний режим

Не має контроллеру

2 Ч DDR3 -1600

2 Ч DDR3 -1333

2 Ч DDR3 -1333

Контролер PCI Express 2. 0

2 Ч PCIEx16 + PCIEx4

2 Ч PCIEx16

2 Ч PCIEx16

PCIEx16

Тепловиділення максимальне розрахункове (TDP), Вт

24,1

30,5

26,5

22

Тепловиділення в простої (Idle), Вт

8,5

15,1

12,3

9

1.2 Ноутбук HP Pavilion dv7 на базі мобільної платформи Intel Core i7

Для того, щоб мати уявлення про мобільні ПК на базі платформи Intel Core i7, я складу опис ноутбука HP Pavilion dv7.

Рисунок 1. 4- Апаратне забезпечення ноутбука HP Pavilion dv7

Ноутбук має досить вражаючі характеристики, як для мобільного пристрою, та здатен стати повноцінною заміною настільному ПК. Апаратне забезпечення ноутбуку відображено на рисунку 1.4.

Технічні характеристики ноутбука описані нижче в таблиці 1. 5

Таблиця 1.5 — Технічні характеристики ноутбука HP Pavilion dv7

Процесор

Чотириядерний Intel Core i7−720QM (1.6 ГГц)

Чіпсет

Intel HM55

Відео

NVIDIA GeForce GT 230M (1 Гб відеопам'яті)

Оперативна пам’ять

4 Гб DDR3 2400

Дисплей

17.3 HD+ (1600×900) LED

Жорсткий диск

500 Гб

Оптичний привід

SATA: LightScribe SuperMulti DVD±RW з підтримкою двухслойного запису

Мережева карта

10/100/1000 Gigabit Ethernet LAN

Інтерфейси (рисунок 1. 15)

1 x ExpressCard, 4 порти USB 2. 0, 1 x HDMI, 1 x VGA, 1 x IEEE1394, 1 x RJ45 (LAN), 2 виходи на навушники, мікрофонний вхід, кард-рідер 5-в-1

Бездротовий зв’язок

802. 11 b/g; Бездротове підключення за допомогою Bluetooth

Батарея

Літієво-іонна батарея, 8 комірок

Додатково

Веб-камера HP Pavilion із вбудованим цифровим мікрофоном; VGA для слабого освітлення

Розміри

412.6×277×35 — 43.2 мм

Маса, кг

3,52

Рисунок 1. 5- Ноутбук HP Pavilion dv7

Рисунок 1. 6- 2 Гбайта пам’яті DDR3−1333

Рисунок 1.6 -Інтерфейси ноутбука HP Pavilion dv7

Тест монітору показує гарну передачу кольору, контрастність і яскравість, спотворення відсутні. Параметр часу відгуку знаходяться в межах, допустимих для екрану ноутбука — стабільні 16,5 мс. Результати тесту швидкості читання і запису жорсткого диска досить високі.

HP Pavilion dv7 припаде до душі тим, кому потрібна продуктивність в будь-якому місці перебування, а так само рекомендується як заміна настільного ПК.

2 СПЕЦІАЛЬНИЙ РОЗДІЛ

2.1 Архітектура Nehalem

Корпорація Intel уперше представила мікроархітектуру Nehalem в листопаді 2008 року, реалізувавши її в процесорах Bloomfield на базі 45-нанометровій виробничій технології. В цій архітектурі були використані різні сучасні інновації, що забезпечують рекордне підвищення продуктивності, поліпшення енергозбереження та підвищення швидкодії при роботі в багатозадачному середовищі. У архітектурі Intel Core i7 реалізовані наступні технології:

1) Intel Hyper Threading — забезпечує виконання двох операцій одночасно для кожного ядра.

2) Intel Wide Dynamic Execution — забезпечує виконання до п’яти мікрооперацій за один такт.

3) Intel Intelligent Power Capability — представляє собою цілий набір технологій, які покликані істотно знизити енергоспоживання.

4) Intel Advanced Smart Cache — передбачає наявність спільної для всіх ядер кеш-пам'яті L2, яка динамічно розподіляється між ними в залежності від виконуваних завдань.

5) Intel Smart Memory Access — комплекс технологій з оптимізації алгоритмів доступу до пам’яті та попереднього завантаження даних.

6) Intel Advanced Digital Media Boost — технологія, спрямована на оптимізацію декодування мультимедійного контенту. Дозволяє обробляти всі 128-розрядні команди SSE, SSE2 і SSE3, широко використовуються в мультимедійних і графічних додатках, за один такт.

7) Intel 64 Technology — 64-бітний (EM64T) режим цілочисельною та адресної арифметики. Він дозволяє працювати з числами великої розрядності, а також адресувати понад 1 Тбайт пам’яті.

2.1.1 Логічна схема процесора

Розібравшись з тим, які технології забезпечують підвищення продуктивності процесорів Intel Core i7, можна переходити до знайомства зі структурною схемою (рисунок 2. 1), на якій відображені логічні особливості обробки даних.

Рисунок 2.1 — Структурна схема мікроархітектури Nehalem

Архітектура Intel Core передбачає симетричний декодер 4−4-4−4, тобто кожен з чотирьох каналів декодера може декодувати інструкції, що породжують до чотирьох мікрооперацій.

Більшість команд при декодуванні розбивається на дві-три мікрооперацій, однак зустрічаються і такі команди, для декодування яких потрібні були б десятки і навіть сотні мікрооперацій. Для цих цілей використовується спеціальна ROM-пам'ять (uCode ROM), в якій зберігаються програми, що складаються з послідовності мікрооперацій, причому кожна така програма відповідає одній декодованому інструкції.

Після процесу декодування команд починається етап їх виконання. Спочатку відбувається перейменування і розподіл додаткових регістрів процесора (Allocate & Rename), які не визначені архітектурою набору команд. Перейменування регістрів дозволяє домогтися їх безконфліктного існування.

На наступному етапі (Retirement Unit (ReOrder Buffer)) відбувається переупорядкування мікрооперацій не в порядку їх надходження (out of order) з тим, щоб згодом можна було реалізувати їх паралельне виконання на виконавчих блоках.

Далі відбувається планування та розподіл мікрооперацій за виконавчими блокам. Планувальник (Scheduler) формує черги мікрооперацій, в результаті чого мікрооперацій потрапляють на один з п’яти портів функціональних пристроїв (dispatch ports). Цей процес називається диспетчеризацією (Dispatch), а самі порти виконують функцію шлюзу до функціональних пристроїв.

Після того як мікрооперацій пройдуть порти диспетчеризації, вони завантажуються в блок регістрів для подальшого виконання.

В архітектурі Intel Core є три порти ALU для операцій з плаваючою комою (Float Point) (FMUL / FPMove, FADD / FPMove, Branch / FPMove), а також по одному порту для запису (Store) і вивантаження (Load) даних з пам’яті.

Крім арифметико-логічних та адресних функціональних пристроїв, в кожному процесорі є також пристрої завантаження і вивантаження (Store / Load), які здійснюють доступ до кешам даних і до оперативної пам’яті. Ці пристрої працюють асинхронно з іншими, і їх звичайно не зображують на блок-схемах.

Логічно дані пристрої зв’язані з пристроями обчислення адрес читання / запису (AGU). Пристрої завантаження і вивантаження конвеєризовані і можуть одночасно обслуговувати велику кількість запитів. Вони також здійснюють попередню вибірку з оперативної пам’яті (копіювання в кеші тих даних, використання яких очікується найближчим часом).

Процес безпосереднього виконання мікрооперацій у виконавчих пристроях відбувається на подальших ступенях конвеєра. Ефективна довжина конвеєра в архітектурі Intel Core становить 14 ступенів.

Нова технологія Turbo Boost дозволяє розподіляти продуктивність ПК в залежності від загрузки, та збільшувати тактову частоту процесору на 267 МГц від номінальної. Технологія автоматично збільшує тактову частоту процесора понад номінальною, якщо при цьому не перевищуються обмеження потужності, температури і струму в складі розрахункової потужності (TDP). Це призводить до збільшення продуктивності

Однопотокові і багатопоточних додатків. Фактично це технологія «саморазгона» процесора.

Доступність технології Turbo Boost не залежить від кількості активних ядер, проте залежить від наявності одного або кількох ядер, що працюють з потужністю нижче розрахункової. Час роботи системи в режимі Turbo Boost залежить від робочого навантаження, умов експлуатації та конструкції платформи.

2.2 Технологія Hyper Threading

Ця технологія раніше використовувалась в Intel Pentium 4, але від неї відмовились в Core. Для того щоб розібратися, як працює нова технологія, нам потрібні деякі початкові знання. А саме, нам потрібно знати, що таке потік, як виконуються ці потоки, чому працює програма, як процесор дізнається, які операції і над якими даними він повинен здійснювати?

Вся ця інформація міститься в скомпільованому коді виконуваної програми. І як тільки програма отримує від користувача будь-яку команду, будь-які дані, — процесору відразу ж вирушають потоки, в результаті чого він і виконує те, що повинен виконати у відповідь на запит користувача. З точки зору процесора, потік — це набір інструкцій, які необхідно виконати. Коли ви відкриваєте документ Microsoft Word, процесору надсилається певний набір інструкцій, які він повинен виконати.

Процесор точно знає, де брати ці інструкції. Для цієї мети призначений рідко згадуваний регістр, званий лічильником команд (Program Counter, PC). Цей регістр вказує на місце в пам’яті, де зберігається наступна для виконання команда. Коли потік відправляється на процесор, адреса пам’яті потоку завантажується в цей лічильник команд, щоб процесор знав, з якого саме місця потрібно почати виконання. Після кожної інструкції значення цього регістра збільшується. Весь цей процес виконується до завершення потоку. Після закінчення виконання потоку, в лічильник команд заноситься адреса наступної інструкції, яку потрібно виконати. Потоки можуть переривати один одного, при цьому процесор запам’ятовує значення лічильника команд в стеку і завантажує в лічильник нове значення. Але обмеження в цьому процесі все одно існує - в кожну одиницю часу можна виконувати лише один потік.

Існує загальновідомий спосіб вирішення даної проблеми. Полягає він у використанні двох процесорів — якщо один процесор в кожний момент часу може виконувати один потік, то два процесори за ту ж одиницю часу можуть виконувати вже два потоки. Відзначимо, що цей спосіб не ідеальний. При ньому виникає безліч інших проблем. По-перше, кілька процесорів завжди дорожче, ніж один. По-друге, керувати двома процесорами теж не просто.

Крім того, не варто забувати про розділення ресурсів між процесорами. Наприклад, до появи чіпсета AMD 760MP, всі x86 платформи з підтримкою багатопроцесорної поділяли всю пропускну здатність системної шини між всіма наявними процесорами. Але основний недолік в іншому — для такої роботи і програми, і сама операційна система повинні підтримує багатопроцесорні.

Здатність розподілити виконання декількох потоків по ресурсах комп’ютера часто називають багатопоточність. При цьому і операційна система повинна підтримувати багатопоточність. Програми також повинні підтримувати багатопоточність, щоб максимально ефективно використовувати ресурси комп’ютера. Зараз ми розглянемо ще один підхід вирішення проблеми багатопоточності, нову технологію Hyper-Threading від Intel.

Про ефективність завжди багато говорять. І не тільки в корпоративному оточенні, в якихось серйозних проектах, але і в повсякденному житті. Кажуть, homo sapiens лише частково задіють можливості свого мозку. Те ж саме відноситься і до процесорів сучасних комп’ютерів. Взяти, приміром, Pentium 4. Процесор має, в загальній складності, сім'ю виконавчими пристроями, два з яких можуть працювати з подвоєною швидкістю — дві операції (мікрооперацій) за такт. Але в будь-якому випадку, ви б не знайшли програми, яка змогла б заповнити інструкціями всі ці пристрої. Звичайні програми обходяться нескладними цілочисловими обчисленнями, та кількома операціями завантаження і зберігання даних, а операції з плаваючою точкою залишаються осторонь. Інші ж програми (наприклад, Maya) головним чином завантажують роботою пристрою для операцій з плаваючою крапкою.

Щоб проілюструвати ситуацію, давайте уявімо собі процесор з трьома виконавчими пристроями: арифметико-логічним (целочисленным — ALU), пристроєм для роботи з плаваючою крапкою (FPU), і пристроєм завантаження зберігання (для запису і читання даних з пам’яті). Крім того, припустимо, що наш процесор може виконувати будь-яку операцію за один такт і може розподіляти операції по всіх трьох пристроїв одночасно. Давайте уявимо, що до цього процесору на виконання відправляється потік з наступних інструкцій:

1) 1 +1

2) 10 + 1

3) Зберегти попередній результат

На рисунку 2.2 показана умовна схема роботи виконуючих частин процесору.

Рисунок 2.2 — Нагруженність виконуючих блоків процесору

Отже, кожен такт використовується тільки 33% всіх виконавчих пристроїв. Цього разу FPU залишається взагалі незадіяним. Відповідно до даних Intel, більшість програм для IA-32×86 використовують не більше 35% виконавчих пристроїв процесору.

Уявімо собі ще один потік, відправимо його на виконання процесору. На цей раз він буде складатися з операцій завантаження даних, складання і збереження даних. Вони будуть виконуватися в наступному порядку (рис. 2. 3).

Рисунок 2.3 — Нагруженність виконуючих блоків процесору

І знову завантаженість виконавчих пристроїв становить лише на 33%.

Хорошим виходом з даної ситуації буде паралелізм на рівні інструкцій (Instruction Level Parallelism — ILP). У цьому випадку одночасно виконуються відразу декількох інструкцій, оскільки процесор здатний заповнювати відразу декілька паралельних виконавчих пристроїв. На жаль, більшість x86 програм не пристосовані до ILP належною мірою. Тому доводиться знаходити інші способи збільшення продуктивності. Так, наприклад, якщо б у системі використовувалося відразу два процесори, то можна було б одночасно виконувати відразу два потоки. Таке рішення називається паралелізмом на рівні потоків (thread-level parallelism, TLP).

Проблема неповного використання виконавчих пристроїв пов’язана з кількома причинами. Взагалі кажучи, якщо процесор не може отримувати дані із бажаною швидкістю (це відбувається в результаті недостатньої пропускної здатності системної шини і шини пам’яті), то виконавчі пристрої будуть використовуватися не так ефективно. Крім того, існує ще одна причина — брак паралелізму на рівні інструкцій у більшості потоків виконуваних команд.

В даний час більшість виробників покращують швидкість роботи процесорів шляхом збільшення тактової частоти і розмірів кеша. Звичайно, таким способом можна збільшити продуктивність, але все ж потенціал процесора не буде повністю задіяний. Якщо б ми могли одночасно виконувати декілька потоків, то ми змогли б використовувати процесор куди більш ефективно. Саме в цьому і полягає суть технології Hyper-Threading.

Hyper-Threading — це назва технології, що існувала і раніше поза x86 світу, технології одночасної багатопоточності (Simultaneous Multi-Threading, SMT). Ідея цієї технології проста. Один фізичний процесор представляється операційній системі як два логічних процесора, і операційна система не бачить різниці між одним SMT процесором або двома звичайними процесорами. В обох випадках операційна система направляє потоки як на двопроцесорних систем. Далі всі питання вирішуються на апаратному рівні.

У процесорі з Hyper-Threading кожен логічний процесор має свій власний набір регістрів (включаючи і окремий лічильник команд), а щоб не ускладнювати технологію, в ній не реалізується одночасне виконання інструкцій вибірки / декодування у двох потоках. Тобто такі інструкції виконуються по черзі. Паралельно ж виконуються лише звичайні команди.

Пам’ятайте ті два потоки з попередніх прикладів? Давайте на цей раз припустимо, що наш процесор оснащений Hyper-Threading. Подивимося, що вийде, якщо ми спробуємо одночасно виконати ці два потоки (рис. 2. 4).

Рисунок 2.4 — Нагруженність виконуючих блоків процесору з технологією Hyper-Threading.

Як і раніше, сині прямокутники вказують на виконання інструкції першого потоку, а зелені - на виконання інструкції другого потоку. Сірі прямокутники показують незадіяні виконавчі пристрої, а червоні - конфлікт, коли на один пристрій прийшло відразу дві різні інструкції з різних потоків.

Отже, що ж ми бачимо? Паралелізм на рівні потоків дав збій — виконавчі пристрої стали використовуватися ще менш ефективно. Замість паралельного виконання потоків, процесор виконує їх повільніше, ніж якщо б він виконував їх без Hyper-Threading. Причина досить проста. Ми намагалися одночасно виконати відразу два дуже схожих потоку. Адже обидва вони складаються з операцій із завантаження / збереження та операцій додавання. Якщо б ми паралельно запускали «цілочисельний» додаток і додаток, що працює з плаваючою точкою, ми б виявилися куди в кращій ситуації. Як бачимо, ефективність Hyper-Threading сильно залежить від виду навантаження на ПК.

На даний момент, більшість користувачів ПК використовують свій комп’ютер приблизно так, як описано в нашому прикладі. Процесор виконує безліч дуже схожих операцій. На жаль, коли справа доходить до однотипних операцій, виникають додаткові складнощі з керуванням. Трапляються ситуації, коли виконавчих пристроїв потрібного типу вже не залишилося, а інструкцій, як на зло, удвічі більше звичайного. У більшості випадків, якщо б процесори домашніх комп’ютерів використовували технологію Hyper-Threading, то продуктивність б від цього не збільшилася, а може бути, навіть знизилася на 0−10%.

На робочих станціях ж можливостей для збільшення продуктивності у Hyper-Threading більше. Але з іншого боку, все залежить від конкретного використання комп’ютера. Робоча станція може означати як high-end комп’ютер для обробки 3D графіки, так і просто сильно навантажений комп’ютер.

Найбільший же приріст в продуктивності від використання Hyper-Threading спостерігається в серверних додатках. Головним чином це пояснюється широким розмаїттям посилаються процесору операцій. Сервер баз даних, що використовують транзакції, може працювати на 20−30% швидше при включеній опції Hyper-Threading. Трохи менший приріст продуктивності спостерігається на веб-серверах і в інших сферах.

Ви думаєте, Intel розробила Hyper-Threading тільки лише для своєї лінійки серверних процесорів? Звичайно ж, ні. Якщо б це було так, вони б не стали даремно витрачати місце на кристалі інших своїх процесорів. Давайте ще раз уявімо собі процесор. Цього разу в ньому буде ще один виконавчий пристрій — другий цілочисельний пристрій. Подивимося, що станеться, якщо потоки будуть виконуватися обома пристроями (рис. 2. 5).

Рисунок 2.5 — Нагруженність виконуючих блоків процесору з технологією Hyper-Threading та двома цілочисленними пристроями.

Використовуючи інструкцію HALT, можна призупинити роботу одного з логічних процесорів, і тим самим збільшити продуктивність додатків, які не виграють від Hyper-Threading. Отже, програма не стане працювати повільніше, замість цього один з логічних процесорів буде зупинений, і система буде працювати на одному логічному процесорі - продуктивність буде такою ж, що й на однопроцесорних комп’ютерах. Потім, коли програма вважатиме, що від Hyper-Threading воно виграє в продуктивності, другий логічний процесор просто відновить свою роботу.

На веб-сайті Intel є презентація, що описує, як саме необхідно програмувати, щоб витягти з Hyper-Threading максимум вигоди.

3 ЕКСПЛУАТАЦІЙНИЙ РОЗДІЛ

3.1 Вибір ноутбука

Остаточний вибір моделі ноутбука можна зробити, тільки в магазині, оскільки такі важливі характеристики, як якість зображення, розмір екрану, габарити ноутбука, рівень видаваного їм шуму, можна визначити лише при вашій безпосередній участі. Важливо звернути увагу на клавіатуру і пристрій управління курсором — чи зручно вам з ними буде працювати, оцінити вагу ноутбука, чи влаштовує він вас. Важкі ноутбуки можуть важити до 4 кг, найлегші - не більше кілограма. Поцікавитися максимальним часом роботи ноутбука від батареї. І, звичайно ж, з’ясувати, для яких завдань створена дана модель і наскільки авторитетний її виробник.

3.1.1 Класифікація ноутбуків

Виробники класифікують свої моделі, виходячи з типових потреб користувачів

Нижче наведено опис існуючих класів ноутбуків:

1) Економ-клас. Ноутбуки цього класу використовуються в навчанні, для роботи в невеликому офісі, а також в домашніх цілях, тобто для задач, при рішенні яких вимоги до ресурсів комп’ютера невисокі (тому ці ноутбуки і найбільш доступні за ціною). Окремі моделі даного класу іноді називають моделями початкового рівня.

2) Бізнес-клас. Ці ноутбуки призначені для вирішення ресурсномістких задач. Моделі, які відносяться до даного класу, можуть відрізнятися вишуканим і представницьким дизайном, надкомпактними розмірами і наявністю додаткових засобів безпеки. Вони обов’язково забезпечені сучасними засобами комунікації (бездротовиими і мережевими інтерфейсами), на відміну від економ-класу, для моделей якого це не є неодмінною умовою.

3) Ноутбуки, які замінюють настільний комп’ютер. Моделі цього класу покликані вирішувати найбільш ресурсномісткі завдання, в такому випадку пріоритет віддається високій продуктивності і максимальній укомплектованості пристроями на шкоду мобільним якостям ноутбука.

Залежно від форми, розміру (довжини діагоналі) і ваги виділяють три основні групи ноутбуків:

1) Класичні ноутбуки. Такі ноутбуки прийнято вважати повнорозмірними. Діагональ екрану класичних ноутбуків становить 14−15 дюймів і більше, причому останнім часом стали модними витягнуті в ширину монітори, з пропорціями кіноекрана. На сьогодняшній день більше всього моделей ноутбуків створюється саме в рамках цієї групи; в ній можна зустріти! представників усіх трьох класів, тобто моделі в середині групи надзвичайно різноманітні за ресурсами. Серед класичних ноутбуків можна виділити полегшені (вагою 1,5−2,5 кг) і тонкі (товщиною 2−3 см), при цьому верхньою планкою цих параметрів є 4 кг і 5 см відповідно. Найбільш автономними моделями в даній групі вважаються такі, які дозволяють пропрацювати 3−5 годин на відсутність мережі електроживлення, в той час як звичайний показник становить 1,5−2,5 години.

2) Субноутбуки. Це понадпортативні комп’ютери, полегшені і надтонкі, з діагоналлю екрана від 9 до 12 дюймів. Дана група ноутбуків нечисленна, в неї входять як досить продуктивні, так і малопотужні моделі, які часто не містять приводу оптичних дисків. Всі субноутбуки підтримують тривалу автономну роботу — протягом 5−9 годин. Їх вага складає приблизно 1,2 кг (максимум — 1,5 кг), а товщина не перевищує 2 см.

3) Планшетні ноутбуки. Мають сенсорний екран, який використовується в якості планшета для введення. Монітор в цих ноутбуках кріпиться таким чином, щоб його легко можна було розгорнути і покласти поверх клавіатури. Деякі моделі взагалі не мають клавіатури — її повністю замінює дисплей. Довжина діагоналі екрану в планшетних ноутбуках зазвичай становить від 9 до 12 дюймів, можна зустріти і великі її значення — до 15 дюймів. Ноутбуки цієї групи також не відрізняються різноманітністю моделей. За продуктивністю вони відносяться до бізнес-класу. За вагою і товщині планшетні моделі, як правило, близькі до субноутбуків. На планшетні ноутбуки встановлюється спеціально розроблена для них операційна система Windows XP Tablet PC Edition.

Розібравшись в описаних вище моделях ноутбуків, можна легко орієнтуватися в їх різноманітті, підбираючи відповідний варіант.

3.2 Модернізація и ремонт ноутбуків

З технічної точки зору багато компонентів ноутбуків мають характеристики, схожі з характеристиками компонентів настільних систем. Проте між ними є безліч розбіжностей. Ноутбуки менш «пристосовані» до модернізації (під модернізацією розуміється заміна окремих компонентів ноутбука на нові, що мають кращі технічні параметри) і ремонту, ніж настільні комп’ютери, оскільки відсутні загальні стандарти на розмір і форму корпусу, системних плат, клавіатур, екранів і навіть акумуляторних батарей. Крім того, функції, які реалізуються в настільних комп’ютерах за допомогою замінних адаптерів розширення (наприклад, відеоадаптерів), в ноутбуках реалізовані на базі вбудованих в системну плату мікросхем. Незважаючи на такі складнощі, в деякому відношенні ноутбуки модернізувати простіше, ніж настільні ПК, так як в них часто застосовуються модульні відсіки пристроїв зберігання, які не вимагають застосування плоских кабелів, монтажних напрямних і окремих роз'ємів живлення. Оперативна пам’ять, жорсткі диски та роз'єми mini-PCI часто доступні через корпусні панелі, що спрощує заміну відповідних пристроїв, так як при цьому не потрібне розбирання всього корпусу ноутбука. Таким чином, додавання пам’яті, заміна жорсткого диска і оптичного накопичувача (у моделях з модульним підключенням) може зайняти лише кілька секунд. Для забезпечення підтримки таких інтерфейсів, як Ethernet, 802. 11a/b/g Wi-Fi, USB 2.0 і IEEE 1394 (FireWire / i. LINK), достатньо підключити необхідний адаптер PC Card. Проблеми при заміні інших компонентів ноутбука пов’язані з тим, що в ноутбуках використовуються менш універсальні компоненти в порівнянні з настільними ПК (не рахуючи адаптерів PC Card, які за визначенням підтримують заміну). Виняток становлять також оперативна пам’ять і жорсткі диски. Купуючи компонент, не призначений для конкретної моделі ноутбука, ви ризикуєте даремно витратити кошти.

У деяких випадках, проблеми сумісності пов’язані з розміром компонентів. Виробники ноутбуків «втискують» в невеликий корпус безліч компонентів, тому іноді новий пристрій просто не поміщається на місці старого. Зокрема, це відноситься до пристроїв, доступ до яких здійснюється поза корпусом комп’ютера, наприклад до накопичувачів на компакт-дисках. Клавіатури та монітори, які нескладно замінити в настільних ПК, настільки тісно інтегровані в корпус ноутбука, що для їх модернізації доведеться використовувати певні компоненти від виробника ноутбука.

В інших випадках можливості модернізації можуть бути значно обмежені властивостями BIOS. Наприклад, в залежності від дати випуску і версії BIOS, іноді обмежений обсяг жорсткого диска. На щастя, в більшості комп’ютерів встановлені мікросхеми BIOS ROM, що підтримують перезапис і дозволяють встановити оновлення від виробника комп’ютера. При покупці ноутбука слід відвідати Web-вузол його виробника, на якому мають бути представлені оновлення BIOS, драйвера і багато інших програм, необхідні для підтримки працездатності системи. Відсутність оновлень драйверів і BIOS не дозволить встановити нові операційні системи в майбутньому або значно ускладнить процес їх інсталяції.

У таблиці 2.1 представлений список компонентів ноутбуків, доступних для модернізаціі.

Таблиця 3.1 — Компоненти ноутбуків, які доступні для модернізації

Компонент

Можливість модернизації

Примітка

Системная плата

Ні

Нестандартні форма і розмір перешкоджають модернізації

Центральний процесор

Так

Встановлення більш швидкодіючого центрального процесора того ж типу і моделі звичайно можливе, але існують обмеження на споживчу напругу, виділення тепла і / або підтримку BIOS. Звичайно при модернізації частота процесора зростає незначно

Пам’ять

Так

Як правило, доступний тільки один або два роз'єми S0-DIMM. Можливо, для модернізації доведеться видалити модуль меншої ємності

Відеоадаптер

Ні

Відеоадаптер інтегрований в системну плату без можливості модернізації

Екран

Ні

Нестандартна форма і метод підключення не дозволяють виконати модернізацію

Клавіатура / пристрій позиціонування

Ні

Нестандартна форма і метод підключення не дозволяють виконати модернізацію

Жорсткий диск

Так

BIOS більш старих систем може не підтримувати диски об'ємом понад 8,4 Гбайт. У більшості систем використовуються диски діаметром до 9,5 або 12,5 мм. Зазвичай для установки потрібно лоток або модуль жорсткого диска

Накопичувачі на змінних носіях (гнучких дисках, CD / DVD, CD-RW/DVD ±RW)

Так

Такі накопичувачі можна встановлювати у внутрішні відсіки або підключати через інтерфейси USB / IEEE 1334 (FireWire / i. LINK)

Порти USB, IEEE 1394 (FlreWre / l. LINK), послідовний (RS-232), паралельний (IEEE 1284), SCSI і т.д.

Так

Встановлюються у вигляді адаптерів PC Card або CardBus

Порти Ethernet зі швидкістю передачі даних 10/100/1000 Мбіт / с

Так

Встановлюються у вигляді адаптерів PC Card або CardBus

Порти 802. 11a/b/g (Wi-Fi), Bluetooth

Так

Встановлюються у вигляді адаптерів PC Card або CardBus, mini-PCI (вбудовані адаптери) або плат MDC (Modem Daughter Cards). Вбудовані адаптери вимагають використання антени, встановленої виробником

3.3 Налаштування BIOS

У більшості комп’ютерів базова програма налаштування вбудована в мікропрограму BIOS. Такі програми налаштування активізуються при натисканні певної послідовності клавіш під час процедури POST (процедура самоперевірки при включенні). Багато систем при виконанні процедури POST видають повідомлення, в якому вказана комбінація клавіш, необхідна для запуску програми налуштування BIOS.

Основні виробники стандартизували наступні комбінації клавіш для входу в програму налуштування BIOS під час процедури перевірки POST:

1) для AMI BIOS натисніть клавішу < Del>;

2) для Phoenix BIOS натисніть < F2>;

3) для Award BIOS натисніть < Dcl> або комбінацію клавіш < Ctrl+Alt+Esc>;

4) для Microid Research BIOS натисніть < Esc>.

Якщо система не реагує ні на одну з цих клавіш, варто звернутися до виробника або до документації, де можуть бути вказані необхідні відомості.

Ось деякі незвичайні комбінації, які можуть зустрітися:

1) для IBM Aptiva / Valuepoint натисніть < F1>;

2) для старої версії Phoenix BIOS, завантажте систему в безпечному DOS-режимі і в запрошенні командного рядка натисніть комбінацію клавіш < Ctrl+Alt+Esc> або < Ctrl+A!t+S>;

3) для ноутбуків Compaq натисніть < F10>.

В основному меню програми налаштування BIOS можна звернутися до інших меню та підменю, що містять різні розділи чи екрани. Запишіть параметри комп’ютера відразу після запуску програми BIOS Setup, наприклад роздрукувавши їх на принтері.

У ряді програм настройки, надаються спеціальні параметри управління набором мікросхем, встановлених на системній платі. Більшість комп’ютерів при відключенні батареї CMOS повертають базові параметри BIOS, прийняті за замовчуванням. При цьому втрачаються всі внесені раніше зміни.

3.4 Діагностика ноутбуків

Для діагностики мобільних ПК існує кілька видів діагностичних програм (іноді вони поставляються разом з ПК), які дозволяють користувачеві виявляти причини неполадок, що виникають в ноутбуці. У багатьох випадках такі програми виконують основну роботу з визначення дефектного вузла. Умовно їх можна розділити на кілька груп, представлених нижче в порядку ускладнення програм та розширення їх можливостей:

1) POST (Power-On Self Test — процедура самоперевірки при включенні). Виконується при кожному включенні комп’ютера.

2) Діагностичні програми виробників. Більшість відомих виробників комп’ютерів (IBM, Compaq, Hewlett-Packard, Dell і т.д.) випускають для своїх систем спеціалізоване діагностичне програмне забезпечення, яке зазвичай містить набір тестів, що дозволяють ретельно перевірити всі компоненти комп’ютера.

3) Діагностичні програми, що поставляються з периферійними пристроями. Багато виробників обладнання випускають діагностичні програми, призначені для перевірки певного пристрою.

4) Діагностичні програми операційних систем. Windows 9х і Windows NT/2000/XP/Vista/7 поставляються з декількома діагностичними програмами для перевірки різних компонентів комп’ютера.

5) Діагностичні програми загального призначення. Такі програми, які забезпечують ретельне тестування будь-яких PC-сумісних комп’ютерів, випускають багато компаній.

3.4.1 Самоперевірки при включенні (POST)

При кожному включенні комп’ютера автоматично виконується перевірка його основних компонентів: процесора, мікросхеми ROM, допоміжних елементів системної плати, оперативної пам’яті і основних периферійних пристроїв. Ці тести проводяться швидко і не дуже ретельно в порівнянні з тестами, які виконуються діагностичними програмами. При виявленні несправного компонента видається попередження або повідомлення про помилку (несправності).

Хоча діагностика яка виконується програмою POST не зовсім повна, вона є першою «лінією оборони», особливо якщо виявляються серйозні несправності в системній платі. Якщо виявиться, що проблема досить серйозна, подальше завантаження системи буде припинено і з’явиться повідомлення про помилку (несправності), за яким, як правило, можна визначити причину її виникнення. Такі несправності іноді називають фатальними помилками (fatal error). Процедура POST зазвичай передбачає три способи індикації несправності: звукові сигнали, повідомлення, що виводяться на екран монітора, і шістнадцяткові коди помилок, що видаються в порт вводу-виводу.

3.4.1.1 Представлення помилок POST

Як вже було сказано вище, повідомлення POST зазвичай передаються користувачам в трьох варіантах:

1) Звуковий сигнал. Для цього використовується звуковий динамік, підключений до системної плати.

2) Екранні повідомлення. Повідомлення про помилки виводяться на екран монітора після ініціалізації відеоадаптера.

3) Контрольні коди POST. Шістнадцяткові контрольні коди, надіслані за адресою порту вводу-виводу. Для перегляду кодів необхідно встановити спеціальний адаптер в слот ISA або PCI.

При виявленні процедурою POST несправності комп’ютер видає характерні звукові сигнали, за якими можна визначити несправний елемент (або їх групу). Якщо комп’ютер справний, то при його включенні ви почуєте один короткий звуковий сигнал, коли ж виявлена несправність, видається ціла серія коротких або довгих звукових сигналів, а іноді і їх комбінація. Характер звукових кодів залежить від версії BIOS і компанії-розробника.

3.4.2 Діагностичні програми операційної системи

У більшості випадків купувати діагностичну програму недоцільно, оскільки систему можна протестувати існуючими засобами операційної системи. У складі Windows 95/98/Me/NT/2000/Vista/7 є кілька діагностичних програм.

1) Диспетчер пристроїв (Device Manager) Windows дозволяє переглянути список встановлених пристроїв, їх конфлікти / проблеми, а також апаратні ресурси, які використовуються.

2) DXDIAG здійснює діагностику DirectX.

3.4.3 Діагностичні програми загального призначення

Існує безліч різноманітних діагностичних програм для мобільних ПК. Це спеціальні програми для тестування пам’яті, жорстких дисків, дисководів гнучких дисків, відеоадаптерів і інших компонентів системи. Одні з них займають гідне місце серед такого роду програм, інші явно не дотягують до професійного рівня. До рекомендованих програм відносяться:

1) AMIDiag Suite — www. ami. com;

2) MicroScope — www. micro2000. com.

Який же діагностичної програмою віддати перевагу? На це питання немає однозначної відповіді. Таких програм досить багато, і кожна гарна по-своєму. Правда, деякі програми коштують недешево, але, якщо ви професійно займаєтеся обслуговуванням і технічною підтримкою комп’ютера, ці витрати окупляться сторицею.

Однією з найбільш популярних програм є AMIDIAG компанії AMI. Програма дозволяє перевірити апаратне забезпечення практично будь-якого комп’ютера. Вона поставляється в Windows-версії, що підтримує також діагностичні утиліти сторонніх розробників, і DOS-версії. Остання застосовується для тестування апаратних пристроїв незалежно від встановленої операційної системи за допомогою завантажувального диска DOS.

ноутбук мобільний мікропроцесорний мікроархітектура

ВИСНОВКИ

Перші сімейства процесорів Core i7 незважаючи на всю революційність змін до мікроархітектурі не будуть мати настільки приголомшливого успіху, як свого часу процесори Core над поколінням останніх Pentium. Однак нові підходи відкривають можливості для подальшого вдосконалення.

Мікроархітектура Nehalem дозволить Intel легко нарощувати на процесорному кристалі необхідну кількість ядер (від 1 до 8), а також мати різні варіанти комплектації процесора. Серверні процесори сімейства Core i7 (поява яких передбачається на початку наступного року) будуть мати до восьми ядер і до чотирьох контролерів інтерфейсу QPI.

Перше сімейство процесорів сьомого покоління вироблено по 45 нм технологічним нормам, а надалі планується виробництво з використанням техпроцесу в 32 нанометра, що дозволить скоротивши розміри кристала і енергоспоживання, розміщувати додаткові блоки, або збільшувати об'єм кеш пам’яті рівня L3.

У курсовії роботі детально розглянута мікроархітектура Nehalem, та мікропроцесорна система на базі Intel Core i7.

В загальному розділі я описав складові цієї архітектури: процесори та чіпсет. Також розповів про ноутбук HP Pavilion dv7, який організован на базі платформи Core i7, давши опис його технічних характеристик.

У спецільном розділі я описав архітектуру Nehalem та детально розглянув нову технологію Hyper-Threading.

У експлуатаційному розділі я розповів про класифікації ноутбуків і про те, на які групи вони поділяються. Описав модернізацію ноутбуків. Навів приклади налаштування BIOS, розповів про діагностику ноутбуків і програми, які застосовуються для діагностування мобільних ПК.

ДОДАТОК 1

Блок-схема чіпсета Intel X58

ДОДАТОК 2

Структурна схема мікроархітектури Nehalem

ПоказатьСвернуть
Заполнить форму текущей работой