Pewnie niewielu użytkowników komputerów osobistych pamięta procesory Pentium 60 MHz, ale zapewniam, że to autentyczna historia. Te pierwsze procesory zasilane były napięciem 5V. Kolejna grupa procesorów Pentium (P54C) pracowała przy mniejszym napięciu zasilającym (3,3V), a częstotliwość taktowania jądra oscylowała w granicach 200 MHz [1].

Procesory Pentium uznawane za 32-bitowe, tak jest w istocie - rejestry procesora są 32-bitowe, jednakże wewnętrzne ścieżki mają nawet do 256 bitów szerokości, dzięki czemu prędkość wewnętrznych transferów jest większa niż mogłoby wynikać z owych 32-bitów.

Pentium posiada dwa potoki przetwarzające instrukcje stałoprzecinkowe (U i V) oraz jednostkę zmiennoprzecinkową. Jeżeli jest to możliwe, procesor przetwarza w każdym cyklu dwie instrukcje (po jednej na potok). Potoki pracują wyłącznie w trybie synchronicznym, niemożliwe jest więc np. przewidywanie skoków przez jeden z nich, ponieważ zatrzymanie jednego z potoków prowadzi do zatrzymania drugiego. Jednak Pentium posiada dodatkowy moduł dynamicznego przewidywania rozgałęzień BPU (ang. Branch Prediction Unit). Moduł ten przewiduje rozgałęzienia, czyli "wkłada" do potoku te instrukcje, które jego zdaniem będą wykonywalne. Błędne przewidzenie rozgałęzienia powoduje, że jeden z potoków musi wstrzymać przetwarzanie, a więc i drugi potok nie może być realizowany [1].

Pentium może działać w systemach wieloprocesorowych, ale tylko z identycznym procesorem (Dual system). Montowany jest w gniazdach rozszerzeń typu Socket 7.

Procesor Pentium MMX jest jednostką typu SIMD (Single Instruction Multiple Data), czyli wykonuje operację na kilku grupach danych jednocześnie.

MMX stanowi rozszerzenie procesora Pentium o nowe rozkazy multimedialne. Rozszerzenie spowodowało pojawienie się nowych instrukcji (i nowych wyprowadzeń) oraz nowych rejestrów wykorzystywanych do tego celu. Istotne zmiany procesora Pentium MMX w stosunku do jego poprzednika, to [1]:

Modele Pentium MMX dzięki wykorzystaniu ww. nowinek (ale bez nowych instrukcji) osiągają wzrost mocy obliczeniowej do ok. 20 %.

Pentium II to model, który pierwszy przełamał granicę taktowania 200 MHz (stąd już tylko krok do 1GHz). Tym co odróżniło go od poprzedników był zupełnie nowy image. Otóż procesor Pentium II pojawił się na pokładzie specjalnej karty o 242 końcówkach, którą wkłada się do złącza krawędziowego o nazwie Slot 1 (patrz rysunek dla Pentium 3).

Dodatkową zmianą było oddzielenie pamięci podręcznej L2 (ang. Second Level Cache) od procesora, a stało się to dlatego, że taki sposób produkcji był znacznie tańszy. Pamięć L2 miała rozmiar 256/512 kB, taktowana była częstotliwością równą połowie taktu zegara procesora i znajdowała się na płytce wraz z procesorem.

Dodatkowe informacje o konstrukcji są następujące: pamięć podręczna L1 ma rozmiar 32KB (po 16KB dla kodu programu i danych), wewnętrzna magistrala ma szerokość 300 bitów, procesor może zaadresować 64 GB (wirtualnie 64 TB), zasilanie wynosi 2,8V, jako pierwszy współpracuje z magistralą taktowaną 100 MHz.

Pentium II przetwarza dane w trzech równoległych dwunastostopniowych potokach, a jądro procesora pracuje w układzie RISC (ang. Reduced Instruction Set Computer) - instrukcje rozkładane są na proste mikrooperacje i grupowane w centralnym zbiorniku (ang. Instruction Pool). Dzięki temu zbiornikowi pobieranie kolejnych kodów x86 z pamięci operacyjnej jest niezależne od ich wykonania [1]. Ze zbiornikiem instrukcji połączony jest układ dyspozytora (ang. Dispatcher), który kieruje mikroinstrukcje do właściwych jednostek wykonawczych (ang. Execute). Dyspozytor kieruje do wykonania te mikrokody, które aktualnie nie czekają na żadne wyniki pośrednie z innych operacji [1]. Wykonane instrukcje RISC trafiają znowu do zbiornika instrukcji (nie wiadomo, czy układ przewidywania rozgałęzień dobrze określił czy dana instrukcja rzeczywiście jest potrzebna). Instrukcja uznana za wykonaną zostaje "wyrzucona" ze zbiornika i przechodzi na "emeryturę" (ang. retire) i dopiero w tym momencie wyniki jej działania są zapisane.

Celerony A Medocino (określenie "medocino" identyfikuje strukturę krzemową) posiadają znaczniki 300A , 333, 366 i wyżej... Wyposażone są one w zintegrowaną pamięć podręczną L2 o skromnym rozmiarze 128 kB, która jest taktowana z pełną prędkością zegara procesora, czyli z prędkością cache L1. Medocino współpracuje z magistralami 66/100MHz. Taka konstrukcja procesora zapewniła mu dużą wydajność, przy stosunkowo niskim koszcie.

[Procesor Celeron 500]

Rysunek 2.3. Procesor Celeron

Dodatkowo, Celeron A jako pierwszy dał możliwość "podkręcania" (ang. overclocking) częstotliwości pracy magistrali systemowej współpracującej z tym procesorem, a więc częstotliwości pracy procesora (znane są przypadki podkręcania Celeron'a 333 do ok. 700 MHz). Sprawiło to, że Celeron A stał się w swoim czasie rynkowym przebojem i idealną "maszyną do overclocking'u".

Procesor Duron został stworzony przez firmę AMD głównie z myślą o klientach, którzy potrzebują dużej mocy obliczeniowej za niewielką cenę. Ograniczenie kosztów możliwe stało się dzięki zmniejszeniu ilości pamięci ciche poziomu L2 do 64 KB. Pamięć cache poziomu L1 w procesorze Durom wynosi 128 KB, a więc po raz pierwszy w historii procesor rodziny x86 posiada mniejszy cache poziomu L2 niż poziomu L1. Nie powoduje to jednak znacznego spadku wydajności dzięki zastosowaniu specjalnej organizacji pamięci podręcznej. Wykluczająca się architektura dostępu do pamięci cache (ang. exclusive cache) to rozwiązanie, które pozwala procesorowi używać sumarycznej pojemności pamięci cache L1 i L2 tak, jakby to była pamięć poziomu L1 o średnim czasie dostępu 1.5 cyklu zegara.

Zaimplementowana w Duronie interpretacja rozkazów 3DNow! i Enchanced 3DNow!, które wspomagają operacje multimedialne, pozwala na równoległe przetwarzanie kilku liczb arytmetyki stałoprzecinkowej jak i zmiennoprzecinkowej, a więc zwiększenie szybkości przetwarzania danych. Taki sposób przetwarzania określany jest jako SIMD (ang. Single Instruction Multiple Data) i polega na wykonywaniu jednej instrukcji na bloku danych.

Procesor AMD Duron komunikuje się z pamięcią SDRAM z częstotliwością 100 MHz (dla pamięci DDR 200 MHz), jest wykonany w technologii 0.25 mikrona (wersja 600 MHz) i zainstalowany może być na płycie głównej zawierającej podstawkę typu Socket A. Procesor ten (nazwany roboczo Katmai), tak jak jego poprzednik, ma architekturę 32-bitową. Ponadto posiada zintegrowaną 512 kB pamięć podręczną drugiego poziomu, wykorzystuje poszerzoną 256-bitową szynę BSB (ang. Back Side Bus) zapewniającą szybszy transfer wewnętrzny danych. Procesor zasilany jest napięciem 1.65/1.7 V (zależnie od modelu).

Pentium III dysponuje poszerzoną listą rozkazów. Dodano ponad 70 rozkazów określanych jako ISSE (ang. Internet Streaming SIMD Extentions), czyli wykorzystanie znanych z MMX technik przetwarzania kilku danych z użyciem jednego rozkazu. Co ważne, ISSE potrafi operować także na danych w formacie zmiennoprzecinkowym, co wykorzystywane jest do obliczania obrazów 3D, rozpoznawania mowy, itp. [3]. Aby możliwe było korzystanie z rozszerzeń ISSE, kod aplikacji musi być specjalnie zoptymalizowany.

[Procesor Pentium III]

Rysunek 2.4. Procesor Pentium III

Ponadto, cache L2 jest zintegrowany z procesorem i jest taktowany z taką samą szybkością jak rdzeń procesora. Interfejs magistrali zewnętrznej w procesorze Intela oparty jest na standardzie - GTL+ (ang. Gunning Tranceiver Logic). Magistrala jest taktowana z częstotliwością 133 MHz.

Architektura procesora Athlon Thunderbird jest niemal identyczna jak ta, która charakteryzuje procesor AMD Duron. Najbardziej istotną różnicą jest rozmiar pamięci cache L2 działający z pełną szybkością jądra układu, który wynosi 256 KB. Pamięć ta pracuje w trybie exclusive L2 cache memory.

Procesor Athlon współpracuje z 200/266 MHz magistralą systemową, dzięki czemu możliwe jest dostarczenie do procesora 1.6/2.13 GB danych. Ten wydajny interfejs magistrali zewnętrznej Thunderbirda - EV6 - pochodzi od procesorów Alpha firmy DEC.

[Procesor Athlon Thunderbird]

Rysunek 2.5. Procesor Athlon Thunderbird

W Athlonie, tak jak i w Duronie, zaimplementowane są rozkazy SIMD - 3DNow! (21 instrukcji) oraz Enhanced 3DNow! (45 instrukcji), dzięki którym uzyskano przyspieszenie blokowych operacji na danych. Dzięki tym rozszerzeniom procesor potrafi efektywniej wykonywać takie zadania jak: kodowanie/dekodowanie MPEG2, MP3, itp.

Procesory Athlon Thunderbird montowane są obecnie już tylko w złączach typu Socket A - początkowe wersje tego procesora mogły być osadzane również w podstawkach Slot A. Maksymalna podawana przez producenta częstotliwość taktowania Thunderbirda to 1.4 MHz.

Procesor Pentium 4 jest najnowszym produktem firmy Intel. Wyróżnia go wysoka częstotliwość pracy układu - ponad 1,4 GHz. Wraz z procesorem zintegrowana jest pamięć cache L2 o pojemności 256 kB, która pracuje tak jak u poprzednika, z pełną prędkością procesora. Brak jest natomiast pamięci cache L1. Usprawnione jest przetwarzanie potokowe, a długość kolejki rozkazów wynosi 20. Za tłumaczenie kodu x86 odpowiada wyspecjalizowany dekoder.

P4 posiada nowy mechanizm mający na celu poprawienie wydajności układu. Jest to 8 kB bufor śledzenia wykonywania instrukcji (ang. Execution Trace Cache), przechowujący kod x86 w postaci mikrooperacji (nie ma konieczności odkodowywania instrukcji, gdyż są już odkodowane). Ponadto ALU pracuje dwa razy szybciej niż reszta procesora, a więc np. 2.8 GHz dla procesora 1.4 GHz. Mechanizm ten nosi nazwę Rapid Execution Engine i umożliwia zakończenie operacji na danych stałoprzecinkowych w połowie cyklu zegarowego [3].

Najmniej zmienioną częścią najnowszego procesora Intela jest jednostka zmiennoprzecinkowa. Tak jak dla P3 wykorzystywane są dwa kanały do obliczeń zmiennoprzecinkowych. Poszerzony został zestaw instrukcji ISSE o 144 nowe rozkazy, który nosi nazwę ISSE2 i umożliwia wykonywanie operacji na liczbach 128 bitowych o podwójnej precyzji oraz na 128 bitowych liczbach stałoprzecinkowych.

[Procesor Pentium 4]

Rysunek 2.6. Procesor Pentium 4

Architektura Pentium 4 jest 64-bitowa, procesor dysponuje 400 MHz magistralą systemową o przepustowości 3,2 GB/s (3 razy szybciej niż Pentium III). Procesor oryginalnie przeznaczony był tylko do współpracy z pamięcią RDRAM, jednakże pojawiły się już wersje współpracujące z pamięciami typu SDRAM.

NASTĘPNA