Üzleti tippek

Időkapszulában a weboldalak

Március végén új helyszínre költözött az internetes oldalak archiválásával foglalkozó Internet Archive adatbázisa. A régi központban az amerikai kongresszusi könyvtárban található információ 150-szeresét tárolták, az újba naponta száz terabájtnyi adat kerül majd be.

Közhelynek számít, hogy napjaink egyik leggyorsabban változó területe az internet, hiszen folyamatosan jelennek meg új lehetőségek, szolgáltatások és időről időre a már komoly múltra visszatekintő, bejáratott weboldalak is „ráncfelvarráson” esnek át. A folyamatos változás miatt ma már talán csak a készítők emlékeznek arra, hogyan nézett ki eleinte az Index.hu vagy éppen a Startlap.hu, pedig a különbségek – a technológiai megoldások, a hirdetések mennyisége stb. – jól mutatják, hogy milyen alapvető változásokon ment át a világháló az elmúlt években. Bármennyire is meglepő, létezik egy olyan szervezet, amely azzal a céllal jött létre, hogy kövesse ezeket a megújulásokat, és napjainkra egy 85 milliárd weboldalt tároló adatbázist hozott létre. Az Internet Archive nevű nonprofit szervezet Wayback Machine névre keresztelt digitális időkapszulája jelenleg három petabájtnyi információt – ez 150-szerese a világ talán legnagyobb könyvtárában, az amerikai kongresszusi könyvtárban tárolt adatmennyiségnek – tartalmaz arról, hogy 1996 óta hogyan változtak a honlapok.

A világháló egyre gyorsabb fejlődését jól mutatja, hogy az indulástól 2004-ig, azaz nyolc év alatt 30 milliárd weblapot vettek fel az adatbázisba, míg az azóta eltelt öt évben ennek közel dupláját. A gyors növekedés azzal is járt, hogy a szervezet két adatközpontja – a kaliforniai Redwood Cityben és Mountain View-ban – már nem képes megbirkózni a hatalmas információmennyiség jelentette kihívással, ezért az Internet Archive újabb központot hozott létre március végén. Azonban hosszú távon valószínűleg a két petabájt kapacitású létesítmény sem oldja meg a szervezet problémáit, mivel a várakozások szerint havonta mintegy száz terabájtnyi információval bővül a tárolt adatok mennyisége. Jó hír ugyanakkor az archív honlapok szerelmeseinek, hogy a jelenlegi bővítésnél is alkalmazott megoldás révén a jövőben sokkal gyorsabban lehet növelni a kapacitást.

Az új központ technológiai hátterét a Sun Microsystems biztosítja. A hatalmas konténerekben elhelyezett rendszer moduláris kialakítású, ennek köszönhetően tizedannyi idő alatt lehet bővíteni, mint a hagyományos adatközpontokat. Ráadásul a cég szerint ez a megoldás földrengésbiztos, ez pedig Kaliforniában fontos szempont lehet. Habár a weboldal technológiai háttere megváltozik, a netes megjelenés, az oldal működése marad a régi – közölték az oldal gazdái. A Wayback Machine másodpercenként 500 lekérés kezelésére képes az új helyen.

A kaliforniai központú Internet Archive adatbázisát – egy esetleges katasztrófa hatásainak csökkentésére – tükrözik az egyiptomi Alexandriában található Bibliotheca Alexandrina adattárába. Az archív weboldalak mellett képeket, szoftvereket, filmeket, könyveket és videoklipeket is tárolnak a Wayback Machine-ben.

Bár az Internet Archive www.archive.org címen elérhető archívuma csak 1996-ig megy vissza, az internet kezdetei jóval mélyebbre nyúlnak. A PC World összeállítása szerint az első .com kiterjesztést, a www.symbolics.com-ot 1985. március 15-én vásárolta meg egy számítógépgyártó, míg a századik ilyen kiterjesztésű webcím megszületésére 1987. november 30-ig kellett várni.

Ajánlott videó

Nézd meg a legfrissebb cikkeinket a címlapon!
Olvasói sztorik