ארכיון האינטרנט

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש
ארכיון האינטרנט
Internet Archive
לוגו הארכיון
סוג: מוסד ללא כוונת רווח, ארכיון דיגיטלי
סיסמה: גישה אוניברסלית לכלל הידע
שנת הקמה: 1996
השקת האתר: 2001
משרד ראשי: סן פרנסיסקו, קליפורניה, ארצות הברית
מייסדים: ברוסטר קאהל
עובדים: 200
https://archive.org/

ארכיון האינטרנטאנגלית: Internet Archive) הוא ארכיון דיגיטלי ללא כוונות רווח כשמטרתו המוצהרת היא "גישה אוניברסלית לכלל הידע"[1]. הארכיון מספק אחסון קבוע וגישה ציבורית חופשית לאוספים של חומרים דיגיטליים, כולל אתרי אינטרנט, מוזיקה ותמונות נעות. נכון לחודש אוקטובר 2012, גודל אוסף הארכיון הגיע לכמות של 10 פטא-בייט. בנוסף לארכיון עצמו, הארגון הוא אקטיביסטי, הדוגל באינטרנט חופשי ופתוח.

ארכיון האינטרנט מאפשר לציבור להעלות ולהוריד חומר דיגיטלי מאשכול הנתונים, אך עיקר הנתונים נאספים אוטומטית על ידי סורקי האינטרנט הפועלים כמה שיותר כדי לשמר מהאינטרנט הציבורי ככל האפשר. ארכיון האתר, ה-Wayback Machine (אנגלית: מכונת זמן), מכילה יותר מ-415 מיליארד תיעודים של דפי אינטרנט. הארכיון הוא גם אחד מפרויקטי דיגיטליזצית הספר הגדולים בעולם.

הארכיון נוסד בשנת 1996 על ידי ברוסטר קאהל והוא למעשה ארגון ללא כוונות רווח. תקציב האתר השנתי הוא 10 מיליון דולר, המגיעים ממגוון מקורות: הכנסות משירותי זחלן הרשת של הארכיון, מגוון שותפויות, מענקים ותרומות. המשרדים הראשיים של הארכיון ממוקמים בסן פרנסיסקו שבקליפורניה, שם עובדים 30 מועסקים מתוך כלל ה-200. לארכיון יש שלושה מרכזי נתונים בשלושה ערים קליפורניות: סן פרנסיסקו, רדווד סיטי וריצ'מונד. האוסף של הארכיון הוא שיקוף ליציבות ולסיבולת לביבליותיקה אלכסנדרינה שבמצרים.

בשנת 2007, הספרייה הדיגיטלית ללא כוונות הרווח הוכרזה רשמית כספריה על ידי מדינת קליפורניה.

היסטוריה[עריכת קוד מקור | עריכה]

משרדיה הראשיים של החברה משנת 1996 עד 2009 בפרסידיו של סן פרנסיסקו

קאהל ייסד את הארכיון בשנת 1996 בזמן שייסד את אלכסה, חברת זחלן רשת למטרות רווח. באותה השנה, ארכיון האינטרנט החל לשמר ולאחסן בארכיון את ה-World Wide Web. התוכן הנשמר בארכיון לא היה זמין עד שנת 2001, אז ה-Wayback Machine פותח. בסוף שנת 1999 הארכיון הרחיב את אוספיו מעבר לארכיון אינטרנט והחל לאחסן גם את ארכיון הסרטים Prelinger Archives. באמצע העשור השני של שנות האלפיים, ארכיון האינטרנט כולל טקסטים, אודיו, תמונות נעות ותוכנות. הארכיון גם מארח מספר פרויקטים אחרים: ארכיון התמונות של NASA, קטלוג ספריית ויקיפדיה הניתנת לעריכה ואתר ספריית הספרים הפתוחה.

על פי דברי אתר הארכיון:

Cquote2.svg

ברוב חברות בני האדם רואים חשיבות בשימור חפצים וממצאים של התרבות והמורשת שלהם. ללא חפצים אלה, לציוויליזציה אין כל זיכרון שממנו ניתן ללמוד מההצלחות והכשלונות שלה. התרבות שלנו כעת מייצרת יותר ויותר חפצים בצורה דיגיטלית. משימת הארכיון היא לעזור לשמר את חפצים אלו וליצור ספריית אינטרנט עבור חוקרים, היסטוריונים, ותלמידים.

Cquote3.svg

באוגוסט 2012, הודיע הארכיון שהוסיף את פרוטוקול ביטורנט לאפשרויות הורדת הקבצים עבור מעל ל-1.3 מיליון קבצים הקיימים באתר וקבצים שהועלו לאחרונה. שיטה זו היא האמצעי המהיר ביותר להורדת מדיה מהארכיון.

ב-6 בנובמבר 2013, עלו משרדי הארכיון הראשיים של ארכיון האינטרנט בריצ'מונד קליפורניה עלו באש, הרסו ציוד והסבו נזק לדירות סמוכות. על פי הארכיון, הארגון איבד מצלמות, גופי תאורה, וציוד סריקה בשווי של מאות אלפי דולרים. הארגון ללא כוונת רווח ביקש תרומות כדי לכסות את הנזקים שהוערכו בכ-$600,000[2].

ארכוב של ה-World Wide Web[עריכת קוד מקור | עריכה]

Wayback Machine[עריכת קוד מקור | עריכה]

Postscript-viewer-shaded.png ערך מורחב – Wayback Machine
לוגו מכונת הזמן, משמש כלוגו הרשמי מאז 24 באוקטובר 2001

ארכיון האינטרנט ניצל את השימוש הפופולרי במונח "WABAC Machine" מקטע מסדרת האנימציה הישנה רוקי ובולווינקל והשתמש בשם "Wayback Machine" עבור שירותי האתר המאפשרים גישה ואחסון של ה-World Wide Web בארכיון. שירות זה מאפשר למשתמשים לצפות בדפי אינטרנט מהעבר שאוחסנו בארכיון. ה-Wayback Machine נוצר מתוך מאמץ משותף של אלכסה וארכיון האינטרנט כאשר בנו אינדקס תלת-ממדי. מיליוני אתרי אינטרנט ונתונים הקשורים אליהם (תמונות, קוד מקור, מסמכים וכו') שמורים במסד נתונים ענק. השירות מאפשר למשתמשים לראות כיצד נראו אתרים מסוימים בעבר, לתפוס את קוד המקור המקורי מאתרי אינטרנט שכבר לא זמינים, ואף לבקר באתרי אינטרנט שכבר לא קיימים. תנאי השימוש של ארכיון האינטרנט מציין שאסור למשתמשים ב-Wayback Machine להוריד נתונים מהאוסף. לא כל אתרי האינטרנט זמינים לתצוגה באתר מאחר שבעלי אתרים רבים בוחרים לא לכלול את אתריהם בארכיון. כמו בכל האתרים המבוססים על נתונים מזחלני רשת, ארכיון האינטרנט מחמיץ שטח גדול של האינטרנט ממגוון סיבות אחרות.

השימוש במונח "Wayback Machine" בהקשר לארכיון האינטרנט הפך כל כך נפוץ עד שה-"Wayback Machine" היא כמו מילה נרדפת לארכיון האינטרנט. השימוש מתרחש בתרבות, לדוגמה: הארכיון הוזכר בסדרת הטלוויזיה חוק וסדר: כוונה פלילית בפרק ששודר ב-3 באוגוסט 2008.

באוקטובר 2013, הושמה באתר אפשרות ה-'Save Page Now' (אנגלית: שמור דף עכשיו) הנגישה בדף הראשי של ה-Wayback Machine בצד הימני התחתון של הדף. ברגע שכתובת URL מודבקת ונשמרת, דף האינטרנט יהפוך לחלק מה-Wayback Machine של ארכיון האינטרנט, אלא אם כן אתר היעד לא מתיר גישה לפרוטוקול אי הכללת רובוטים (robots.txt).

שנה 2005 2006 2007 2008 2009 2010 2011 2012 2013
מספר הדפים המאוחסנים בארכיון (מיליארד) 40 85 85 85 150 150 150 150 373

Archive-It[עריכת קוד מקור | עריכה]

שירות אשר הפך זמין בתחילת 2006. השירות מאפשר למנויים בתשלום לשמר אוספים של תוכן דיגיטלי.

נכון למרץ 2014 מעל ל-275 מוסדות שמרו ב-Archive-It עותקים של מעל ל-7.4 מיליארד כתובות URL במסגרת 2,444 אוספים ציבוריים. מוסדות אלו כוללים בין היתר אוניברסיטאות, מוסדות פדרליים, מוזיאונים, וארגונים תרבותיים.

קישורים חיצוניים[עריכת קוד מקור | עריכה]

הערות שוליים[עריכת קוד מקור | עריכה]

קואורדינטות: 37°46′56″N 122°28′18″W / 37.7823°N 122.4716°W / 37.7823; -122.4716