Wayback Machine

Wayback Machine
URLweb.archive.org Sunting ini di Wikidata
TipeArsip
PendaftaranOpsional
Bahasabahasa Inggris Edit nilai pada Wikidata
Bahasa pemrogramanC (mul) Terjemahkan, Perl, Java dan Python Edit nilai pada Wikidata
PemilikInternet Archive
PembuatBrewster Kahle dan Bruce Gilliat (en) Terjemahkan Edit nilai pada Wikidata
Berdiri sejak24 Januari 1996[1]
NegaraAmerika Serikat Edit nilai pada Wikidata
Peringkat Alexa 162 (October 2013)[2]
StatusAktif
X: waybackmachine Modifica els identificadors a Wikidata

Wayback Machine adalah arsip digital dari Waring Wera Wanua dan informasi lain dari Internet yang dibuat oleh Internet Archive, sebuah organisasi nirlaba yang berbasis di San Francisco, California. Situs ini diprogram oleh Brewster Kahle dan Bruce Gilliat dengan tujuan untuk menyediakan "akses universal ke seluruh pengetahuan" melalui pelestarian dan penyalinan arsip halaman web yang tidak lagi aktif.[3]

Arsip tertua Wayback Machine mencakup data setidaknya sejak tahun 1995. Pada akhir tahun 2009, lebih dari 38,2 miliar halaman web telah berhasil disimpan. Perkembangan pesat terus berlanjut dan hingga November 2024, Wayback Machine telah mengarsipkan lebih dari 916 miliar halaman web dengan total data yang melebihi 100 petabytes.[4][5]

Sejarah

Internet Archive telah melakukan pengarsipan halaman web yang di-cache setidaknya sejak tahun 1995, dengan salah satu halaman paling awal yang tercatat diarsipkan pada tanggal 8 Mei 1995.[6] Inisiatif Wayback Machine secara resmi diluncurkan oleh para pendiri Internet Archive, Brewster Kahle dan Bruce Gilliat, di San Francisco, California, pada Oktober 2001.[7][8][9] Tujuan utama peluncuran ini adalah untuk mengatasi masalah hilangnya konten web akibat perubahan atau penutupan situs web.[10] The service enables users to see archived versions of web pages across time, which the archive calls a "three-dimensional index".[11] Layanan ini memungkinkan pengguna untuk melihat versi arsip halaman web dari waktu ke waktu, yang oleh Internet Archive disebut sebagai "indeks tiga dimensi".

Kahle dan Gilliat menciptakan Wayback Machine dengan harapan dapat mengarsipkan seluruh internet dan menyediakan "akses universal ke seluruh pengetahuan".[12][13][14][15] Nama "Wayback Machine" sendiri merupakan referensi dari perangkat perjalanan waktu fiksi dalam serial kartun animasi tahun 1960-an, The Adventures of Rocky and Bullwinkle and Friends, khususnya dalam segmen "Peabody's Improbable History" di mana karakter Mister Peabody dan Sherman menggunakan "Wayback Machine" untuk melakukan perjalanan ke masa lalu dan menyaksikan serta berpartisipasi dalam peristiwa-peristiwa bersejarah terkenal.[16]

Dari tahun 1996 hingga 2001, informasi yang terkumpul disimpan dalam pita digital.[17] Kahle sesekali mengizinkan para peneliti dan ilmuwan untuk mengakses basis data yang dianggap "kikuk" tersebut. Pada peringatan lima tahun arsip pada tahun 2001, Wayback Machine diumumkan dan dibuka untuk publik dalam sebuah upacara di University of California, Berkeley.[18] Pada saat peluncurannya, Wayback Machine telah berisi lebih dari 10 miliar halaman yang diarsipkan. Data tersebut disimpan dalam klaster besar node Linux milik Internet Archive.[12] Layanan ini secara berkala mengunjungi dan mengarsipkan versi baru situs web. Selain itu, situs web juga dapat ditangkap secara manual dengan memasukkan URL situs web ke dalam kotak pencarian, asalkan situs web tersebut mengizinkan Wayback Machine untuk melakukan "crawling" dan menyimpan datanya.[19]

Pada tanggal 30 Oktober 2020, Wayback Machine mulai melakukan pemeriksaan fakta terhadap konten yang diarsipkan. Per Januari 2022, domain server iklan dikecualikan dari proses pengambilan data. Sebagai bagian dari perayaan ulang tahun ke-25 Internet Archive pada Mei 2021, Wayback Machine memperkenalkan "Wayforward Machine", sebuah fitur yang memungkinkan pengguna untuk "melakukan perjalanan ke internet pada tahun 2046, di mana pengetahuan berada di bawah ancaman".[20][21]

Teknis pengarsipan

Perangkat lunak yang mendasari Wayback Machine dirancang untuk melakukan "crawling" atau penjelajahan web secara otomatis, mengunduh seluruh informasi dan berkas data yang dapat diakses publik pada halaman web, melalui sistem hierarki Gopher, sistem papan buletin Netnews (Usenet), dan perangkat lunak bantuan lainnya..[22] Meskipun demikian, informasi yang dikumpulkan oleh program 'crawler' ini tidak mencakup seluruh konten yang ada di internet. Hal ini disebabkan oleh adanya pembatasan akses oleh penerbit atau penyimpanan data dalam basis data yang tidak dapat dijangkau. Untuk mengatasi inkonsistensi pada situs web yang hanya sebagian di-cache, Internet Archive mengembangkan Archive-It.org pada tahun 2005. Layanan ini memungkinkan institusi dan pembuat konten untuk secara sukarela mengumpulkan dan melestarikan koleksi konten digital serta membuat arsip digital.[23]

Proses crawling ini didukung oleh berbagai sumber, termasuk kontribusi dari pihak ketiga dan yang dihasilkan secara internal oleh Internet Archive. Contohnya, kontribusi crawling berasal dari Sloan Foundation dan Alexa, crawling yang dijalankan oleh Internet Archive atas nama NARA dan Internet Memory Foundation, serta mirror dari Common Crawl. "Worldwide Web Crawls" telah berjalan sejak tahun 2010 dan bertujuan untuk menangkap keseluruhan web secara global.[24] The "Worldwide Web Crawls" have been running since 2010 and capture the global Web.[24][25] Pada September 2020, Internet Archive mengumumkan kemitraan dengan Cloudflare, sebuah penyedia layanan jaringan pengiriman konten asal Amerika, untuk secara otomatis mengindeks situs web yang dilayani melalui layanan "Always Online" mereka.[26]

Dokumen dan sumber daya yang diarsipkan disimpan dengan URL yang menyertakan stempel waktu, seperti 20250508155005. Sumber daya yang ada pada halaman web, seperti gambar, lembar gaya, dan skrip, serta hyperlink atau tautan keluar, ditautkan dengan stempel waktu halaman yang sedang dilihat. Dengan demikian, mereka secara otomatis dialihkan ke hasil tangkapan individual yang paling dekat waktunya.[27]

Frekuensi pengambilan snapshot bervariasi untuk setiap situs web. Situs web yang termasuk dalam "Worldwide Web Crawls" dimasukkan ke dalam "crawl list" dan diarsipkan satu kali per proses crawling. Durasi satu proses crawling dapat berlangsung selama beberapa bulan atau bahkan tahun, tergantung pada ukuran situs web. Sebagai contoh, "Wide Crawl Number 13" dimulai pada 9 Januari 2015 dan selesai pada 11 Juli 2016.[28] Namun, beberapa proses crawling dapat berjalan secara bersamaan, dan sebuah situs mungkin terdaftar dalam lebih dari satu daftar crawling, sehingga frekuensi crawling suatu situs dapat sangat bervariasi.[24]

Fitur pengarsipan "Save Page Now" tersedia sejak Oktober 2013 dan dapat diakses di bagian kanan bawah halaman utama Wayback Machine.[29][30] Setelah URL target dimasukkan dan disimpan, halaman web tersebut akan menjadi bagian dari Wayback Machine.[31] Melalui alamat internet web.archive.org, pengguna dapat mengunggah berbagai jenis konten ke Wayback Machine, termasuk format berkas PDF dan kompresi data. Wayback Machine akan membuat URL lokal permanen untuk konten yang diunggah, yang dapat diakses di web meskipun tidak terdaftar saat melakukan pencarian di situs web resmi.

Mulai Oktober 2019, pengguna dibatasi hingga 15 permintaan pengarsipan dan pengambilan per menit.[32]

Referensi

  1. ^ "The Internet Archive: Building an 'Internet Library'". Internet Archive. November 30, 2001. Diarsipkan dari asli tanggal 2001-11-30. Diakses tanggal May 12, 2013. The Wayback Machine was unveiled on October 24th at Berkeley's Bancroft Library.
  2. ^ "Archive.org Site Info". Alexa Internet. Diarsipkan dari asli tanggal 2013-10-28. Diakses tanggal 2013-10-29. {{cite web}}: ( )
  3. ^ Kahle, Brewster (November 23, 2005). "Universal Access to all Knowledge". Internet Archive. Diarsipkan dari asli tanggal August 14, 2022. Diakses tanggal June 5, 2022.
  4. ^ "Internet Archive: Wayback Machine". web.archive.org. Diarsipkan dari asli tanggal March 13, 2023. The current number of archived pages can be seen at the archive's home page.
  5. ^ Kahle, Brewster. "A Message from Internet Archive Founder, Brewster Kahle". Internet Archive. Diakses tanggal January 10, 2024.
  6. ^ "Wayback Machine snapshot of the page "Eugene Public Library Hours" at the Eugene, OR Public Library". Wayback Machine. Internet Archive. May 8, 1995.
  7. ^ "Wayback Machine General Information". Internet Archive. Diarsipkan dari asli tanggal December 5, 2019. Diakses tanggal March 2, 2021.
  8. ^ "WayBackMachine.org WHOIS, DNS, & Domain Info – DomainTools". WHOIS. Diarsipkan dari versi aslinya tanggal May 14, 2020. Diakses tanggal March 13, 2016.
  9. ^ "InternetArchive.org WHOIS, DNS, & Domain Info – DomainTools". WHOIS. Diarsipkan dari versi aslinya tanggal May 12, 2020. Diakses tanggal March 13, 2016.
  10. ^ Notess, Greg R. (March–April 2002). "The Wayback Machine: The Web's Archive". Online. 26: 59–61. Templat:INIST.
  11. ^ "The Wayback Machine", Frequently Asked Questions, diarsipkan dari versi aslinya tanggal September 18, 2018, diakses tanggal September 18, 2018
  12. ^ a b "20,000 Hard Drives on a Mission". Internet Archive Blogs. October 25, 2016. Diarsipkan dari versi aslinya tanggal October 20, 2018. Diakses tanggal October 15, 2018.
  13. ^ Green, Heather (February 28, 2002). "A Library as Big as the World". BusinessWeek. Diarsipkan dari asli tanggal December 20, 2011.
  14. ^ Tong, Judy (September 8, 2002). "Responsible Party – Brewster Kahle; A Library Of the Web, On the Web". The New York Times. Diarsipkan dari versi aslinya tanggal February 20, 2011. Diakses tanggal August 15, 2011.
  15. ^ Keith Scott (2000). The Moose that Roared: The Story of Jay Ward, Bill Scott, a Flying Squirrel, and a Talking Moose. St. Martin's Press. ISBN 0-312-19922-8
  16. ^ Markstein, Don. "Toonopedia: "Peabody's Improbable History"". Toonpedia.com. Diakses tanggal 2024-11-07.
  17. ^ Cook, John (November 1, 2001). "Web site takes you way back in Internet history". Seattle Post-Intelligencer. Diarsipkan dari versi aslinya tanggal August 12, 2014. Diakses tanggal August 15, 2011.
  18. ^ Mayfield, Kendra (October 28, 2001). "Wayback Goes Way Back on Web". Wired. Diarsipkan dari versi aslinya tanggal October 16, 2017. Diakses tanggal October 16, 2017.
  19. ^ "Internet Archive: Wayback Machine". Internet Archive. Diarsipkan dari versi aslinya tanggal January 3, 2014. Diakses tanggal October 15, 2018.
  20. ^ "Internet Archive 25th Anniversary – Universal Access to All Knowledge". Diakses tanggal January 13, 2022.
  21. ^ "Wayforward Machine • Visit the future of the internet". Way Forward Machine. Diakses tanggal January 13, 2022.
  22. ^ Kahle, Brewster. "Archiving the Internet". Scientific American – March 1997 Issue. Diarsipkan dari versi aslinya tanggal April 3, 2012. Diakses tanggal August 19, 2011.
  23. ^ Kaplan, Jeff (October 27, 2014). "Archive-It: Crawling the Web Together". Internet Archive Blogs. Diarsipkan dari versi aslinya tanggal October 12, 2017. Diakses tanggal October 16, 2017.
  24. ^ a b c Leetaru, Kalev (January 28, 2016). "The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web". Forbes. Diarsipkan dari versi aslinya tanggal October 16, 2017. Diakses tanggal October 16, 2017.
  25. ^ "Worldwide Web Crawls". Internet Archive. Diarsipkan dari versi aslinya tanggal October 19, 2017. Diakses tanggal October 16, 2017.
  26. ^ Kesalahan pengutipan: Tag <ref> tidak sah; tidak ditemukan teks untuk ref bernama archive-partners
  27. ^ "Using The Wayback Machine". Internet Archive. Diakses tanggal September 25, 2024.
  28. ^ "Wide Crawl Number 13". Internet Archive. Diarsipkan dari versi aslinya tanggal October 19, 2017. Diakses tanggal October 16, 2017.
  29. ^ Rossi, Alexis (October 25, 2013). "Fixing Broken Links on the Internet". Internet Archive. Diarsipkan dari versi aslinya tanggal November 7, 2014. Diakses tanggal December 29, 2013.
  30. ^ "Wayback Machine main page". Internet Archive. Diarsipkan dari versi aslinya tanggal January 3, 2014. Diakses tanggal December 30, 2013.
  31. ^ "Web.archive.org directory". Diarsipkan dari versi aslinya tanggal January 3, 2012. Diakses tanggal March 2, 2014.
  32. ^ "Too Many Requests". Internet Archive. November 10, 2019. Diakses tanggal November 27, 2021.

Pranala luar

Prefix: a b c d e f g h i j k l m n o p q r s t u v w x y z 0 1 2 3 4 5 6 7 8 9

Portal di Ensiklopedia Dunia

Kembali kehalaman sebelumnya