Wayback Machine
Wayback Machine adalah arsip digital dari Waring Wera Wanua dan informasi lain dari Internet yang dibuat oleh Internet Archive, sebuah organisasi nirlaba yang berbasis di San Francisco, California. Situs ini diprogram oleh Brewster Kahle dan Bruce Gilliat dengan tujuan untuk menyediakan "akses universal ke seluruh pengetahuan" melalui pelestarian dan penyalinan arsip halaman web yang tidak lagi aktif.[3] Arsip tertua Wayback Machine mencakup data setidaknya sejak tahun 1995. Pada akhir tahun 2009, lebih dari 38,2 miliar halaman web telah berhasil disimpan. Perkembangan pesat terus berlanjut dan hingga November 2024, Wayback Machine telah mengarsipkan lebih dari 916 miliar halaman web dengan total data yang melebihi 100 petabytes.[4][5] SejarahInternet Archive telah melakukan pengarsipan halaman web yang di-cache setidaknya sejak tahun 1995, dengan salah satu halaman paling awal yang tercatat diarsipkan pada tanggal 8 Mei 1995.[6] Inisiatif Wayback Machine secara resmi diluncurkan oleh para pendiri Internet Archive, Brewster Kahle dan Bruce Gilliat, di San Francisco, California, pada Oktober 2001.[7][8][9] Tujuan utama peluncuran ini adalah untuk mengatasi masalah hilangnya konten web akibat perubahan atau penutupan situs web.[10] The service enables users to see archived versions of web pages across time, which the archive calls a "three-dimensional index".[11] Layanan ini memungkinkan pengguna untuk melihat versi arsip halaman web dari waktu ke waktu, yang oleh Internet Archive disebut sebagai "indeks tiga dimensi". Kahle dan Gilliat menciptakan Wayback Machine dengan harapan dapat mengarsipkan seluruh internet dan menyediakan "akses universal ke seluruh pengetahuan".[12][13][14][15] Nama "Wayback Machine" sendiri merupakan referensi dari perangkat perjalanan waktu fiksi dalam serial kartun animasi tahun 1960-an, The Adventures of Rocky and Bullwinkle and Friends, khususnya dalam segmen "Peabody's Improbable History" di mana karakter Mister Peabody dan Sherman menggunakan "Wayback Machine" untuk melakukan perjalanan ke masa lalu dan menyaksikan serta berpartisipasi dalam peristiwa-peristiwa bersejarah terkenal.[16] Dari tahun 1996 hingga 2001, informasi yang terkumpul disimpan dalam pita digital.[17] Kahle sesekali mengizinkan para peneliti dan ilmuwan untuk mengakses basis data yang dianggap "kikuk" tersebut. Pada peringatan lima tahun arsip pada tahun 2001, Wayback Machine diumumkan dan dibuka untuk publik dalam sebuah upacara di University of California, Berkeley.[18] Pada saat peluncurannya, Wayback Machine telah berisi lebih dari 10 miliar halaman yang diarsipkan. Data tersebut disimpan dalam klaster besar node Linux milik Internet Archive.[12] Layanan ini secara berkala mengunjungi dan mengarsipkan versi baru situs web. Selain itu, situs web juga dapat ditangkap secara manual dengan memasukkan URL situs web ke dalam kotak pencarian, asalkan situs web tersebut mengizinkan Wayback Machine untuk melakukan "crawling" dan menyimpan datanya.[19] Pada tanggal 30 Oktober 2020, Wayback Machine mulai melakukan pemeriksaan fakta terhadap konten yang diarsipkan. Per Januari 2022, domain server iklan dikecualikan dari proses pengambilan data. Sebagai bagian dari perayaan ulang tahun ke-25 Internet Archive pada Mei 2021, Wayback Machine memperkenalkan "Wayforward Machine", sebuah fitur yang memungkinkan pengguna untuk "melakukan perjalanan ke internet pada tahun 2046, di mana pengetahuan berada di bawah ancaman".[20][21] Teknis pengarsipanPerangkat lunak yang mendasari Wayback Machine dirancang untuk melakukan "crawling" atau penjelajahan web secara otomatis, mengunduh seluruh informasi dan berkas data yang dapat diakses publik pada halaman web, melalui sistem hierarki Gopher, sistem papan buletin Netnews (Usenet), dan perangkat lunak bantuan lainnya..[22] Meskipun demikian, informasi yang dikumpulkan oleh program 'crawler' ini tidak mencakup seluruh konten yang ada di internet. Hal ini disebabkan oleh adanya pembatasan akses oleh penerbit atau penyimpanan data dalam basis data yang tidak dapat dijangkau. Untuk mengatasi inkonsistensi pada situs web yang hanya sebagian di-cache, Internet Archive mengembangkan Archive-It.org pada tahun 2005. Layanan ini memungkinkan institusi dan pembuat konten untuk secara sukarela mengumpulkan dan melestarikan koleksi konten digital serta membuat arsip digital.[23] Proses crawling ini didukung oleh berbagai sumber, termasuk kontribusi dari pihak ketiga dan yang dihasilkan secara internal oleh Internet Archive. Contohnya, kontribusi crawling berasal dari Sloan Foundation dan Alexa, crawling yang dijalankan oleh Internet Archive atas nama NARA dan Internet Memory Foundation, serta mirror dari Common Crawl. "Worldwide Web Crawls" telah berjalan sejak tahun 2010 dan bertujuan untuk menangkap keseluruhan web secara global.[24] The "Worldwide Web Crawls" have been running since 2010 and capture the global Web.[24][25] Pada September 2020, Internet Archive mengumumkan kemitraan dengan Cloudflare, sebuah penyedia layanan jaringan pengiriman konten asal Amerika, untuk secara otomatis mengindeks situs web yang dilayani melalui layanan "Always Online" mereka.[26] Dokumen dan sumber daya yang diarsipkan disimpan dengan URL yang menyertakan stempel waktu, seperti Frekuensi pengambilan snapshot bervariasi untuk setiap situs web. Situs web yang termasuk dalam "Worldwide Web Crawls" dimasukkan ke dalam "crawl list" dan diarsipkan satu kali per proses crawling. Durasi satu proses crawling dapat berlangsung selama beberapa bulan atau bahkan tahun, tergantung pada ukuran situs web. Sebagai contoh, "Wide Crawl Number 13" dimulai pada 9 Januari 2015 dan selesai pada 11 Juli 2016.[28] Namun, beberapa proses crawling dapat berjalan secara bersamaan, dan sebuah situs mungkin terdaftar dalam lebih dari satu daftar crawling, sehingga frekuensi crawling suatu situs dapat sangat bervariasi.[24] Fitur pengarsipan "Save Page Now" tersedia sejak Oktober 2013 dan dapat diakses di bagian kanan bawah halaman utama Wayback Machine.[29][30] Setelah URL target dimasukkan dan disimpan, halaman web tersebut akan menjadi bagian dari Wayback Machine.[31] Melalui alamat internet web.archive.org, pengguna dapat mengunggah berbagai jenis konten ke Wayback Machine, termasuk format berkas PDF dan kompresi data. Wayback Machine akan membuat URL lokal permanen untuk konten yang diunggah, yang dapat diakses di web meskipun tidak terdaftar saat melakukan pencarian di situs web resmi. Mulai Oktober 2019, pengguna dibatasi hingga 15 permintaan pengarsipan dan pengambilan per menit.[32] Referensi
Pranala luar
|
Portal di Ensiklopedia Dunia