Web sayfaları gelecek nesiller için nasıl kaydedilir?

Sık sık kaybolan, taşınan veya içerikleri değişen web sayfalarını istediğiniz şekilde nasıl saklayabilir veya bir web arşivini nasıl kolayca bulabilirsiniz?

Web sayfalarını kalıcı olarak kaydetme veya silinen sitelerdeki içeriği bulma

Çevrimiçi olan her şeyin çevrimiçi kaldığına dair yaygın inanışın aksine, internet her şeyi hatırlamaz. Bu serinin bir önceki yazısında, çevrimiçi içeriğe erişiminizi kaybedebileceğiniz en az dokuz senaryoyu incelemiştik. Ayrıca, hangi bilgileri mutlaka (ve tercihen hızlı bir şekilde) bilgisayarınıza yedeklemeniz gerektiğine ve bunu nasıl yapacağınıza dair ayrıntılı bir kılavuz sunmuştuk. Bugün, web sayfalarını bilgisayarınıza nasıl kolayca kaydedebileceğinizi, bu arşivleri nasıl düzenleyebileceğinizi ve sevdiğiniz bir site yayından kalktığında ne yapmanız gerektiğini tartışacağız.

Yemek tarifi içeren bir blog gönderisini kaydetmek, araştırma makaleniz için bir kaynakça derlemek veya yasal amaçlarla belirli bir çevrimiçi yayını korumak istediğinizi varsayalım. Tüm bunlar web sayfaları olarak yayınlanmaktadır ve maalesef bu sayfalar, yanlış zamanda kaybolma eğilimindedir. 2005’teki müzik haberlerini ve dedikodularını yeniden okumak mı istiyorsunuz? Aradığınız sayfaları bulmak konusunda size iyi şanslar dilemekten başka bir şey yapamayız çünkü MTV News sitesi kapandı ve hiçbir makaleye veya röportaja artık ulaşılamıyor. Peki Wikipedia bağlantılarını kontrol ettiniz mi? Makale yayınlandığında çalışıyor olsalar bile, bunların %11’i hiçbir yere yönlendirmiyor. Çevrimiçi içeriğin kademeli olarak silinmesi veya yer değiştirmesine “bağlantı çürümesi” deniyor ve bu durum hızla büyük bir sorun haline geliyor. On yıl önce var olan sayfaların %38’ine bugün artık erişilemiyor. Dolayısıyla, beğendiğiniz veya ihtiyaç duyduğunuz bir web sayfası varsa, bir yedek oluşturmak akıllıca bir hareket olacaktır.

Bir web sayfasını bilgisayarınıza kaydetme

Bir web sayfası düzinelerce hatta yüzlerce dosyadan oluştuğu için yedeklenmesi biraz çaba gerektirecektir. İşte bunu yapmanın temel yolları:

Yalnızca metni bir HTML dosyası olarak kaydedin: Tarayıcınızda “Sayfayı farklı kaydet…” menü komutunu veya düğmesini seçin ve ardından “Web Sayfası, Sadece HTML” seçeneğini kullanın. Bu, herhangi bir grafik veya diğer göz alıcı unsurlar olmadan yalnızca web sayfasının metnini kaydedecektir.

Metin ve görselleri kaydedin: “Web Sayfası, Tamamı” seçeneği, bir HTML dosyasının yanı sıra, sayfadaki tüm grafik ögelerini, stilleri ve komut dosyalarını içeren aynı adlı bir klasör oluşturacaktır. Bu seçeneğin bir dezavantajı, çok sayıda yardımcı dosya kaydetmenin sürücünüzü kalabalıklaştırmasıdır. Bunun yanında web sayfasını ve tüm kaynaklarını tek bir .mhtml dosyasında toplayan “Web Sayfası, Tek Dosya” seçeneği daha kullanışlıdır ve Chrome ve Edge’de sorunsuz bir şekilde açılacaktır, ancak diğer tarayıcılarda sorunlar yaşanabilir. Bu seçenek tüm tarayıcılarda mevcut değildir, ancak SingleFile uzantısını yüklerseniz (çoğu tarayıcıda kullanılabilir), tüm web sayfasını ve medya içeriğini tüm modern tarayıcılarda mükemmel şekilde açılan tek bir HTML dosyası olarak kaydedebilirsiniz.

PDF olarak kaydedin: Sayfanın ana içeriğini korumak, ancak menüleri ve banner’ları atmak için en iyi seçeneğiniz PDF Olarak Kaydetmek‘tir. Ortaya çıkan dosya herhangi bir bilgisayarda açılacaktır.

Bu seçeneklerden hangisini kullanırsanız kullanın, belgeyi açtığınızda gerçekten saklamak istediğiniz ana metnin okunabilir olduğundan emin olun.

Bir web sayfasını kaydetmenin daha kolay bir yolu

Yukarıda açıklanan yöntemler biraz zaman alıcıdır ve sabit diskinizde kalabalıklığa neden olur. Daha fazla kolaylık için Pocket (eski adıyla Read It Later), wallabag veya Raindrop.io gibi özel bir hizmet kullanabilirsiniz. Hepsi aynı şekilde çalışır: Bir bağlantı gönderirsiniz, hizmet tüm resimleri içeren bir belge alır, sayfayı gereksiz unsurlardan temizler ve kişisel çevrimiçi depolama alanınıza kaydeder. Bu sayede orijinal sayfa silinse veya değiştirilse bile, istediğiniz sürüm arşivinizde kalacaktır. Bağlantılarınızı gruplandırmanıza ve sıralamanıza, içinde metin aramanıza ve kayıtlı sayfalarınızı herhangi bir cihazda görüntülemenize olanak tanıyan bu hizmetlerde, tüm büyük tarayıcılarda açılabilen bir masaüstü uzantısı ve mobil cihazlar için de bir uygulama mevcuttur.

Tüm bu hizmetler yalnızca premium abonelikle “sonsuz” bir arşiv sunar, yani bu kolaylık için ödeme yapmanız gerekir. Bununla birlikte, Wallabag açık kaynaklıdır; kendi sunucunuza kurabilir ve üçüncü taraf hizmetler için ödeme yapmanıza veya hizmetin kapatılması konusunda endişelenmenize gerek kalmaz.

Bazı not alma uygulamaları web sayfalarının tamamını da kaydedebilir. Bunlar arasında, “Web Clipper” adlı bir özellik sunan Evernote da yer alır.

Bir web sayfasını başkaları için kaydetme

İhtiyacınız olan sadece kendiniz için bir kopya değil, sayfanın belirli bir sürümünü başkalarıyla paylaşmaksa, genel bir arşivleme hizmetine ihtiyacınız olacaktır.

Bunlardan en bilineni Internet Archive (archive.org) ve onun Wayback Machine’idir. Diğer seçenekler arasında archive.today (diğer adıyla archive.is), perma.cc ve megalodon.jp sayılabilir. Bunlar benzer bir prensiple çalışırlar; kullanıcının isteği üzerine ya da otomatik olarak web sayfalarını ziyaret eder ve sunucularına bir kopyasını kaydederler.

Bir web sayfasının arşivlenmesini talep etmek için web.archive.org adresine gidin ve Save Page Now (Sayfayı Şimdi Kaydet) kutusuna tam adresi girin. Save (Kaydet) düğmesine tıkladıktan sonra sayfanın yüklenen tüm bileşenlerini açıklayan bir pencere görünür ve siteye korunmuş haliyle https://web.archive.org/web/20240918234814/https://www.kaspersky.com/blog şeklinde kalıcı bir bağlantı verilir. Bağlantı, arşivleme bakımından mükemmel bir kullanım sağlayarak, hem kaydedilen sayfanın adresini hem de tam kaydetme zamanını gösterir.

archive.org‘a kaydolmak, bu tür bağlantılardan oluşan bir koleksiyonu yönetmenize, kayıtlı sitelerin ekran görüntülerini almanıza ve bunların kopyalarını özel WACZ web arşivleme formatında indirmenize olanak tanır.

archive.org'da web sitelerinin daha önce kaydedilmiş sürümlerini görüntüleyebilir ve herhangi bir sitenin o anki versiyonunu kaydedebilirsiniz, örneğin blogumuz

archive.org’da web sitelerinin daha önce kaydedilmiş sürümlerini görüntüleyebilir ve herhangi bir sitenin o anki versiyonunu kaydedebilirsiniz, örneğin blogumuz

Arşiv bağlantısını açtığınızda, anlık görüntünün ne zaman alındığını gösteren bir zaman damgasıyla birlikte kaydedilmiş sayfayı görürsünüz. Bu özellik; fiyat dalgalanmaları, ürün açıklaması güncellemeleri, düzenlenen haber raporları ve silinen bilgiler gibi web sitesi verilerindeki değişiklikleri izlemek ve göstermek için oldukça kullanışlıdır. Sonuncusu, özellikle feshedilmiş web sitelerine dayanan tarih ve kültür araştırmacıları için önemlidir. Aşağıda; sosyal ağlardan çok önce “ana sayfalar” oluşturmanıza, kendinizi ifade etmenize ve ortak ilgi alanlarına sahip arkadaşlar bulmanıza olanak tanıyan, bir zamanların popüler web barındırma hizmeti GeoCities’in ilk sürümlerinden birine göz atabilirsiniz. Wayback Machine sayesinde 2016’da kapanan siteyi şu anda görebiliyoruz.

İnternet kıdemlilerine bir hediye: GeoCities.com'un en eski sürümlerinden biri

İnternet kıdemlilerine bir hediye: GeoCities.com’un en eski sürümlerinden biri

Silinen internet içeriği veya bir web sitesinin eski bir sürümü nasıl bulunur?

Herhangi bir web sitesinin eski bir sürümünü görüntülemek için:

  • archive.org adresini açın.
  • Logonun yanındaki kutuya web sitesinin tam adresini veya belirli bir sayfayı girin ve Enter’a basın. URL tam olarak bilinmiyorsa, web sitesinin adını veya onu iyi tanımlayan kelimeleri girebilirsiniz.
  • İstediğiniz web sitesini listeden seçin. Sonuçlar bir bakışta kaç kopyanın, hangi dönem için arşivlendiğini gösterir.
  • Sitenin kayıtlı kopyalarından hangisini görüntülemek istediğinizi seçmek için takvimi kullanın. Kaydedilmiş bir kopyanın bulunduğu tarihler daire içine alınmıştır. Daire ne kadar büyükse, o gün o kadar fazla kopya yapılmış demektir.
  • İstediğiniz tarihe tıklayıp kayıtlı siteyi inceleyin. Arşivden bir kopyanın yüklenmesinin birkaç dakika sürebileceğini unutmayın.
  • Site kopyasının üzerindeki takvim grafiği, daha eski ve daha yeni kopyalara gitmenizi sağlar.
web.archive.org adresindeki sitelerin eski sürümleri nasıl bulunur?

web.archive.org adresindeki sitelerin eski sürümleri nasıl bulunur?

Arama arayüzünü atlayarak doğrudan arşivlenmiş siteye erişmek için adres çubuğundan alınan kopyanın bağlantısını kopyalayabilirsiniz.

Ya archive.org yardımcı olamazsa?

Archive.org‘un arkasındaki vakıf bazen telif hakkı sahiplerinin ve diğer yetkili tarafların belirli siteleri Wayback Machine’den çıkarma taleplerine uymaktadır. Ayrıca, hizmet hiçbir zaman tüm interneti korumayı amaçlamamıştır, bu nedenle ihtiyacınız olan sayfa hiçbir zaman dizine eklenmemiş olabilir. Bu gibi durumlarda sayfayı, diğer zaman kapsüllerinde aramayı deneyin.

Archive.today (diğer adıyla archive.is) sayfaları otomatik olarak kaydetmez, yalnızca kullanıcıların isteği üzerine kaydeder. Diğer şeylerin yanı sıra, bu, arama robotları için talimatları (robots.txt) takip etme zorunluluğunu ortadan kaldırır ve arşivin Wayback Machine’de bulunmayan belgeleri içerdiği anlamına gelir.

Bir diğer önemli web-arşivleme projesi de dünyanın önde gelen kütüphanelerinden oluşan bir konsorsiyum tarafından geliştirilen perma.cc‘dir. Ancak bu proje yalnızca katılımcı kuruluşlar için ücretsizdir. Bireysel kullanıcılar, arşivlenen bağlantı sayısına göre fiyatlandırılan ücretli bir plana abone olabilirler.

Özel arşivlere güçlü bir alternatif de arama motorlarının önbelleğe aldığı içeriklerdir. Arama motorları herhangi bir web sayfasını indekslemek için metnini alır, böylece hemen hemen her sayfanın kaba ama okunabilir bir versiyonu bulunabilir. Uzun bir süre boyunca Google’ın önbelleği en erişilebilir olanıydı, ancak 2024’ün başlarında arama devi önbelleğine doğrudan bağlantıyı arama sonuçlarından kaldırdı. Hizmet hala çalışıyor, ancak doğrudan erişmek çok zor.

Bu nedenle, internet arşivleri ile çalışmayı kolaylaştıran tarayıcı eklentilerini kullanmak daha iyidir. Örneğin, bir bağlantı sizi silinmiş bir sayfaya veya yayından kaldırılmış bir web sitesine götürürse, Web Archives eklentisi sizi doğrudan web.archive.org, archive.today veya perma.cc adresindeki bu sayfanın arşivlenmiş bir kopyasına yönlendirir veya Google, Bing veya Yandex’ten önbelleğe alınmış bir sürümünü gösterir.

Diğer çevrimiçi hizmetlerden veri kaydetme

Web sayfalarının yanı sıra, fotoğraf albümleri ve notlardan sosyal ağlara kadar kaydetmek isteyebileceğiniz verileri içeren birçok başka çevrimiçi hizmet de vardır. Elbette, öneriler farklı veri türleri ve belirli hizmetler için değişiklik gösterir, ancak size kolaylık sağlamak için ilgili tüm talimatları “yedekleme” etiketi altında gruplandırdık. Yedekleme oluşturma hakkında bilgi almak için aşağıdaki blog yazılarımızı inceleyebilirsiniz:

Yedeklerinizi fidye yazılımlarına ve casus yazılımlara karşı korumayı unutmayın!

İpuçları