Microsoft’un 2012 yılında çıkarmayı planladığı sunucu işletim sistemlerinden Windows Server 8 ve üzerinde bulunan yenilkler ile sistem yöneticilerine yönetim kolaylıkları sağlayanacaktır. Gelen yeniliklerin başında bulut bilişime uyumluluğu, Hyper-V 3.0, Metro User Interface, Network Virtualization, VHDX sanal disk formatı, Storage Live Migration,kolay Direct Access kurulumu, geliştirilmiş BranchCache ve Data Deduplication gibi özellikleri sayılabilir.
Data Deduplication(Veri tekilleştirme) özelliği ile Windows Server 8 NTFS dosya sistemi yönetimine yeni bir boyut getirmiştir. Veri tekilleştirme özelliği ile sistem yöneticileri kurumlardaki ve kuruluşlarındaki NTFS ile yapılandırılmış olan depolama ünitellerinde ve yedeklemelerde ciddi bir tasarruf sağlayacaktır. Data Deduplication özelliği ile daha efektif kullanılan depolama üniteleri buna bağlı olarak depolama birimlarine yapılan maliyette düşüşler, daha hızlı yedekleme yine buna bağlı olarak yedekleme sürelerindeki azalış gibi birçok avantajı vardır.
Basit bir dille Deduplication özelliği ile veriler sabit ya da değişken parçalara bölünerek yedeklenme işleminin yapılmasıdır. Birebir aynısı bulunan verilerin tek kopyaları tutularak, gerçek veriler içinde linkler oluşturulur. Windows Server 8 üzerine de bu veri tekilleştirmesini sağlayacak bir motor entegre edilmiş durumdadır. Ancak bu veri tekilleştirmesinin verimli bir şekilde çalışması için volume’lerin NTFS dosya sistemi ile yapılandırılmış olması gerekmektedir. Windows server’de Data Deduplication özelliği çeşitli yollarla yapılabilir bir şekilde yapılandırılmıştır. Ayrıca işlem sonrası da veri tekilleştirimesi yapacak şekilde ve PowerShell komutları ile de volume seviyesinde yönetilmesi söz konusudur.
Dosya tabanlı olan veri tekilleştirmenin temeli 32 KB ile 128 KB arasında değişen yığınların(chunk) oluşturulmasıdır. Windows tarafından yönetilen bu yığınlar(chunk) diskin System Volume bilgisinde saklanır ve bu yığınlarda yinelenen dataların kopyaları bulunmaktadır. Tekilleşme motoru böylelikle arka planda görevini yerine getirmiş olur.
Şekilde de görüldüğü üzere File1 ve File2 dosyalarında bulunan A, B,C blokları tekilleştirilme sürecinde kullanıcak verileri temsil etmektedir. Tekilleştirme motoru aktif hale geldiğinde tekilleştirilme süresinde kullanılacak yığın bloklarına A,B,C veri blokları kopyalanır. Bu alandaki dosya verileri benzersiz veri bölgesi (sparse) ve tekilleştirilmiş veri bölgesi(reparse) diye iki sınıfa ayrılır. Tekilleştirilmiş veri bölgesi sayesinde yığın bloklarında bulunan ortak verilere ulaşılır.
Daha önceden de bahsedildiği üzere Windows zamanlanmış görevler dışında veri tekilleştirilmesi çeşitli PowerShell komutları ile volume seviyesinde interaktif bir şekilde yönetilebilir. Bu sayede verimli bir şekilde volume tekilleştirilme süreci ve yığın deposu yönetimi sağlanır.
Veri Tekilleştirilmesi ile İlgili Bilinmesi Gereken Özellikler
Bir dosyanın tamamen tekilleştirimesi sürecinde gerekli metadata bilgilerinin tutulması ve yığın bölgesi (tekilleştirilmiş dosyaların tutulduğu)bilgilerinin tutulduğu tekilleştirilme veri bölgesini tutulması için sistem 4KB’lık alan kullanır.
Boot ve sistem sürücüleri üzerinde bu özellikler aktif hale getirilemez.
Volume seviyesinde çalışıyor olması ile beraber NTFS dosya sistemi ile formatlanmış sürücüler üzerinde uygulanabilir. Ayrıca şifrelenmiş dosyalar üzerinde bu işlem gerçekleşirilemez.
Hyper-V yapılarında desteklenir ancak Cluster Shared Volume yapısında çalışan Hyper-V’lerde veri tekilleştirilmesi etkinleştirilemez.
Veri tekilleştirilmesi yapılandırılmasının ardından arka planda çalışmaktadır ancak istenildiği takdirde zamanlandırılmış görevlerle de çalışması söz konusudur.
Data Deduplication (Veri Tekilleştirilmesi) Yapılandırılması
Data Deduplication özelliği grafiksel arayüzden gerçekleştirilebilineceği gibi PowerShell komutlarından da yönetimi söz konusudur. GUI arayüzünü kullanarak bu özelliğin aktif hale gelmesi istenirse gerekli rollerin ve özelliklerin yüklendiği Server Manager arayüzü kullanılır.
GUI (Graphical user interface) ile Data Deduplication Özelliğinin Yapılandırılması
Server Manager konsolunun açılmasının ardından gerekli rollerin yapılandırıldığı Dashboard bölümünden “add roles” seçeneği ile ya da Manage bölümünden “Add Roles and Features”işaretlenerek gerekli kuruluma başlanılır.
“Select Installation Type” arayüzünde “Role based or feature based Installation” ve “Scenario-based ınstallation” olmak üzere iki çeşit yükleme tipi kullanıcıyı karşılar. “Role based or feature based Installation” özelliği seçilen role ya da özelliğe göre sunucuyu yapılandırılmaya, “Scenario-based ınstallation” ise senaryo temelli bir yükleme olup, bu yükleme tipi domain ortamında kullanmaya ve Remote Desktop Services yapılarında kullanılır. “Role based or feature based Installation” seçeneği ile kuruluma devam edilir.
“Select Destination Server” arayüzünde Datadeduplication özelliğinin kurulacağı sunucu ya da sunucuların belirlendiği bölümdür. Bilgeadam adındaki sunucu seçildikten sonra “Next” seçeneği ile devam edilir.
“Select Server Role” ise Data Deduplication için gerekli rolün seçildiği arayüzdür. Data Deduplication özelliği dosya tabanlı bir uygulama olmasından dolayıdır ki rollerden File Services rolü seçilir.”Next” seçeneği ile devam edilir.
“Fıle Services ” arayüzünde File Services’in tanıtıldığı bir açıklama ekranı bulunmaktadır. ”Next” seçeneği ile devam edilir.
“Select Role Services” arayüzünde File Services rolünün içerisinde bulunan servisler görülmektedir. Data Deduplication servisi seçilerek Next seçeneği ile devam edilir.
“Confirm installation selections” arayüzünde ise yapılan ayarların onaylandığı kısımdır. “Restart each destination server automatically if required” seçeneği kurulum sonrası makinenin yeniden başlatılması gerektiğinde bu işlemi otomatik olarak gerçekleştirilmesini sağlar.”Commit” seçeneği ile kurulum başlanır.
Gerekli kurulumun yapılmasının ardından Server manager arayüzünden File Services rolü açılır. Bu arayüzde File Services içerisindeki menüler görüntülenir.Data Deduplication için File Services rolündeki Volumes bölümünde sunucu üzerindeki sürücülerin görüntülenmesi sağlanır. Volumes bölümünde Data deduplication özelliğini hangi volume üzerinde gerçekleştirileceği seçilir.
Data Deduplication yapılacak sürücünün üzerine gelinip sağ tuş tıklandığında bu sürücü üzerinde yapılacak silme ,tarama, paylaşma,veri tekilleştirilme, genişletme seçeneklerinin bulunduğu bir menü gelecektir. “Configure Deduplication” seçeneği ile veri tekilleştirilmesinin konfigürasyonuna başlanılır.
Data Deduplication arayüzünde “Enable Data Deduplication on this volume” seçeneği ile veri tekilleştirilmesi aktif hale getirilir. “Deduplicate files order than (in days)”seçeneği ile kaç günden önceki dosyalar için veri tekillştirilme işleminin yapılacağı ayarlanır.” Folders to exclude” veri tekilleştirilmesinden işleminden etkilenmesi istenilmeyen sürücü içerisindeki dosyaların seçilme işlemi gerçekleştirilir. “Folder extensions to exclude” seçeneği ise belirlenen dosya uzantılarının haricindeki dosyalara bu işlemin uygulanacağının belirlendiği bölümdür. Gerekli ayarlamaların yapılmasının ardından Apply seçeneğinin seçilmesi ile Data Deduplication işlemi tamamlanmış olur.
PowerShell 3.0 arayüzünü kullanarak Data Deduplication Özelliğinin Yapılandırılması
PowerShell arayüzünde belirli komutların kullanılması ile de Data Deduplication özelliğinin yapılandırılması gerçekleştirilebilir. “HELP DEDUP” komutu ile veri tekilleştirilme işlemi için kullanılabilinecek komutların listesi görüntülenmektedir. Bu komutların görüntülenme işlemi “Get-Command –Module Deduplication” komutu ile de sağlanır.
Veri tekilleştirme işlemini aktifleştirmek için “Import-Module Deduplication” komutu kullanılır.
Veri tekilleştirilme İşleminin hangi sürücü üzerinde aktif hale getirileceğinin belirlenmesi için ise “Enable-DedupVolume E: (Bu komuttaki E hangi volume ise onun harfini göstermektedir)” komutu kullanılır.
Gerekli volume etkinleştirildikten sonra veri tekilleştirme işlemini tetikleme işlemi gerçekleştirilir. Bunun için “Start-DedupJob –Type Optimization –Volume E:” komutu kullanılmaktadır. U komut ile beraber sunucumuzda varolan E diskinin disk optimizasyonu modunda data deduplication işlemi tetiklenmiş olunur.
Bu işlemden sonra veri tekilleştirme ile genel durumun(hangi oranda tamamlandığını ya da hangi sürücü üzerinde aktif halde olduğunu) görüntülenmesi sağlanabilir. Bunun gerekli olan “Get-DedupVolume” komutudur.
“Get-DedupMetadata” komutu ile volume’lere ait metadata bilgisinin alınma işlemi ile detaylı bir bilgi alınması sağlanır.
Windows Server 8 üzerinde hali hazırda varolan tekilleştirme işlemlerine ait zaman görevlerinin alınma işlemi için “Get-DedupSchedule” komutu kullanılır. İsteğe bağlı olarak “New-DedupSchedule” komutu kullanılarak spesifik bir zamanlanmış görevler oluşturulabilir.
Bir volume üzerine daha önceden yapılan veri tekilleştirilmesinin durum güncelleşmesini yapmak ve yapılan güncelemeden sonraki durumun görüntülenebilmesi için kullanılacak komut “Update-DedupStatus –Volume E:”dır.
Son olarak “Disable-Dedup Volume ” komutu ile Data Deduplication özelliği pasif hale getirilir.