Linux 網絡文件系統的數據備份及恢復機制實現
while(!rqstp->rq_copy->done){
本文引用地址:http://www.104case.com/article/201609/304200.htmschedule_timeout((HZ+99)/100);
……
}
}
該文件是在 nfs 服務器端執行 nfs 客戶機發送過來的修改文件或者是目錄的原函數。在這里,我們可以通過添加自己的代碼,來將創建的目錄和文件名存入一個磁盤文件當中,以備后面的備份和恢復操作。
圖 6 NFS 文件細粒度恢復日志產生示意圖

獲得了操作日志信息,然后就可以進行精確恢復和選擇性恢復時。首先由用戶利用數據查詢、瀏覽工具確定需要恢復的文件操作集,然后利用相應的日志數據按記錄產生順序逐條生成恢復請求,發送給文件服務器端的代理程序,由它通過 proc 文件請求 NFS 文件系統恢復模塊進行恢復,恢復模塊收到請求后,取出相關數據,然后通過調用底層 ext3 文件系統基本操作完成該次文件操作的”重放”,最后返回執行結果,通過 proc 文件通知代理程序,代理程序再通知管理端,管理端再發送下一條恢復請求,及到所有選中的操作全完成為止。具體實現模式請參看圖 7:
圖 7 恢復流程示意圖

數據快速同步技術
在系統中,各文件服務器之間的數據需要及時同步更新,這樣才能保證服務遷移后到新的環境后相關數據環境的一致性,從而保證服務遷移在語義上的正確性。在本方案中,每個文件服務器均采用 NFSv3 協議向外提供文件服務,當系統開始工作時,管理員會指定一臺主服務器,由該服務器負責向外提供服務,其他文件服務器為備份服務器,接收同步數據,進行數據的同步更新,并不對外提供服務,只有當系統決定遷移后,選定的遷移目標對應的文件服務器才成為主文件服務器。
由于主文件服務器負責對外的文件服務,因此,數據同步的發起者應該是主文件服務器,而所有的備份服務器均為被動的同步數據接收者。因此,數據的快速同步包含兩方面的工作:主文件服務器產生同步數據和備份文件服務器接收同步數據完成同步。具體的數據流向如圖 8 所示:
圖 8 同步數據的產生與流動示意圖

為了達到數據快速同步的目的,我們采用了記錄文件寫操作(包括創建、修改、刪除、改名、屬性修改等所有的改變文件或目錄屬性、內容的操作)的具體參數的方法來生成同步數據,這樣每次生成的數據量比較少,而且可以滿足及時更新的目的。同步數據的格式及相關代碼段如下:
struct Log {
int length; //整個數據包的長度
int ops; //操作的類型
char* data; //與操作相關數據
};
//下面代碼段從內核將同步數據包發往其他文件服務器
long send(struct socket* sock, void * buff,size_t len)
{
int err;
mm_segment_t oldfs;
struct msghdr msg;
struct iovec iov;
static int total = 0;
down(log_sem);
iov.iov_base=buff;
iov.iov_len=len;
msg.msg_name=NULL;
msg.msg_iov=iov;
msg.msg_iovlen=1;
msg.msg_control=NULL;
msg.msg_controllen=0;
msg.msg_namelen=0;
total += len;
msg.msg_flags = MSG_SYN;//DONTWAIT;
oldfs=get_fs();
set_fs(KERNEL_DS);
err = sock_sendmsg(sock, msg, len);
set_fs(oldfs);
if(err0){
dprintk(send err(errNo=%d len = %d)n,err,len);
netbroken = 1;
}
……
up(log_sem);
return(err);
}
同步數據產生后,先放入一個緩沖區中,而不是立即發送到備份文件服務器,這樣可以較大程度改善系統的總體性能。緩沖區中的數據由同步管理進程管理,當達到一定數據量時,同步管理程序負責把緩沖區中的數據發送到備份文件服務器上,并根據返回的應答結果決定是否需要把重發數據,當確認某個服務器無法響應后,自動把同步數據定期寫入一個僅可追加的文件,以便于隨后可能需要的恢復階段同步的需要,當這個寫入的文件數據量超出一定限制時,并且系統確認已經至少有一個新的版本生成,可以把該文件清空。
當數據到達備份文件服務器時,由獨立的接收進程負責把數據放入接收緩沖區,經核對數據無誤后給主服務器發送確認信號,另一個獨立進程即更新管理進程把接收緩沖區作為輸入,從中解析出一個個的順序的操作日志,從每個日志中得到操作類型,然后在剩余的數據中按照特定的操作類型提取所需的參數,利用文件系統調用完成相應操作。
總結
Linux 網絡文件系統已經為企業在數據備份和共享領域得到了廣泛應用。如何保證其多版本備份、實時恢復是一個非常關鍵的問題,本文將詳細介紹針對該網絡文件系統的數據備份、恢復及同步機制在內核的具體實現,給廣大系統管理員和研發人員提供技術參考。
評論