新聞中心

        EEPW首頁 > 手機與無線通信 > 設計應用 > 深入剖析減少每次同步數據量的6個方法

        深入剖析減少每次同步數據量的6個方法

        作者: 時間:2017-06-13 來源:網絡 收藏
        說到,大最為較關心的就是如何盡可能地減少每次的量,以此來提高同步效率,降低對網絡帶寬的消耗。針對大批量的數據同步,這一點是必須注意的。解決這個問題的關鍵點在于獲取差異數據,這也就是說,我們僅僅同步變化了的數據,至于沒有變化的,就不再同步。下文中,我們將介紹減少每次量的6個方法:

        1.日期欄位(時間戳)

        一般情況下,在設計表的時候,添加兩個日期欄位,CreatedOn, ChangedOn, 分別記錄數據產生時間和變更時間。同步程序可以根據兩個欄位來獲取差異的數據。

        2.Trigger

        它可以實時獲取差異數據, Trigger使用較為容易,不需要改變原表的結構,可以只監視部分的欄位變更,以獲取你需要的變化數據,并對數據做二次處理。Trigger需要你對源表的維護狀況比較了解,否則可能產生一些意想不到的影響。

        3.SQLServer本身的復制服務

        本身支持多種數據同步方式,功能很強大,但是使用上會比較復雜,而且如果在同步過程中,需要對差異數據做二次處理,似乎無路可走。

        這種方法可以保證隨時獲取某個時間段內新增(變化)的數據,同時對于追蹤問題也大有裨益。但是缺陷也不少,其一是這兩個欄位完全由開發人員控制,切實保證這兩個欄位每次都得到正確的維護比較困難,其二是不容易確定你下一次取差異數據的基準時間。

        4.timestamp欄位

        timestamp可以理解為行的版本號,每次插入或更新包含 timestamp 列的行時,timestamp 列中的值均會更新。利用這一特性,建立一個包含源表ID和timestamp值的基準表,就可以找到哪些數據發生變化了,每次同步成功后,再更新該基準表。

        5.監控并記錄基于某數據對象的所有DML語句

        這種方法,我沒有具體嘗試過,但是一個很不錯的思路,如果網絡狀況糟糕,而且對數據實時性要求不高,可以采用。具體做法是每天定時獲取你需要同步表的所有update, delete語句,然后定點打包發送到另外一臺服務器執行。

        6.使用BINARY_CHECKSUM

        這個是我認為最簡單的方法。BINARY_CHECKSUM是SQLServer內置的一個聚合函數,它可以針對一行,或者某些列計算出一個值,如果它計算的那些列中的任何一個值發生變化,那么那個計算值就會發生變化。這樣我只要建立一個包含源表ID和最初計算值的基準表,就可以找到哪些數據發生變化了,每次同步成功后,再更新該基準表。與方法4不同的是,BINARY_CHECKSUM可以只監視部分變化的欄位,這一點又類似于Trigger了。

        使用BINARY_CHECKSUM有些限制,因為它在計算中會忽略具有不可比數據類型的列(不可比數據類型是 text、ntext、image、cursor 以及基本類型為前4個數據類型之一的 sql_variant),所以如果要監控這些列變化,這種方法是不起作用的。


        關鍵詞: 同步數據

        評論


        技術專區

        關閉
        主站蜘蛛池模板: 灯塔市| 苗栗县| 东乌珠穆沁旗| 尤溪县| 孙吴县| 平江县| 定边县| 贺兰县| 忻州市| 得荣县| 曲靖市| 油尖旺区| 扎鲁特旗| 涟水县| 榆社县| 通榆县| 定兴县| 阜康市| 简阳市| 菏泽市| 崇文区| 桃源县| 延寿县| 阿拉尔市| 犍为县| 巴林右旗| 昆明市| 行唐县| 苍山县| 汉中市| 本溪市| 鄂州市| 冕宁县| 清河县| 醴陵市| 防城港市| 尼木县| 班玛县| 斗六市| 永宁县| 平凉市|