基于XML的移動終端網絡瀏覽方案
摘要:基于XML的移動終端網絡瀏覽方案是在傳統客戶/ 服務器瀏覽模式中插入中間層,中間層在后臺服務器上運行,接收客戶端服務請求,并與WEB 服務器通訊以獲取需要的HTML 文件。并按照規范過濾此文件,重新組織XML 格式的文件,通過無線網絡傳入客戶端。客戶端平臺采用嵌入式Linux,根據需要自由裁減,經XML 解析后,調用GUI 函數顯示網頁。
關鍵詞:嵌入式瀏覽器;移動終端;XML;解析器
引言
移動終端受移動性和便攜性的制約,CPU 主頻及計算能力較小,存儲器容量、顯示屏和輸入設備大小也受到限制。同時,無線數據網帶寬、連接可靠性及網絡可預測性相對較低, 網絡時延比有線網大。如果將移動終端通過無線方式直接接入Internet,技術實現有困難。近年業界提出:一是重寫現有Internet 協議,使其與現有協議兼容,讓移動設備透過微瀏覽器( Micro-Browser) 能通過無線網絡使用Internet 上所提供的針對WAP 特別定制的資訊及服務。另是將移動終端當作功能簡化的PC,并內置HTML 瀏覽器,雖可自由訪問現有網絡, 但由于現有Internet 網站網頁大量采用Flash、Shockwave 等技術,導致其體積龐大, 無線傳輸中耗時長,還要求移動終端具有較強運算能力,硬件投入較高。為此,對上述方式進行改進, 使其既可滿足無線網絡傳輸中數據量小的要求, 又可讓用戶獲取現有網絡上的絕大部分資源。
基于XML 的移動終端網絡瀏覽模型
模型概述
基于XML 的WEB 瀏覽方案是在傳統的客戶/服務器瀏覽模式中插入中間層。中間層接收客戶端的服務請求,并與WEB 服務器通訊以獲取所需要的HTML 文件,將此文件按一定規范進行過濾,去掉客戶端不需要的標簽及內容,重新組織成XML格式文件通過無線網絡傳送給客戶端。經由XML解析器以后,調用GUI 圖形接口函數將網頁顯示在用戶界面上??蛻舳藶g覽器的控制部分負責響應用戶的請求,并處理與用戶的交互。其結構如圖1。
在無線網絡瀏覽中使用XML 的優缺點
可擴展標記語言(XML: eXtensible MarkupLanguage) 是用來描述其它語言的元語言,定義了應用間傳遞數據的結構, 是能用任何編輯器讀取的文本。利用這種機制,程序員可制定底層數據交換的規范,并在此基礎上開發整個系統的各個模塊,模塊間傳輸符合既定規則的數據,適合計算機間傳送結構化數據。
每種瀏覽器內置的文檔解析器是最核心的部分之一,影響瀏覽器的運行效率和空間效率。由于XML 統一定義了其文檔解析器的標準接口規范――DOM( Document Object Model),即文檔對象模型,使得應用程序可按需選擇、更換合適的解析器,無須對程序本身做大的改動。在瀏覽模型中, 將HTML 解析等計算量大的任務交由中間層服務器完成, 客戶端進行較為簡單的XML 解析, 符合瘦客戶機/ 服務器的信息應用體系模式。當前使用XML 最大的問題是支持XML 的應用程序還不多, 許多具體應用還需要開發人員自行設計。
中間層實現的機制和原理
選擇VC++ 6.0 為中間層的集成開發環境,中間層運行在后臺服務器上, 采用模塊化的設計。每個模塊作為一個常規動態鏈接庫( Regular DLL )單元, 由后臺服務器需要時動態加載。
(1) 數個無線MODEM通過多串口卡連接在后臺服務器上構成無線MODEM 池,為多個移動終端用戶提供服務??蛻舳伺c服務器建立連接時, 先申請MODEM 池中的空閑資源并建立與后臺服務器連接, 發送客戶端瀏覽器服務請求,任務完成后釋放MODEM 資源。如沒有可用資源,等待一定時間后重新申請。
(2) 后臺服務器通過有線網絡接入Internet,使用標準WWW 協議棧(HTTP、TCP/IP 等)。與WEB 服務器通訊時主要使用CInternetSession,CHttpConnection 和ChttpFile 等3 個MFC 類。核心代碼如下:
C I n t e r n e t S e s s i o n s e s s i o n ;
C H t t p C o n n e c t i o n * p S e r v e r = N U L L ;
C H t t p F i l e * p F i l e = N U L L ;
AfxParseURL(pURL,…);
初始化完成后, 將客戶端的服務請求轉化為標準統一資源定位符( URL : Uniform ResourceLocator ), 并調用全局函數AfxParseURL 分析映射此URL。
pServer = session.GetHttpConnection();
pFile = pServer->OpenRequest();
pFile->AddRequestHeaders();
pFile->SendRequest();
打開客戶端請求特定HTTP 連接,向WEB 服務器發送相應HTTP 請求消息。
pFile->ReadString();
WEB 服務器返回響應消息, 調用CHttpFile類ReadString 函數取得返回數據, 完成與WEB 服務器通訊。
(3) 選擇Dillo project 瀏覽器中的解析引擎作為解析過濾和組裝模塊的核心, 流程如圖2。
HTML 解析部分對輸入的HTML 數據流按HTML 語法特點逐字符分解成三類:
① Space 數據類型: 所有ASCII 碼值在0x09- 0x0d 或0x20 的字符代表空格或占位信息。經Space_proces 部分處理,以確定其長度。為保持HTML 排版格式基本不變,此類數據全部保存在生成的XML 文件中。
② Tag 數據類型: 表示HTML 數據流中的所有標簽。由于HTML 語法規則的限制,必須檢查標簽的有效性,例如input> 標簽必須存在于form>標簽之中。為此建立一堆棧存放標簽信息,堆棧中的所有元素構成了當前HTML 文本處的現場信息。遇到新標簽,首先按照HTML 語法規則將新標簽與當前狀態信息進行比較,確認有效后,將當前標簽信息( 包括標簽名及屬性)入棧,在標簽結束處將此信息出棧,此過程由Tag_process 部分完成。同時建立一數組保存需要保留的標簽名, 數組具體元素可根據用戶需要進行增減。將每個經檢驗有效的標簽與數組中元素進行逐個對比以確定標簽是否加入XML 文件中,通過這樣的篩選, 來減小無線傳輸量。
③ Word 數據類型:需要顯示的文本信息。此部分信息經Word_process 處理后,全部加入到XML 文件中。
④ 最后將XML 文件通過無線網絡傳輸給客戶端瀏覽器。由于無線通訊環境數據傳輸的不確定性和不穩定性,定義了HTML 轉換模塊通訊子模塊-PDA:
協議格式:FramHead(0x01)+ASCII 數據長度( 6bytes) 指令+ 空格+ ASICII 數據+ FramTail(0x02)
支持指令OK FAIL
其中第一個字段表示數據幀頭第二個字段表示數據總長度以10 進制表示最大不超過999999字節指令字段表示中間層服務器工作狀態成功則返回OK 最后為幀尾通過檢驗幀頭和幀尾來確定數據傳輸的完整性和準確性。
經測試經過中間層過濾掉Java Script 和一些動態圖片并保留了網頁的主要信息前提下網頁體積只有原來的10%左右適宜在GSM 等低速無線網絡上傳輸。
客戶端瀏覽器的實現機制
客戶端平臺采用嵌入式Linux 工作流程如下
(1) 瀏覽器啟動后首先初始化XmlBrowser結構此結構包括瀏覽器當前URL 顯示結構入口指針及保存已瀏覽的歷史URL 成員結構體等初始化后通過客戶端通訊模塊向中間層發送請求消息其通訊子模塊中間層服務器通訊子模塊格式如下:
協議格式FramHead(0x01) 總長度(4bytes)指令空格URL 字符串? [POST DATA]
FramTail(0x02)支持指令GET POST HEAD前兩個字段分別表示幀頭和數據長度后四個字段遵循HTTP 協議支持標準HTTP 三種指令最后為幀尾。
(2) 瀏覽器收到中間層返回數據后先檢驗數傳中無數據丟失后將此XML 數據流送入XML解析器選擇可為Gnome Linux 主要窗口管理環境之一提供XML 支持的XML Library 中的XML解析器它遵循標準DOM 接口可將DOM 看作標準的連接文檔和應用程序或腳本語言的結構體系其提供給用戶一個接口以裝載定位操作和序列化XML 文檔基于DOM 的XML 解析器將XML 文檔轉換成對象模型的集合通常為樹狀結構通過遍歷整棵樹來訪問XML 文檔任意處的內容和結構信息。
(3) 從XML 解析到XML 文本的顯示步驟
從流程圖圖3 可見底層GUI 接口調用和上層顯示模塊是分開的顯示模塊完成對全部具體元素的顯示信息的計算后向底層GUI 接口形函數發出服務請求底層GUI 對服務請求進行響應完成屏幕繪制采用該結構應用程序開發員無需了解底層圖形引擎的實現機理和技術細節只要保持兩者間的接口不變系統底層圖形函數庫的升級將不會影響現有軟件。
進入顯示的DOM 數據流元素分為兩類一類是在屏幕顯示區域上顯示的對象如輸入框input> 鏈接a>和文本等元素另類為Container容器如表格行tr> 表格單元td> 等元素不顯示在屏幕上每個顯示對象都處在特定Container中以此來確定它與其它顯示對象間的相對位置關系整個屏幕顯示區域視為最外層的容器包含了實際顯示對象和下層容器以此類推構成了整個顯示結構顯示結構完成后計算每個元素的實際顯示位置通過遍歷整個顯示結構依據顯示區域長寬計算每個顯示對象的坐標超出顯示區域長度的部分使用滾動條來訪問。
(4) 瀏覽器與用戶交互的管理
該管理由瀏覽器的虛擬控制器完成瀏覽器的整個屏幕除了頁面顯示區域外還分為滾動條和系統區域系統區域上為用戶提供了一些定制的功能如前進后退頁面刷新等通過點擊滾動條區域可以上下移動屏幕。
結束語
基于XML 的移動終端網絡瀏覽方案既考慮到現有網絡數據結構以HTML 為主的現狀又可滿足未來網絡向XML 方向發展的趨勢并已在我所自行研發的移動終端上運行成功滿足了流動性很強的特殊行業對信息瀏覽和查詢的需要。
評論