用PHP與XML聯(lián)手進(jìn)行網(wǎng)站編程
一、小序
HTML簡單易學(xué)又通用,一般的PHP程序就是嵌入在HTML語言之中實(shí)現(xiàn)的。但是隨著WEB越來越廣泛的應(yīng)用,HTML的弱點(diǎn)也越來越明顯了。XML的出現(xiàn),彌補(bǔ)了這些不足,它提供了一個能夠處理互聯(lián)網(wǎng)上全部數(shù)據(jù)的通用方法。
二、HTML的局限性分析
1、 HTML的可擴(kuò)展性差。雖然作為一般的應(yīng)用,HTML應(yīng)經(jīng)夠用了,但是在處理數(shù)學(xué)和化學(xué)等符號時(shí),HTML有明顯的缺點(diǎn),而且它無法進(jìn)行擴(kuò)展,這樣使它的發(fā)展收到了極大的限制。
2、 鏈路丟失后不能自動糾正。由于Web頁面的URL地址經(jīng)常改變,而在改變URL地址時(shí)必須手工修改這些信息,否則就會遇到“404URL地址未找到”的信息,這大大加重了Web頁面的維護(hù)工作量。
3、 數(shù)據(jù)搜索的時(shí)間長。由于HTML主要用來對網(wǎng)頁的顯示進(jìn)行控制,導(dǎo)致了同一個數(shù)據(jù)在不同的網(wǎng)頁中有不同的存儲格式,這樣在進(jìn)行數(shù)據(jù)搜索時(shí)就無法快速找到所需的資料。
4、 HTML對雙字節(jié)或者多國文字的支持不夠。例如中文信息頁面在不同的平臺下會出現(xiàn)無法顯示等問題。
正是由于這些缺點(diǎn),人們研究了能夠代替HTML的Web頁面制作語言。其中已經(jīng)投入使用的有:可擴(kuò)展標(biāo)記語言XML、層疊樣式表(CSS)以及動態(tài)HTML(DHTML)等。
三、XML的組成
這里簡要列舉幾種主要的XML技術(shù):
1、 DTD(文檔類型聲明)
DTD的主要功能是定義XML的內(nèi)容模式;限制XML標(biāo)記的數(shù)據(jù)范圍;定義屬性的數(shù)據(jù)類型。但由于它不是用XML編寫的,因此擴(kuò)展性比較差;而且只提供了有限的幾種數(shù)據(jù)類型,因此它的作用是有限的。
2、 XML Schema
XML Schema的作用和DTD類似。但不同的是,Schema文件所描述的是引用它的XML文件中的元素和屬性的具體類型。另外,由于它是由XML編寫的,Schema和DTD相比較還有以下優(yōu)點(diǎn):
·XML Schema內(nèi)容模型是開放的,可以隨意擴(kuò)充,而DTD無法解析擴(kuò)充的內(nèi)容。
·DTD只能把內(nèi)容類型定義為一個字符串,而XML Schema允許把內(nèi)容類型定義為整型、浮點(diǎn)型、布爾型或者許多其它的簡單數(shù)據(jù)類型。
·XML Schema利用Namespaces將文檔中特殊的節(jié)點(diǎn)與Schema相聯(lián)系,一個XML文件可以有多個對應(yīng)的Schema,而一個XML文件只能有一個DTD。
3、 XLink
作為一種Web語言,XML的鏈接能力是非常重要的。XML的鏈接和定址機(jī)制包括XLink、XPath和XPointer。XLink提供功能強(qiáng)大的鏈接方法,可以在文檔之間建立單向或多向的復(fù)雜聯(lián)結(jié)關(guān)系,還有注釋鏈接、概要鏈接、擴(kuò)展鏈接集等多種鏈接功能。XPath在XSLT和XPointer中使用,支持在XML文檔中相對于節(jié)點(diǎn)和節(jié)點(diǎn)集的定位。XPointer在XPath的基礎(chǔ)上提供對XML文檔的內(nèi)容的內(nèi)部結(jié)構(gòu)(如一個字符串或者選擇的一個段落)的定位。XML的鏈接能力比HTML有了很大的增強(qiáng)。
4、 CSS與XSL
XML的一大特點(diǎn)就是內(nèi)容與格式分離,也就是說,XML文檔中并不包含如何顯示/表示文檔的信息。CSS與XSL(XML Style Language)解決了XML文檔的顯示問題。
CSS(層疊樣式表)也可以用在HTML和XML中。XSL完全使用XML的語法,功能比CSS要強(qiáng)大得多。
5、 DOM
文檔對象模型(DOM)是一個與平臺、語言無關(guān)的程序接口,它提供了動態(tài)訪問和更新文檔的內(nèi)容、結(jié)構(gòu)與風(fēng)格的手段。可以對文當(dāng)作進(jìn)一步的處理,并將處理的結(jié)果更新到表示頁面。
DOM的目標(biāo)就是為XML和HTML定義一個標(biāo)準(zhǔn)的編程接口,它包括核心、HTML和XML三部分。DOM的核心部分建立了一套底層的對象集,它們可以表示任何結(jié)構(gòu)化的文檔。HTML和XML提供了高層的接口,可以作為更方便的文檔視圖。DOM規(guī)范由對象和方法組成。程序員使用它們可以更容易地對特定類型的文檔進(jìn)行訪問和操作。
6、 Namespaces
Namespaces是用URL加以區(qū)別的、在XML文件的元素和屬性中出現(xiàn)的所有名稱的集合。在XML中,用戶可以自己定義標(biāo)記和元素。因此,如果把多個XML文件合并為一個,就很可能出現(xiàn)沖突。Namespaces則解決了這個問題。
四、PHP對XML的支持
PHP對XML提供了的強(qiáng)大的支持。它使用了一個XML的“解析器”,并且為了支持這個解析器,它提供了20(PHP4)個XML的解析函數(shù)。下面是幾個最常用的PHP解析函數(shù)。
1. xml_parse
boolean xml_parse(int parser, string data, int [isFinal]);
本函數(shù)用來解析 XML 格式的文件資料。參數(shù) parser 為解析代碼。參數(shù) data 為解析的資料區(qū)塊 (chunk)。參數(shù) isFinal 可省略,若設(shè)為 true 則系統(tǒng)會自動送出最后的資料部分 (piece) 給 data 參數(shù)。若無錯誤則返回 true 值。
2. xml_parser_create
int xml_parser_create(string [encoding]);
本函數(shù)用來初始化一個新的 XML 解析器。參數(shù) encoding 可省略,為 XML 使用的字符集,默認(rèn)值為 ISO-8859-1,其它尚有 US-ASCII、UTF-8 二種。成功則返回 parser 代碼供其它函數(shù)使用,失敗則返回 false 值。
3. xml_set_element_handler
boolean xml_set_element_handler(int parser, string startElementHandler, string endElementHandler);
本函數(shù)配置元素的標(biāo)頭供 xml_parse() 函數(shù)使用。參數(shù) parser 為解析代碼。參數(shù) startElementHandler 及 endElementHandler 分別為元素開始與結(jié)束的標(biāo)頭,其中的 startElementHandler 必須包括解析代碼、名稱、與屬性,而 endElementHandler 參數(shù)包括了解析代碼及名稱二個參數(shù)。若無錯誤則返回 true 值。
4. xml_set_character_data_handler
boolean xml_set_character_data_handler(int parser, string handler);
本函數(shù)配置字符資料的標(biāo)頭。參數(shù) parser 為解析代碼。參數(shù) handler 包括解析代碼及資料字符串等二個元素。若無錯誤則返回 true 值。
5. xml_get_error_code
int xml_get_error_code(int parser);
本函數(shù)可取得 XML 在處理時(shí)的錯誤代碼。參數(shù) parser 為解析代碼。若 parser 有錯則返回 false 值,否則就返回錯誤代碼 (如 XML_ERROR_BINARY_ENTITY_REF .... 等等)。
6. xml_error_string
string xml_error_string(int code);
本函數(shù)可取得 XML 在處理時(shí)的錯誤代碼。參數(shù) code 為解析錯誤代碼。若無錯誤返回值為代碼的文字描述字符串。
7. xml_get_current_line_number
int xml_get_current_line_number(int parser);
本函數(shù)用來取得目前 XML 解析所正在處理的行號。參數(shù) parser 為解析代碼。若 parser 有錯則返回 false 值,若無錯誤則返回行號數(shù)字。
8. xml_parser_free
boolean xml_parser_free(int parser);
本函數(shù)用來釋放目前 XML 解析所使用的內(nèi)存。參數(shù) parser 為解析代碼。若沒有錯誤則返回 true 值,否則返回 false 值。
五、案例解析
以下是用PHP5實(shí)現(xiàn)讀取一個以XML 1.0格式編寫的通訊錄address.xml,并顯示其內(nèi)容的示例。詳解見有關(guān)注釋。
<? // //第一部分:幾個PHP Helper函數(shù) //
/**********************************
*從一個文件中讀取XML的 * *內(nèi)容到字符串中 *
*********************************/
function read_file($filename){ //讀取文件 $lines=file($filename); //變量$contents是存放文件內(nèi)容的變量 $contents=''; while(list($key,$value)=each($lines)) {$contents.=$value; } return $contents;}
/**********************************當(dāng)PHP遇到一個XML的起始標(biāo)記時(shí) **調(diào)用,其作用是按照一定的層次 **顯示出XML的標(biāo)記 **********************************/
function start_element($parser, $name, $attrs){ //變量$depth存放標(biāo)記的深度 global $depth; //變量$spacer存放標(biāo)記前所有的箭頭符號 $spacer=''; for ($i=1;$i<$depth[$parser];$i++) {$spacer.='->'; } //設(shè)置標(biāo)記顯示時(shí)的顏色 if($depth[$parser]==0) {$font_color='red'; } elseif($depth[$parser]==1){ $font_color='green';} else {$font_color='blue'; } //設(shè)置標(biāo)記顯示時(shí)的字體 $font_size=5-$depth[$parser]; if ($font_size<2) {$font_size=2; } //顯示標(biāo)記 echo '<font size='.$font_size.' color='.$font_color.'>'; echo $spacer.$depth[$parser]; if ($depth[$parser]<>0) {echo '、'; } echo $name.'<BR>'; echo '</font>'; $depth[$parser]++; //如果是主標(biāo)記就顯示紅色的水平線 if($depth[$parser]==2) {echo '<hr color=red size=1>'; }}
/**********************************當(dāng)PHP遇到一個XML的結(jié)束標(biāo)記時(shí) **調(diào)用,其作用是改變當(dāng)前的層次 **計(jì)數(shù),并在主標(biāo)記下顯示水平線 **********************************/
function stop_element($parser,$name){ //變量$depth存放標(biāo)記的深度 global $depth; $depth[$parser]--; //如果是主標(biāo)記就顯示紅色的水平線 if($depth[$parser]==2) {echo '<hr color=red size=1>'; }}
/**********************************當(dāng)PHP遇到一個XML的標(biāo)記內(nèi)容時(shí) **調(diào)用,其作用是按照一定的層次 **顯示出標(biāo)記的內(nèi)容 **********************************/
function char_data($parser,$data){ //變量$depth存放標(biāo)記的深度 global $depth; //顯示標(biāo)記的內(nèi)容 $data=trim($data); if (strlen($data)) {for ($i=1;$i<$depth[$parser]+6;$i++) echo ' '; echo '<b>$data</b><br>n'; }}
////第二部分:PHP文件開始執(zhí)行處////要解析的XML文件的名字
$file='address.xml';//讀取文件$data=read_file($file);
// 產(chǎn)生解析器的實(shí)例$parser = xml_parser_create();// 設(shè)置處理函數(shù)xml_set_element_handler($parser, 'start_element', 'stop_element');xml_set_character_data_handler($parser, 'char_data');// 解析文件if(!xml_parse($parser,$data,1)){ //報(bào)錯 die(sprintf('XML error: %s at line %d', xml_error_string(xml_get_error_code($parser)), xml_get_current_line_number($parser)));}
// 釋放解析器xml_parser_free($parser);?>
