av一区二区在线观看_亚洲男人的天堂网站_日韩亚洲视频_在线成人免费_欧美日韩精品免费观看视频_久草视

您的位置:首頁技術文章
文章詳情頁

用PHP自動把純文本轉換成Web頁面

瀏覽:53日期:2024-02-12 15:57:10

最近,我的一個老朋友向我打電話求助。他從事記者的職業有多年了,最近獲得了重新出版他的很多早期專欄的權利。他希望把他的作品貼在Web上;但是他的專欄都是以純文本文件的形式保存的,而且他既沒有時間也不想去為了把它們轉換成為Web頁面而學習HTML的知識。由于我是他電話本里唯一一個精通計算機的人,所以他打電話給我看我是否能夠幫幫他。

“讓我來處理吧,”我說:“一個小時以后再給我打電話。”當然了,當他幾個小時以后打電話過來,我已經為他準備好了解決的方法。這需要用到一點點PHP,而我收獲了他沒完沒了的感謝和一箱紅酒。

那么我在這一個小時里做了些什么呢?這就是本篇文章的內容。我將告訴你如何使用PHP來快速將純ASCII文本完美地轉換成為可讀的HTML標記。

首先讓我們來看一個我朋友希望轉換的純文本文件的例子:

Green for Mars!

John R. Doe

The idea of little green men from Mars, long a staple of science fiction, may soon turn out to be less fantasy and more fact.

Recent samples sent by the latest Mars exploration team indicate a high presence of chlorophyll in the atmosphere. Chlorophyll, you will recall, is what makes plants green. It's quite likely, therefore, that organisms on Mars will have, through continued exposure to the green stuff, developed a greenish tinge on their outer exoskeleton.

An interview with Dr. Rushel Bunter, the head of ASDA's Mars Colonization Project blah blah...

What does this mean for you? Well, it means blah blahblah...

Track follow-ups to this story online at http://www.mars-connect.dom/. To see pictures of the latest samples, log on to http://www.asdamcp.dom/galleries/220/

相當標準的文本:它有一個標題、一個署名和很多段的文字。把這篇文檔轉換成為HTML真正需要做的是使用HTML的分行和分段標記把原文的布局保留在Web頁面上。特殊的標點符號需要被轉換成為對應的HTML符號,超鏈接需要變得可以點擊。

下面的PHP代碼(列表A)就會完成上面所有的任務:

列表A

讓我們來看看它是如何工作的:

以下是引用片段:<?php // set source file name and path $source = 'toi200686.txt';

// read raw text as array $raw = file($source) or die('Cannot read file');

// retrieve first and second lines (title and author) $slug = array_shift($raw); $byline = array_shift($raw);

// join remaining data into string $data = join('', $raw);

// replace special characters with HTML entities // replace line breaks with <br /> $html = nl2br(htmlspecialchars($data));

// replace multiple spaces with single spaces $html = preg_replace('/ss+/', ' ', $html);

// replace URLs with <a href...> elements $html = preg_replace('/s(w+://)(S+)/', ' <a href='http://m.4tl426be.cn/bcjs/21836.html' target='_blank'></a>', $html);

// start building output page // add page header $output =<<< HEADER <html> <head> <style> .slug {font-size: 15pt; font-weight: bold} .byline { font-style: italic } </style> </head> <body> HEADER;

// add page content $output .= '<div class='slug'>$slug</div>'; $output .= '<div class='byline'>By $byline</div><p />'; $output .= '<div>$html</div>';

// add page footer $output .=<<< FOOTER </body> </html> FOOTER;

// display in browser echo $output;

// AND/OR;

// write output to a new .html file file_put_contents(basename($source, substr($source, strpos($source, '.'))) . '.html', $output) or die('Cannot write file'); ?>

第一步是把純ASCII文件讀取到一個PHP數組里。這通過file()函數很容易就可以完成,這個函數會把文件的每一行都轉換成為一個用數字索引的數組中的元素。

然后,標題和作者行(我假設這兩個都是文件的前兩行)都通過array_shift()函數從數組里提取出來,放到單獨的變量里。數組剩下的成員然后被連接成一個字符串。這個字符串現在就包括了整篇文章的正文。

文章正文里像“'”、“<”和“>”這樣的特殊符號通過htmlspecialchars()函數被轉換成相應的HTML符號。為了保留文章的原始格式,分行和分段通過nl2br()函數被轉換成HTML的元素。文章中間多個空格通過簡單的字符串替換被壓縮成為一個空格。

文章正文里的URL用正則表達式來檢測,兩邊是元素。當頁面在Web瀏覽器里顯示的時候,它會把URL轉換成為可點擊的超鏈接。

然后用標準的HTML規則創建輸出的HTML頁面。文章的標題、作者和正文都用CSS樣式規則格式化。盡管這段腳本沒有這樣做,但是你可以在這個地方自定義最終頁面的外觀,你可以向模板添加圖形元素、顏色或者其他眩目的內容。

一旦HTML頁面構建完成,它就可以被送到瀏覽器或者用file_put_contents()保存為靜態文件。要注意的是,在保存的時候,原來的文件名會被分解,一個新的文件名(叫做filename.html)會為新創建的Web頁面創建。你然后就可以把這個Web頁面發布到Web服務器上、保存到光盤上或者對它進行進一步編輯。

注意:在使用這個腳本創建和保存HTML文件到磁盤的時候,你要確保這個腳本對文件保存的目錄有寫權限。

正如你看到的,假如你有標準格式的ASCII純文本數據文件,你可以相當迅速用PHP把它轉換成為可使用的Web頁面。如果你已經有了一個Web網站,并計劃把新的Web頁面加入進來,那么調試頁面生成器所使用的模板,使之適應原有Web網站的外觀是相當容易的。你自己試試看!

標簽: PHP
主站蜘蛛池模板: 中文字幕免费在线观看 | 日韩中文字幕一区二区 | 国产精品福利在线 | 午夜影院在线视频 | 久久精品99| 久久精品16 | 色爱综合网 | 精品久久久久久亚洲精品 | av资源在线看 | 亚洲高清在线 | 免费一区二区 | 麻豆久久久9性大片 | 亚洲精品日韩精品 | 国产免费福利小视频 | 人人天天操 | 久久久免费观看视频 | 久久久国产一区二区 | 欧美日韩在线观看视频网站 | 成人av一区二区亚洲精 | 国产69精品久久99不卡免费版 | 成人黄色电影在线播放 | 久久国产精品一区 | 亚洲午夜精品久久久久久app | 在线播放第一页 | 亚洲一区久久 | 国产成人精品免费视频 | 精久久久久 | 黑人巨大精品欧美一区二区免费 | 久久一 | 天天色图 | a在线观看| 人人干超碰 | 国产精品久久久久久久久免费桃花 | 一本一道久久a久久精品综合蜜臀 | 久草视频在线播放 | 欧美成人久久 | 亚洲资源在线 | 国产精品成人一区二区三区夜夜夜 | 国产在线观看 | 欧美aa在线 | 亚洲精品自拍视频 |