做一个CMS网站技术我认为是不难的,困难的是你网站做好了怎么去经营它,让它能够持续地运营下去才是关键。

  以前看过这样一则报道,说中国的互联网上差不多90%的网站都是个人网站,那么对于一个个人网站的站长来说,网站的更新将是他运营一个网站的关键因素,毕竟一个网站要有好的流量,其内容是留着浏览者的一个非常重要的因素。

  很不幸的是对于个人网站的站长来说,他们不可能想其他互联网企业那样聘请专业的人士来原创内容来更新网站,一是资金有限,二是成本太高。所以对于很多的个人站长来说,拷贝复制网络上的内容再添加到自己的网站中是他们更新自己网站的主要方法,而在这种情况下,怎么实现网站的自动更新来减少站长的工作量是一件很有意义的事情的,而我通过php实现了一些简单的功能,在此我写出来和广大的网友一起分享。

  要实现网站的自动更新其原理也比较简单,其基本原理如下:

  1.一个台服务器上的页面要能够执行,并把结果发送到浏览者的计算机上,其关键是要浏览者的浏览器链接并执行。换句话说就是浏览者的浏览激发了服务器上的页面的运行,我把这个自动更新的页面命名为update.php,则只要站长打开这个页面就可以开始网站的自动更新。

   2.要实现自动更新,其就是对一个指定的网站进行文章标题与文章内容的采集,而一般情况下我们要采集到这些基本信息则需要吧指定网站的一个页面(主页,或者子页)的地址获得(这些可以在自动更新里手动设置),然后采集到所有的链接。

  3,一般对于通过2操作得到的链接中有很多是无效的链接,如广告啊等等,在这里我们可以进行手工的过滤,这是第一次过滤,但是不是必须的。

  4.打开获得链接的地址对应的页面,为了方便我认为这个页面就是我们要找的有正文的页面,如果没有的话就返回,继续下一个链接的操作。

  5.能采集正文的一个事实基础是,现在的网页设计都是很标准话的,大多数的文章正文都是位于一个div中,而这就是我们进行正文采集的开始标记。

先说的这里,继续看我的下一次的介绍,怎么获得一个页面(一个网站的主页或者任何一个页面)的所有链接(包括链接的名称、地址)。

没有相关文章.