面向搜索引擎的网站设计优化--如何提高自己网站的人气
面向搜索引擎的网站设计优化--如何提高自己网站的人气
http://www.chedong.com:81/tech/google.html
作者: 车东 chedong@bigfoot.com
最后更新:2003-01-06 20:39:47
版权声明:可以任意转载,转载时请务必标明原始出处和作者信息
关键词:Google PageRank "link popularity" "website promotion" "optimization for search engine"
内容摘要:(注意:这个网站设计本身就利用了其中一些方法)。
网站设计中面向搜索引擎的优化注意事项:
链接引用的重要性;
如何突出关键词:网页标题、主题的设计;
页面及站点结构设计注意事项;
以及站点访问统计的重要性等;
谁不想自己的网站在Google的搜索结果重排名靠前呢,但你的网站设计是Search Engine Ready的吗?
什么是PageRank
Google等新一带搜索引擎的优势之一在于不仅索引量很大,而且还将最好的结果排在搜索结果的最前面,具体的原理可以参考Google の秘密 - PageRank 徹底解説一文,PageRank简单的说类似于科技论文中的引用机制:谁的论文被引用次数多,谁就是权威。在互联网上PageRank就是基于网页中相互链接关系的分析得出的,由此引出第一个要点:
链接就是一切
在互联网的海洋中,最重要的就是互联互通,不被其他网站引用的网站就是“信息孤岛”。“酒好也怕巷子深”,也许这话说起来有点像垃圾邮件广告,但事实就是这样。所以如果做网站的目的不是孤芳自赏,就需要积极的推广自己的网站。下面几个
以量取胜:不一定加入大型网站的分类目录才是网站推广,来自其他网站的任何反相链接都是有用的
网站推广比较经典的方式就是加入比较大型网站的分类目录,比如:Yahoo!,dmoz.org等。其实这里有一个误区:不一定非要加入大型网站的分类目录才是网站推广,因为现在搜索引擎已经不再只是网站目录的索引,而是更全面的网页索引,所以无论来自其他网站任何地方的反相链接都是非常有价值的,哪怕是出现在新闻报道,论坛,邮件列表归档中。Blogger(Weblog简称Blog)们也许最深刻地理解了“链接就是一切”这句话的含义,由于Blog的内容之间有大量的相互链接,因此最经常被引用的Blog页面在搜索引擎中的排名往往比一些大型商业网站的页面还要高。
以质取胜:被PageRank高的网站引用能更快地提高PageRank
数量只是关键因素之一,来自PageRank高的页面的链接还能更快的提高被链接目标的PageRank,以我的个人网站为例:我没有加入任何分类目录,只是将一些文章投稿在了ZDNet中国上,由于页面上有文章出处链接,相应网页和网站整体的PageRank过了一段时间后就有了很大的提升。有时候被什么样的网站引用有时候比引用次数多更重要。这里我要特别感谢的是,ZDNet中国是唯一遵循了我的版权声明的要求表明了文章出处,并且有反相链接的网站。
了解搜索引擎的"价值观"
Lucene简介这篇文章被Jakarta.apache.org的lucene项目引用以后,这篇文章就成为了所有页面中PageRank最高的页面(在Google工具栏上显示是6/10),而Google深厚的学院气氛让我一直怀疑他们对.org .edu等非功利站点有特别加分 :-),毕竟.org .edu才代表了互联网精神的实质,所以IBM HP国际大企业等对非功利性站点的资助绝对不是没有价值的事情,说远了 :-)。
另外在推广自己网站之前也许首先需要了解自己网站目前在一些搜索引擎中的知名度,这里我做了个小工具可以用于这一目的:
http://www.chedong.com/linkPopCheck.php。
原理非常简单,可以参考如何评价网站的人气一文。
网站推广只是手段,如何突出内容、让需要相关信息的用户能够尽快的找到你的网站才是目的,因此第二个要点:
如何突出关键词
不要空着标题:空着无异于浪费了最有价值的一块阵地;
传统的页面中,HTML页面中会有类似以下的隐含信息,用于说明当前网页的主要内容关键字:
后来由于这种人工添加关键词的方式被滥用,大量网页中为了提高被搜索引擎命中的概率,经常添加一些和实际网页内容无关的热门关键比如:“music mp3 download”等,所以新一代的搜索引擎已经不再关心页面头文件中的人工meta keyword声明,而页面标题在搜索引擎的关键词的命中命中过程中往往有着更高的比重,如果一个关键词在标题中命中会比在页面中命中有更高的得分,从而在相应的搜索结果排名中更靠前。
标题长度:不要过长,一般在40个字符以内;
如果更长的标题搜索引擎一般会忽略掉,所以要尽可能将主要关键词放在标题靠前的位置。省略掉不必要的形容词吧,毕竟用户主要通过名词来找到需要的内容。
标题内容:尽量用一些别人可以通过关键词找到的字眼;
"Website search engine optimization" 会比"面向搜索引擎的网站设计优化"有效的多。
如果网页很多的话,尽量使用不同的网页标题,争取让自己网站的内容更多的进入搜索引擎索引范围;
我的猜测:搜索引擎会根据页面内容的相似度把一些内容当成重复页面排除出索引范围;
http://www.chedong.com/phpMan.php是我的网站上的一个小应用:一个web界面的unix命令手册(man page),在以前的设计中所有动态页面使用的都是同样的标题:"phpMan: man page /perldoc /info page web interface" ,Google索引了大约3000多个页面,后来我将页面标题改成了"phpMan: [命令名]"这样的格式,比如:"phpMan: ls",这样大部分动态页面的标题就都不一样了,一个月后Google从这个页面入口索引了大约6000个页面。因此,如果网站中很多网页都使用相同的标题,比如:“新闻”,“论坛”,这些页面中很大一部分就会被排重机制忽略掉。
除了外,还可以用标题行突出内容主题,加强标题的效果;
在我的网站设计中:我会把用[标题]这样的模板把标题突出显示,而不是通过改变字体的方式突出标题。
其他网站设计提示
表现和内容的分离:
网页中的javascript和css尽可能和网页分离,一方面提高代码重用度(也方便页面缓存),另外一方面,由于有效内容占网页长度的百分比高,也能提高相关关键词在页面中的比重,应该鼓励使用更规范的XHTML和XML作为显示格式便于内容更长时间的保存。
站点地图:让所有的页面都有能够快速入口,方便网页爬虫(spider)快速遍历网站所有需要发布的内容。提高网站自身的健康状态:经常利用坏链检查工具(比如: XENU)生成网站地图统计,并检查网站中是否有死链。
尽可能保持网页的持久性,保证引用你的网页能够被比较持久的稳定引用,如果网页中有链接更新时,最好能保留旧的页面并做好链接转向,保持内容的连续性。
知己知彼——站点访问统计/日志分析挖掘的重要性
网站设计不仅仅只是被动的迎合搜索引擎的索引,更重要是充分利用搜索引擎带来的流量进行更深层次的用户行为分析。目前,来自搜索引擎关键词统计几乎是各种WEB日志分析工具的标准功能,相信商业日志统计工具在这方面应该会有更强化的实现。WEB日志统计这个功能如此重要,以至于新的RedHat 8中已经将日志分析工具webalizer作为标准的服务器配置应用之一。
以Apache/webalizer为例,具体的做法如下:
记录访问来源:
在Apache配置文件中设置日志格式为combined格式,这样的日志中会包含扩展信息:其中有一个字段就是相应访问的转向来源:HTTP_REFERER,如果用户是从某个搜索引擎的搜索结果中找到了你的网页并点击过来,日志中记录的HTTP_REFERERL就是用户在搜索引擎结果页面的URL,这个URL中包含了用户查询的关键词。
在webalizer中缺省配置针对搜索引擎的统计:如何提取HTTP_REFERER中的关键词
webalizer中缺省有针对yahoo, google等国际流行搜索引擎的查询格式:
SearchEngine yahoo.com p=
SearchEngine altavista.com q=
SearchEngine google.com q=
通过这样设置webalizer统计时就会将HTTP_REFERER中来自搜索引擎的URL中的keyword提取出来,比如:所有来自google.com链接中,参数q的值都将被作为关键词统计下来,从汇总统计结果中,就可以发现用户是根据什么关键词找到你的次数,以及找到你的用户最感兴趣的是那些关键词等,进步的,在webalizer中有设置还可以将统计结果倒出成CSV格式的日志,便于以后导入数据库进行历史统计,做更深层次的数据挖掘等。
以前通过WEB日志的用户分析主要是简单的基于日志中的访问时间/IP地址来源等,很明显,基于搜索引擎关键词的统计能得到的分析结果更丰富、更直观。因此,搜索引擎服务的潜在商业价值几乎是不言而喻的,也许这也是Yahoo! Altavista等传统搜索引擎网站在门户模式后重新开始重视搜索引擎市场的原因,看看 GOOGLE的年度关键词统计就知道了,在互联网时代有谁比搜索引擎服务商更了解用户对什么更感兴趣呢?相信以后会有更多的利用互联网媒体做更深层次数据挖掘的服务模式出现。
参考资料:
面向Google搜索引擎的网站设计优化
http://www.google-search-engine-optimization.com/
如何评价一个网站的人气
http://www.chedong.com/tech/link_pop_check.html
Measuring Link Popularity
http://searchenginewatch.com/webmasters/popularity.html
Google の秘密 - PageRank 徹底解説
http://www.kusastro.kyoto-u.ac.jp/~baba/wais/pagerank.html
这篇文章是在查"Google PageRank"的时候查到的,这篇文章不仅有一个算法说明,也是一个Google的weblog,记录了很多关于Google的新闻和一些市场动态信息。
日值统计工具Webalizer
http://www.webalizer.org
|