在搜索引擎工作原理中,搜索引擎预处理的第一步就是提取文字内容SEO人员应该尽量降低搜索引擎提取文字内容的难度,也就是精简HTML代码,使真正的文字内容比例提高,尽量减少HTML格式代码“从某种意义上来说,格式代码对关键词来说都是噪声,精简代码就是提高信噪比常见的可以精简代码的地方如下。
(2)使用外部文件,将CSS和JavaScript放在外部文件中,页面HTML中只要放一行代码进行调用就可以了,如果我们查看一些网站源文件,经常可以看到大片大片的CSS及JavaScript代码,而且JavaScript代码还经常出現在HTML最前面,这就使真正有用的文字部外被推到后面。
这里说明一下文件大小限制。Google技术指南曾经建议。HTML文件最好限制在100KB以下,页面上链接数在100个以下,百度目前建议HTML文件不要超过128KB。其实現在的搜索引擎已经完全可以抓取大得多的文件,甚至两兆的文件也没有问题不过在可能的情况下,还是应该尽量使文件越小越好,虽然搜索引擎可以抓取很大的文件,但可能不索引整个文件,而只索引文件前面部分内容,通常,网站设计页面内容应该是集中统一的,索引前半部分就代表了文件内容主题。文件很大时,索引整个文件既没有必要也是很大的资源浪费。文件过大,再加上大量冗余格式代码,可能使实质内容被推到实际被索引的部分之外。