本文主要介绍SEO中站内优化的结构优化,包括url优化,导航栏优化,内链优化等
url优化
a.url目录层级不能过多
url层级越多,深度就越深,但是搜索引擎对新站多是广度优先抓取,就不利于搜索引擎的抓取
所以url层级越少越好。
例如:
www.zbp.co/art/1.html
是两层目录
如果你改成www.zbp.co/art-1.html就变成一层了。
所以尽量用连接符
b.url最好使用伪静态或者纯静态
动态页面就是有?参数的,而且不同参数都可以打开的而且内容不同的就是动态页面
像 www.zbp.co/art?page=2 这个算是动态页面,有参数
如果动态页面的参数不同展现的内容不同还好
但是如果展现的内容一样就很糟糕了,如果你的页面有很多这样的链接,而且展现的内容一样,那么搜索引擎分析出来了之后就不会再去抓这个页面了
c.url最好可以包含关键词
url中可以有中文的,这个不强制,但是url中有关键词肯定更有效
当然你可以不要都是中文而是掺一点英文比如 /art区块链
这种情况用在标签页是最好的,像栏目页则推荐使用纯英文
d.字母要小写而且不要用特殊符号
e.斜杠要进行统一
这个斜杠指最后一个斜杠
jd.com 和 jd.com/ 是两个不同的url,这个要注意
带不带都可以,但网页中链接要么都带斜杠要么都不带
=====================
sitemap
当网站的目录结构和层级比较多的时候,就需要sitemap进行引导。
但是,对于目录结构简单的网站,sitemap可有可无。
作者这里说的站点地图和我工作的时候做的那种sitemap.xml是两回事
这里的站点地图是一个页面,这个页面里面展现了所有的栏目和链接
一般来说首页的权重是最大的,一般写1
即1.0
然后栏目页的权重写0.9
==============================
robots的用途
声明禁止收录哪些页面,一般会去禁止爬取动态页面的数据,以防同一内容百度同时收录了动态和静态的网址
搜索引擎来访问网站的第一个文件就是robots.txt,位于网站根目录下
所以我们可以直接 网址/robots.txt 查看别人网站的robots文件
用途1:声明禁止收录
User-Agent:*
Disallow:/
表示对所有的搜索引擎都禁止搜索
User-Agent:Baiduspider
Disallow:/
Allow:/article
Allow:/goods
这个表示,不许爬根目录以及其下所有子目录的页面
但是允许收录/article和它所有子目录的页面
但是如果
Allow:/article
Allow:/goods
Disallow:/
那么前面两条就没用了
还能限定某文件不能爬
Disallow:/admin.php #不给爬后台
还有
Disallow:/*?mod=misc*
表示只要包含了?mod=misc的都不给爬
Disallow:/?xxx=xxx*
等等
用途2:
可以声明网站地图
在robots.txt 最后一句
Sitemap:http://xxx.xxx/sitemap.xml
除了谷歌还有必应这个国外搜索引擎
有一个小技巧,如果你想搜索引擎能马上来抓你某个页面可以使用
Allow:/地址
比如搜索引擎老是只爬首页,不爬栏目页,你就可以
Allow:/栏目页的地址
用途3:禁止搜索引擎生成快照
只需要在网页
中加一句
archive是快照的意思
这是禁止百度建立快照
=====================================
导航栏优化
要做面包屑导航
为什么首页的权重是最高的?因为任何一个页面都会首页的链接,都能跳到首页,所以首页权重最高。
如果栏目少的话,就将栏目链接放在头部和底部即可
如果栏目很多,比如有很多子栏目子分类,向购物网站,招聘网站的话,就用树形结构的导航,即
一级分类1
二级分类1-1 二级分类1-2 二级分类1-3 ...
一级分类2
二级分类2-1 二级分类2-2 二级分类2-3 ...
...
反正如果你栏目很多很多,就尽可能多的将这些链接展现出来
还有头部和尾部都要放上你的栏目链接,做多点这些栏目链接的入口
如果导航栏做特效的话尽量不要用js在父栏目下生成节点的方式去生成子栏目,这样的话源代码中相当于没有子栏目的链接显示。搜索引擎相当于就没爬到你的子栏目。
网上的说法:
1.导航条中必须要包含该网站的核心关键词。也就是说你的栏目名最好设成你的核心关键词,然后子栏目的栏目名也设成你的关键词。
当然,如果你是个小网站(权重没那么高),设的关键词不要设大词。
将栏目名设成关键词之后,每一个栏目页就相当于是为这个关键词单独的做了一个页面,有利于这个关键词排名
核心关键词是那种短的,3~5个字的,不是长尾词。
2.在导航栏使用标签
蜘蛛对不用标签的内容会给予不同的权重抓取。所以导航栏的关键词可以多用些h2,h3标签包住
h1标签一般一个页面只出现1次,出现太多就没什么效果
=======================
翻页注意事项
翻页过多会导致所搜引擎抓取困难,可以将分页做成一下两种格式
1,2,3,4,5,6,7,8,9,10,11,21,31
或者
1,2,3,4,5,6,7,8,9,10,下10页
还有每个分页的标题尽可能不同,比如第2页的标题你可以加一个 “-第2页”
======================
Flash,框架,js,Ajax不利用搜索引擎抓取
因为搜索引擎无法抓取ajax加载的内容,所以像正文内容就不要用
js和ajax来展现。但是像广告就可以用ajax来做就很好
还有别人帮你做友链的时候,你要看看它是不是用js给你展现友链,不要被别人骗了
=====================
内链优化
确保每个页面都可以通过至少一个文本链接到达
重要的内容,应该从首页或者网站结构比较浅的层次访问到
意思是,你的文章页最好多放在首页,这样搜索引擎一下子就能找到你这个文章的链接。
内链布局位置:内容中自然出现的内链最好
比如你在一篇文章中提到了你自己另一篇文章的一些内容,此时你可以加一句,“本块只是详情可参考SEO导航栏优化一文”
在那个SEO导航栏优化加一个链接,这就是很自然的内链
而且同一个内链最好只出现一次。
还有你这个内链的锚本内容,不一定非要是你的那篇文章的标题,也可以是网站关键词,然后链接内容是那篇相关文章
文章的内链要相关,就是文章详情页的内链的内容要是和这片文章有关的,例如同一栏目的文章,或者有相同或类似关键词()的文章的链接
同一栏目的文章可能相关性也不大,放有类似关键词的文章会比较好,从技术上怎么做呢,你可以给所有文章加个分类标签,然后搜索有相同标签的文章作为该文章的内链即可。
如果是采集的文章,可以先对他的标题进行分词,然后将这些分词加到该篇文章的标签,然后再以这些分词作为该文章的分类标签存到数据库。然后做某一篇文章的内链就可以搜索有相同标签的文章
如果你的网站有给每一篇文章做标签的话,那么内容页还可以放上相关标签的链接,这个内链的相关性就比较高了.
首页和列表页的标题链接要用
nofollow的使用
xxx
这样的话,搜索引擎来爬这个链接的话就不会给他权重。
什么情况加nofollow
1.一些和网站关键词无关的链接是可以加nofollow,比如广告还有赞助商,个人中心的链接什么的。
当然你的外链可别被别人加了nofollow了,这样相当于没做外链
2.你的列表页有图片有标题,图片有一个链接,标题也有一个链接,此时这两个链接就会重复,此时图片的链接可以加nofollow.当然不加也无所谓。
加了nofollow虽然不会给它这个链接权重,但是百度还是会去爬它的。
真的不想让百度爬的链接,可以用js生成
=========================
目录和子域名的比较
就是分站是使用目录做还是子域名做
从页面权重来说
主域名首页>子域名首页>主域名目录>子域名目录>主域名内页>子域名内页
其实www.xxx.com也是子域名的一种。
xxx.com才是根域名
根域名xxx.com的权重是所有分域名的总和
当某个频道内容的丰富程度不足以做一个独立站点的时候就用目录形式
各个子域名的内容不能很相似,否则会被搜索引擎判断作弊。
所以当内容差异较大,关联度不高的内容,可以用子域名做。
各个子域名之间不能相互访问,否则会被当做重复内容除重处理
例如 a.xxx.com下的内容和链接不能通过b.xxx.com