近期在开发医院满意度调查系统,用的是php+Layui,给大家看一下图片,整体还在完善中,如果有需要的,可以联系我。
下面谈一谈SEO方面的Url标准化问题,昨晚在微信群有一个人咨询,百度抓取的网站没有公司名称,只有网址。
通过分析发现对方网站问题太多了,比如用户(百度抓取和用户访问是一样的,只是一个是人,一个是机器人,机器人更死板,而且看不懂图片和js内容)第一次访问时,网址有一个307跳转,跳转到一个Url非常复杂的首页,这个首页显示的文字内容非常少,而且还没有title,技术说用js做了title,这充分说明这个技术一点都不懂SEO,建议老板可以开除这个技术了。
我们正常网址访问时的http状态码都是200,百度理论上只抓取状态码为200的页面内容,你的404页面显示的内容再好,因为状态码是404,所以百度不会抓取。
偶尔有些页面状态码是301,那是因为有两个地址都可以访问一个内容相同的页面,比如***.com和www.***.com都可以访问首页,这时候我们做301跳转,告诉百度这是这两个页面哪一个是主要页面。
这个网站用的是307跳转,是非常错误的,而且最终的首页里面除了两个按钮,含有大量js,而且没有其他文字内容,并且首页Url超级复杂,还存在哈希值,本身百度就无法抓取Javascript的页面内容,网址中的哈希值更是不符合Url标准化。
Url标准化是什么?
很多时候一个网站可以有多个链接可以访问,比如
www.**.com
**.com
www.**.com/index.html
**.com/index.html
上面的链接都可以访问一个网站,对于用户来说,很容易判别是一个首页的四个链接,对于百度来说,它会把这几个页面全部当作重复的页面,会选择其中一个域名作为网站的首页,而且在链接权重计算上会分开计算,这样当有不同链接指向这4个链接(同一个页面)的时候,权重是不集中的。
这时候我们可以做的就是301跳转,让其他三个页面做301跳转到另一个页面,这就是告诉百度哪一个是主要页面。
对于网站目录页和文章内页,也存在这种问题,有些网站是同时存在动态和静态地址,都可以访问,这时候既要做301跳转,还要去robots.txt里面屏蔽一种地址。
已有 487 位网友参与,快来吐槽:
发表评论