技术SEO:10个网站常见的质量问题及处理方法
爱用SEMrush的同学都知道,SEMrush里面有一个Site Audit的功能,可以评估你的网站各项指标的情况,然后给出一个整体的质量得分。同时,还会提示网站存在的一些问题。通常,提示的问题会分为Errors,Warnings和Notices三个级别,当然也代表着不同的重要程度。
但是,初次接触网站的小伙伴面对很多问题可能一知半解,下面我就针对每个问题解释一下并给出解决办法。
1. Mixed Content 混合内容
Mixed Content的中文意思是混合内容,咋一看还以为网页上有什么内容混合,其实它指的是HTTPS 网页中加载的 HTTP 资源 。也就是说你的网页里面指向的网址有https的也有http的。
混合内容的类型有两种:被动型混合内容(mixed passive/display content)与主动型混合内容(mixed active content)。
被动型混合内容:<img>(src 属性)、<audio>(src 属性)、<video>(src 属性)、<object> subresource(如果 <object> 发起 HTTP 请求)
例如,你在网页中引用了一张图片,但是那张图片的地址是以http://开头的。
主动型混合内容: <script>(src 属性)、<link>(href 属性)(包含 CSS 样式表)、<iframe>(src 属性)、XML Http Request请求、fetch()请求、所有用到 url 的 CSS 值(@font-face、cursor、background-image……等等)。<object>(data 属性)
两者区别:威胁程度不同。如果是被动型混合内容,威胁程度较低(可能有错误内容、或者用户的 cookie 遭到窃取)。如果是主动型混合内容,威胁就可能会变成网络钓鱼、敏感资料泄露、被重定向到恶意网站……等等。
解决办法:
如果插入的图片是本站的,直接将提示的图片链接改为https的地址即可。如果使用站外的图片,可将图片下载至本地,上传到自己网站并使用新的图片链接即可。
2. Language is not Specified 语言未指明
从字面意思来看比较好理解,网页语言没有指明。在网页代码的开头我们一般会放一个lang的属性到html标签里面,帮助搜索引擎理解你网页的语言或区域。
解决办法:
如果你看到这个错误信息,可以单击鼠标右键,点击查看网页源代码,查看网页是否有lang标签,如果缺失的话可以加上。如果你是其它语种,不知道它的lang语言如何表达,可以查看 W3Cschool的教程。
3. Missing H1 heading H1标题缺失
就像我们自己写文章一样,有总标题、副标题和次级标题。Google也一样,用H(Heading的代号)来表示网页的标题,H1是一个页面最重要的标题,表现你网页的核心主题,所以每个页面一定要有一个H1。
常见的像这种在线工具类型的网站,可能会忘了设置H1。
解决办法:
后续如果需要直接在代码里面加入H1标签即可。H1虽然至关重要,但记住每个页面只能由一个H1。
4. External Broken Links 外部错误链接
External Links其实就是我们网站上指向其它网站的链接,推荐大家使用ahrefs的outgoing links的功能,可以非常直观看到哪些指向外部的链接已经打不开了。
解决办法:
如果链接已经打不开可以直接去掉或者替换掉即可。
5. Images without an alt attribute 图片Alt属性缺失
因为搜索引擎还没有智能到识别图片上的信息,所以图片的Alt属性就是告诉搜索引擎你的图片是什么意思。也就是加在<img>里面的alt=""标签。
解决办法:
直接在图片的代码里面加上alt标签。由于Alt标签也是影响网页SEO排名的一个因子,有些人为了SEO的目的,alt里面加入了页面的关键词。但切记最好还是以能表达图片主要意思为主,不要过度堆砌关键词。
6. 404 Client errors 404错误
这是网站最常见的错误,网站的页面打不开了,无法访问。
解决办法:
如果页面不小心被删除掉了,那么就使用该页面的URL地址重新创建和发布网页内容。如果这个页面已经没有任何用处,而且删掉了,那么你可以直接把404的链接使用301跳转到其它页面。大家要关注404产生的原因,如果是客户自己输入错误的url产生的404可以忽略。例如他本来想访问 http://xxx.com/blog/,然后不小心打成 http://xxx.com/bloog。
大家可以在GA里面建一个自定义报表,分析404产生的原因。看到用户因为什么原因访问404,说不定还可以发现用户需求呢!
7. Duplicate meta Description/Title Tag 描述或标题重复
近些年来因为越来越多的Meta Description对Google排名没有太大的影响的言论,另一方面Google会忽视你自己写的Meta Description,自己从网页中抓取一段话作为meta description,所以很多人都不写这一块直接设置为空。这就导致SEMrush认为是重复的。
解决办法:
虽然这个指标对排名的帮助没有以前那样好,但是还是可以写一段描述。在内容的调用上也会有一定的帮助。
8. Broken internal javascript and css JS和CSS损坏
网页的JS和CSS涉及到更深的网页技术,如果SEMrush的报告已经告诉你具体是哪一个JS和CSS损坏,可以直接把诊断结果给到公司的网页开发人员进行修复。
9. Multiple canonical urls 多个Canonical链接
随着网站上内容越来越多,不免会遇到网页重复。意思是两个不同的URl,但是两个页面内容大致相同。但是这样重复内容过多,会分走Google的权重。于是用Canonical标签指代最重要的那个页面。
如果网站上出现Multiple cananical urls的问题,说明你一个网页上设置了两个Canonical代码。
解决办法:
还是单击右键,点击查看网页源代码,Ctrl+F查找Canonical。如果发现两个及以上Canonical标签,直接进行删除。
10. text html ratio 文本HTML比例
网页一般是使用HTML写的,页面的文本与 HTML 的比率衡量该页面上的文本量与显示它所需的 HTML 代码量之比。
据说,一个好的文本与 HTML 的比率是 25% 到 70%。这个百分比指的是可见文本的比例,而不是 HTML 元素、图像标签和其他不可见的信息。市面上有很多免费的文本和HTML比例的检测工具,直接输入网页地址即可测试。
虽然Google没有说这个会影响网页排名,但是代码比例太大一定程度上会拖慢网页的访问速度,特别是移动端的体验可能会不怎么好。
解决办法:
可以让开发人员缩减代码,尽量保持简洁。核心是关注网页访问速度这个指标。
以上是10个常见的网页质量问题,大家如果遇到其它问题,欢迎评论区留言交流。