SEO实战|百万级词库如何搭建?
//ps 由于在回答知乎问答“ 词库的如何维护”中提及了关百万词库如何创建的话题。所以就这是文章写作的来源。本文的整体内容结构是价值4300的SEO大型教育类网站内部培训课程的节选。由本人根据实战经验整合描述和改编。
序:词库,是SEO开展优化的根基。没有根基的SEO优化是混乱的,无序的。关于词库的维护和整理市面的上的介绍有太多误区。这里将从实战出发讲述如何发掘,如何规范,如何整理,如何应用。
- 关键词挖掘
- 词库分类
- 词库过滤
- 词库布局
- 词库应用
关键词如何挖掘? 挖词工具有哪些?
挖词工具:
工具在于使用,使用在于思维。
当你使用挖词工具时,应当具有明确的定向思维。
挖词的思维:
挖:是一个动词 词:是一个名词
挖词:是一个动作和行为。挖掘的结果不是我们的目的。
而是我们通过挖掘出来的关键词来了解需求。
词库的分类:
杂货词库?
产品词库?
有序词库?
无序词库?
挖词思路举例:
了解业务,整理产品结构示例
挖词工具举例:
百度关键词规划师
斗牛SEO工具
爱站工具包/站长工具包/5118挖词工具
词库分类
挖掘出来的词是无序和杂乱的,需要先做分类!
疑问词:
包含:?、什么、怎么、好、吗、嘛、如何、多少、怎样、问、几、谁、哪..........
杂乱词:
包含:“”或其他符号的
竞品词:
包含:竞争对手公司名称、全称、简称、品牌名、品牌简称、网址、特殊称谓、特殊形容词、LOGO、品牌形象
地域词:
包含:省、市、县、乡、镇、街道、地铁、公交站、
业务词:
去除以上分类,剩下的整体属于业务词。可进行筛选甄别。
词库清洗
分好类的词库进行清洗后,才是可以应用的词库。
在SEO实战中,我们多数能使用的词,并不是词库里面所有的词。
而是清洗之后,整理好的词库,也叫产品词库。
每次不断的从杂货词库中清洗整理出新的产品类型添加到产品词库,有助于我们流量增长新的方向。
业务词说明:
有序词:通过关键词规律可以批量生成,并落地的体系化网页的词。
比如:报名时间、报名条件、考试时间
时间+地域+考试科目+报名时间
2020年北京一级建造师报名时间
地域+时间+考试科目+报名条件
湖南2020年二级建造师报名条件
时间+地域+考试科目+考试时间
2020长沙教师资格证考试时间
无序词:
没有规律可循,或者不明确的词,多半用于长尾词内容详情页承接。
词根:
地域,业务、属性大类、属性子类等词(参考上面的业务模型)
关键词过滤:
本地关键词过滤
php 版
<?php
header("content-type:text/html;charset=utf-8");
$q = 'guolv.txt'; //这个是分类词表的TXT 1
$k = 'all.txt'; //这个是你要处理词的词库TXT 2
$cbody = file($q); //file()函数作用是返回一行数组,txt里有三行数据,因此一行被识别为一个数组,三行被识别为三个数组
$arr_k = file($k); //同上
foreach ($cbody as $v) {
$v = trim($v);//过滤空字符
foreach ($arr_k as $k=>$v2) {
$v2 = trim($v2);//过滤空字符
if(strpos($v2, $v) !==false){
$is_false[] = $v2;
unset($arr_k[$k]);
}
}
}
//去除重复的
array_unique($is_false);
$str = "";
foreach ($is_false as $vv) {
//echo $vv."<br />"; //直接页面显示 包含筛选词的结果
$str .= $vv;
$str .= "\n";
}
//生成文件 is_false.txt
file_put_contents('is_false.txt', $str);
//剩余的";
$str2 = "";
foreach ($arr_k as $vv) {
//echo $vv."<br />"; //直接页面显示筛选后的结果
$str2 .= $vv;
}
//生成文件 is_true.txt
file_put_contents('is_true.txt', $str2);
?>
新建2个txt 文本,一个命名guolv.txt 里面写入需要过滤的词比如:
竞品词、地域词、疑问词、杂乱词。
一个命名all.txt 里面放入需要被过滤杂乱词库。
运行该PHP程序。会生成2个TXT 文件。 一个是过滤掉的词库 一个是命中过滤词的词库。
PHP程序,可以搭建本地环境运行。
这里可以使用PHPstudy
上述源代码都标有注释,而且使用很简单。不详细讲述。如需远程操作指导。可付费咨询!
词库的布局
词库的整理是为了应用,如果建立词库本身只是为了完成这一工作。那本身这个工作就是无意义的。必须把整理出来的词应用上,这才是关键。 当我们了解到用户需求就要及时的满足需求解决需求。不然就是无效做工。
词库应用与布局
网站的结构与布局,开始于词库的整理。
还记得前面说的业务的了解模型嘛?
可以从业务中分离中词库中产品词库。同理如果在网站搭建之前已经整理好业务词库和产品词库。
那么把产品词库中继续细分到类。一样可以指导我们网站业务中需要那些栏目。
栏目的名称和栏目的内容取决于产品词库中细分出来的类。
还是以教育网站举例。
一个做职业考证培训的线上教育网站。目标人群是考证学员
那么考证的这一个过程中有哪些环境和场景?
考试报名-条件审查-打印准考证-考试-查询成绩-领取资格证
这是整个流程 那么每一个流程都可以作为一个类做关键词产品库。同时每一个类都可以布局到网站的栏目中。
考试报名这一个需求为例
摊开来说需求可以是:报名时间/报名入口/报名条件|报考时间/报考入口/报考条件
所以考试报名的这个栏目内容可以确定是以上需求的关键词和相关长尾。同时这些词还是有序词(上面有解释什么是有序词)。通过批量生成和操作 这一批的词量可以到达几十W 。
时间+地域+考试科目+报名时间
时间+地域+考试科目+报名入口
时间+地域+考试科目+报名条件
时间可以做2种类型2020年
2020上半年
2020下半年
地域词:34个省级X506(市级包含直辖市的区)
考试科目
可以是证书名称也可以是具体考试科目如:
2020年湖南一级建造师工程经济报名时间
可以利用组词工具批量生成关键词
支持A/B/C 三个维度
TDK是页面本身SEO最重要的三元素、那如何展示?
前面说了关键词应用和布局,那么最终展现的TDK如何写?
前面其实有提示考试报名 最重要的需求是什么?
报名时间、报名入口、报名条件
对于栏目我们可以把这三个词写入Title中用于展示。
至于如何写? 这个又牵涉到SEO优化中TDK优化中的这一部分内容。这次详细说明。
列举一下重要的点。
三段分割法
复合百度中文分词算法(主要是逆向正则最大匹配+正向正则最大匹配+最小正则匹配)
重要的词放在最左边。
栏目的TDK 写好了。
文章内容的TDK就好写很多。基本可以用有序词进行标题撰写。
end!
结束了,大家好我是朝小胖,一个近9年SEO实战经验的老胖子了。个人知识体系涉及白黑帽,自称灰帽子。最开始11年下半年从事谷歌SEO( google.de google.fr google.co.uk)以及美国本土搜索引擎AOL以及日本雅虎等搜索引擎优化工作。从14年开始针对百度SEO 的企业SEO外包及顾问服务。 15-18年从事国内医疗集团SEO站群及品牌推广服务工作。最近在国内线上教育公司负责流量及用户增长。
欢迎点赞!关注!收藏!
欢迎点赞!关注!收藏!
欢迎点赞!关注!收藏!
// ps:目前在规划写一些从事谷歌SEO优化的趣事和记录故事。不止包含了做排名优化还包含了SNS、社会化、以及当时创业做谷歌SEO排名,取巧利用facebook主页 一个星期实现核心词排名 http://google.com 首页的一些方法和记录。