基于tf-idf关键词提取,超简单!还能生成「词云图和语义网络图」

在学术论文研究中,经常用到,基于tf-idf算法来优化关键词关联规则,并找出与文本分析相关性较大的关键词。

tf-idf关键词提取 自动提取关键词

很多牛人自学python抽取关键词,但需要花费的时间精力就很难估量了。

那么,不想学python,又想快速又简单“基于tf-idf”自动关键词提取、还想生成关键词云图和语义网络关系图的?
你找对教程了,一口气全部送你!
用不上3分钟,就能保证你可以上手操作了,保质保量保专业!

关键词云图 语义网络关系图 社会网络关系图 共词分析

打开 微词云分词,选择中文分词工具

微词云分词 中文分词 文本分析 相关性分析

简单说下,这款工具只要上传文本数据,就会自动帮你基于tf-idf抽取关键词了,并且还能生成词云图和语义网络图
工具专业度很高,大可放心。

好了和我一起操作下吧~
为了保证每个人都能学会,保证分析结果的准确性,我会把操作流程说的很详细,请大家耐心看下去


步骤1:上传文本数据

我们点击右侧顶部的导入「中文内容」按钮,此处支持txt和Excel两种格式,或者直接把内容复制到输入框中。

数据分析导入文本 数据上传


步骤2:数据配置

上传完数据后,我们可以看下顶部功能配置,可以优化数据分析结果哦
1)单词长度:如果单词长度设置为2,会过滤单字的词,一般默认2即可。
2)自定义词典:可以把关心的词,或者系统分不出来的新词输入到这里,可提高数据的价值度(如您还没有新词,可以试试旁边提示的新词发现工具)
3)指定词性:未勾选的词性,在分析中会被过滤掉,系统默认勾选的是常用的词性。如果您想保证数据完整性,可勾选全部词性哦。

单词长度 自定义词 同义词 词典 新词发现
单词长度 自定义词 同义词 词典 新词发现


步骤3:进入到报告分析页面

当您配置好顶部的参数后,点击右上角的「下一步」进入到关键词抽取,关系图生成报告页面
如果系统提示您是否去重,可以选择不去重,如果为了保持数据的完整性。
去重是清洗数据的一种方法而已。

文本分析报告 数据清洗 去重


步骤4:基于IF-IDF筛选关键词

我们往下滑动报告页面,会在特征词列表看到TF-IDF这一列
我们可以点击倒序和正序来筛选关键词,这个结果就是我上面提到的自动根据TF——IDF抽取关键词的结果数据哦

文本分析 报告生成 tf-idf关键词抽取

当前你也可以下载特征词表,进一步做分析,以及做根据TF-IDF高低筛词,来做一张关键词云图
下载的位置,在顶部的基础信息位置上

tf-idf关键词抽取 特征词表 数据下载


步骤5:基于IF-IDF筛选关键词并制作词云图

我们打开excel表,点击TF-IDF表头位置,根据降序筛选(也就是从高到低进行排序的意思)

根据tf-idf高低筛词 关键词筛选

我们就会很容易得到相关性较大的关键词了,我们复制下来前100关键词和次数值(单词出现的次数),来最一张词云图
点击顶部的其他产品,选择词云设计

关键词生成 词云设计 微词云设计

切换到了词云生成页面了,我们先点击单词导入,选择excel导入,因为我们需要导入的是关键词和词频数
其中“模版2”格式符合我们的当前的需求,所以点击下载这个模版,把刚刚的两列数据复制到这个模版2中吧

关键词生成 词云设计 微词云设计 excel导入

在点击上传刚刚保存的模版2表就行了
最后点击【生成并使用】就行了

关键词生成 词云设计 微词云设计 excel导入

点击顶部的【加载词云】看下关键词云图效果
可以通过调整字体、颜色、角度等配置来美化词云图哦。

关键词生成 词云设计 微词云设计 词云图生成


步骤6:生成语义网络关系图

这个图表在报告最底部,我们滑动到「网络关系图」位置上

关键词生成 词云设计 微词云设计 词云图生成

主要告诉大家两大功能
第一个就是:如何重新选择展示的网络关系图的单词
第二个就是:如何调整网络关系图的效果,让单词之间的关系更加直观!


我们先来说第一问题:选词

点击右侧顶部的「重新选词」功能按钮
您会看到词性和搜索框
所以可以根据,词性和自主搜索方式来添加关键词
那么如何删除不想展示的关键词呢,在展示的关键词列表,鼠标点击单词即可删除点击的单词了
选好词后,点击右侧的「计算关系」按钮就行

网络关系图 语义网络关系图 共现分析 共词分析 共现值


那么第二个问题:优化效果

点击右侧顶部的「更改布局/配色」功能按钮
因为这个位置的配置功能都超简单,点击与选择即可看效果,所以我只挑重要的,影响关系效果的配置来解释说明
1)加权功能参数:控制网络关系图节点圆圈大小的,加权值越小,节点大小越大
关系说明:节点圆圈大小受单词词频数大小来决定,词频越大,节点圆圈越大

网络关系图 语义网络关系图 共现分析 共词分析 共现值

2)最大线宽功能参数:为了让关系值更直观,可以适当增加线宽值
关系说明:线宽粗细受共现值影响,共现值越大,线宽越粗。

网络关系图 语义网络关系图 共现分析 共词分析 共现值


其他的配置参数如字体大小、字体样式、弯曲程度,颜色等大家都可以自己点击试试,也可以查看顶部的视频教程来学习下。

效果生成完成后,我们就可以下载满意的语义网络关系图了,操作真的不难。


往下滑动,还有一个上色好的共词矩阵表,在分析报告中,展示共词矩阵表来说明,关键词之间的关系更具有说信服力,还大大提升了你分析的专业度。

共词矩阵 共词表 共现分析 共词分析 共现值

好了,说了这么多,学会记得打卡哦~

最后更新于: 2022-09-24 23:43:17
感谢您的阅读,本文由 微词云分词 版权所有。如若转载,请注明出处:微词云分词( https://fenci.weiciyun.com/blog/2022/09/24/fenci-tf-idf/)
教你轻松玩转“情感分析工具”
文本分析之多份文本词频分析比较

代做工资流水公司岳阳代开企业对私流水江门打贷款工资流水宜春流水代开常州代办工资流水app截图珠海转账流水打印九江银行流水苏州银行流水账单查询南宁个人银行流水三亚代做企业对私流水衡阳工资银行流水价格银川日常消费流水办理菏泽工资流水图片长沙查询工资证明保定代开日常消费流水铜陵查消费贷流水大连企业对公流水代开荆州车贷工资流水 代办泰州办理工资证明中山车贷流水模板曲靖入职工资流水模板中山背调工资流水办理青岛开消费贷流水保定签证银行流水 开具临沂打印背调工资流水阜阳银行流水单代做孝感查询车贷流水江门打购房银行流水商丘对公流水费用西安工作收入证明办理宜春银行流水PS价格香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

代做工资流水公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化