python之单词词频统计
需求分析:指定任意英文文本,统计文本中个单词出现的频率,并选出出现频率最高的10个单词
环境:python 3.6.0
IDE:PyCharm 2017.2.3
module:string
数据类型:字符串,列表,元组,字典
#!/usr/bin/python
# -*- coding: UTF-8 -*-
import string
import matplotlib.pyplot as plt
words_freq={ }
f=open("《教父》小说英文版.txt")
for line in f:
#间类似于twenty-one的单词分为两个单词
#分词
words=line.replace("-"," ").split()
for word in words:
#去掉单词前后的标点符号
word=word.strip(string.punctuation)
#所有单词不区分大小写,全部转成小写
word=word.lower()
#统计,以字典存储
if word in words_freq:
words_freq[word]+=1
else:
words_freq[word]=1
freq_words=[]
for word,freq in words_freq.items():
freq_words.append((freq,word))
freq_words.sort(reverse=True)
for freq,word in freq_words[:10]]
print(word,freq)
尔卿: 现在下的版本都是8点几的,要下7点几的,兼容Jdk8,在哪里能找到历史版本的ES呢
取玳: 为什么我明明安装了pyinstaller,输入指令提示我pyinstaller不是内部或外部指令
库里终老勇士: 请问用gps的方式怎么调取定位
youxuan357849261: 把杀毒软件关了
crawlertinux: 跟打马赛克有啥区别...