词云是一种数据可视化技术,用于表示文本数据,其中每个单词的大小表示其出现的频率或重要性。 可以使用词云突出显示重要的文本数据点。 词云被广泛用于分析来自社交网络网站的数据。
 
ASP站长网为了在Python中生成词云,需要的模块是– matplotlib,pandas和wordcloud。 要安装这些软件包,请运行以下命令:
 
pip install matplotlib
pip install pandas
pip install wordcloud
 
代码1:字数
 
可以设置要在tagcloud上显示的最大单词数。 为此,请使用WordCloud()函数的max_words关键字参数。
 
 
# importing the necessery modules 
from wordcloud import WordCloud  
import matplotlib.pyplot as plt 
import csv
 
 
 
# file object is created 
file_ob = open(r"linuxidc.com.csv")
 
 
 
# reader object is created 
reader_ob = csv.reader(file_ob)
 
 
 
# contents of reader object is stored . 
# data is stored in list of list  format. 
reader_contents = list(reader_ob)
 
 
 
# empty string is declare 
text = ""
 
 
 
# iterating through list of rows 
for row in reader_contents : 
 
 #  iterating through words in the row 
 for word in row :
 
 
 
  # concatenate the words 
  text = text + " " + word
 
 
 
# show only 10 words in the wordcloud . 
wordcloud = WordCloud(width=480,  height=480, max_words=10).generate(text)
 
 
 
# plot the WordCloud image 
plt.figure() 
plt.imshow(wordcloud,  interpolation="bilinear") 
plt.axis("off") 
plt.margins(x=0, y=0)  
plt.show()
输出如下图:
 
用Python生成词云
 
代码2:删除一些单词
 
可以删除一些我们不想显示的词。 为此,请将这些单词传递给WordCloud()函数的停用词列表参数。
 
 
# importing the necessery modules 
from wordcloud import WordCloud  
import matplotlib.pyplot as plt 
import csv
 
 
 
# file object is created 
file_ob = open(r"linuxidc.com.csv")
 
 
 
# reader object is created 
reader_ob = csv.reader(file_ob)
 
 
 
# contents of reader object is stored . 
# data is stored in list of list  format. 
reader_contents = list(reader_ob)
 
 
 
# empty string is declare 
text = ""
 
 
 
# iterating through list of rows 
for row in reader_contents : 
 
 #  iterating through words in the row 
 for word in row :
 
 
 
  # concatenate the words 
  text = text + " " + word
 
 
 
# remove Python , Matplotlib , Geeks Words from WordCloud . 
wordcloud =  WordCloud(width=480, height=480, 
   stopwords=["Python",  "Matplotlib","Geeks"]).generate(text)
 
 
 
# plot the WordCloud image 
plt.figure() 
plt.imshow(wordcloud,  interpolation="bilinear") 
plt.axis("off") 
plt.margins(x=0, y=0)  
plt.show()

dawei

【声明】:九江站长网内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。