标签归档:文本挖掘

词云可视化——中文分词与词云制作

 

近日在微博上大家都在问《个性化词云》制作方法。下面简单介绍实现步骤和思路:
随着微博研究的深入,社会网络分析和可视化技术的需要,面临中文处理问题,开始钻研文本挖掘的问题,过去的传统的数据挖掘一直研究的是结构化数据,文本挖掘和意见挖掘涉及内容更多,特别是中文处理是不可逾越的障碍!
注:俺的中[……]

Read more

探讨文本挖掘在互连网关键词中的应用 ——以新浪体育国际足球新闻标题为例

 

在数据分析技术中,文本分析的使用一直是一个较少被涉及的领域,特别是有关中文文字的文本挖掘。

文本挖掘大致可由三部分组成:底层是文本数据挖掘的基础领域,包括机器学习、数理统计、自然语言处理;在此基础上是文本数据挖掘的基本技术,有五大类,包括 文本信息抽取、文本分类、文本聚类、文[……]

Read more