基于词典的中文情感倾向分析算法设计

情感分析情感倾向可认为是主体对某一客体主观存在的内心喜恶,内在评价的一种倾向。它由两个方面来衡量:一个情感倾向方向,一个是情感倾向度。

情感倾向方向也称为情感极性。在微博中,可以理解为用户对某客体表达自身观点所持的态度是支持、反对、中立,即通常所指的正面情感、负面情感、中性情感。例如“赞美”与“表扬”同为褒义词,表达正面情感,而“龌龊”与“丑陋”就是贬义词,表达负面情感。

情感倾向度是指主体对客体表达正面情感或负面情感时的强弱程度,不同的情感程度往往是通过不同的情感词或情感语气等来体现。例如:“敬爱”与“亲爱”都是表达正面情感,同为褒义词。但是“敬爱”远比“亲爱”在表达情感程度上要强烈。通[……]

Read more

想不想成为:数据艺术家(Data Artisan)

想不想成为数据艺术家 Data Artisan!

掌握 Alteryx、Tableau、R、D3是俺最喜欢的软件工具!

111234

大数据领域:数据科学、网络科学、空间地理科学、可视化技术111232

数据新闻:新闻人开始用数据来呈现想说的真实故事!

111231

文章来源:南都全媒体集群官方微博
7e0d9338gw1eecqx4e790j20c82oxdy5

用Tableau制作世界名画的

今天无聊,从某Tableau博客找到了Tableau可以制作世界名画的技术,挺有意思!

想法找到数据,原来是一个著名的数学TSP问题。

旅行推销员问题(Travelling Salesman Problem, 又称为旅行商问题货郎担问题TSP问题)是一个多局部最优最优化问题:有n个城市,一个推销员要从其中某一个城市出发,唯一走遍所有的城市,再回到他出发的城市,求最短的路线。也即求一个最短的哈密顿回路

从网站找到六幅世界名画的TSP数据,网站:http://www.math.uwaterloo.ca/tsp/data/art/index.html

制作图形:1)散[……]

Read more

Tableau 中文教程——内有大量案例

#公告·Tableau 中文教材# 各位朋友,数据可视化重要性不言而喻,Tableau作为一款极速可视化分析工具,深受喜爱!为此,我们现将由博易智讯主要针对Tableau 7.0撰写的中文教程电子版公开发布,并补充8.0版功能,全书共300页,供大家免费下载。欢迎交流探讨。点击http://t.cn/zH9Yo9a,选择Tableau教材。

be8c1e18jw1echoxuis6oj20bm0gbwfx

用Tableau展示MH370周边机场位置

有消息说:马来西亚空军首长Rodzali Daud确认,MH370于8日早上2:40从马空军在Butterworth的雷达上消失,地点在马六甲海峡中的Pulau Perak。——下载OpenFlight全球机场数据,标示马来西亚及周边国家机场位置,密密麻麻的机场,777-200机型庞然大物,雷达竟然不知?

将Airpots.csv文件命名后导入Tableau,选择特定WMS链接地图,选择主要国家,展示马来西亚及周边国家机场位置!MH370 MH3701

用Tableau展示全球恐怖事件

【Global Terrorism Database—全球恐怖事件数据库,从1970-2012年底共记录113113个恐怖事件】,用Tableau通过地图,分国家、城市、Attack type、Target type展示,如图,点击http://t.cn/8FdJFIO,图之间可联动、钻取交互查看。另外,在首页上鼠标悬浮于某个国家时,点击链接是可直接下钻到该国城市明细的。

图1

图2

图3

 

Alteryx兼具ETL、Mining、Blending和Spatial分析软件

2014212102012114

Alteryx公司的使命是成为一个一站式数据统计分析平台,Alteryx 的软件可以像 Tableau 一样将数据运算与精美的图像完美地嫁接在一起,同时又能够和 SAS 及 R 语言一样统计和分析数据,可以说 Alteryx 就是前三者的混合体。值得关注的还有Alteryx在分析空间地理数据上的领先优势:

  • Alteryx可以快速地预处理空间数据,如地理编码、数据清洗及数据融合,通过拖放式的操作界面,无需任何编码,即可快速地实现空间地理分析,然后以地图形式展示出来。
  • Alteryx可以连接到各种主流空间数据源,如Map Inputs、ESRI文件、MapInfo文件及[……]

Read more

解释 Data Science

一种解释Data Science 信息来源:https://s3.amazonaws.com/aws.drewconway.com/viz/venn_diagram/data_science.html

解释Data science:

数学与统计知识
一旦你开始清理已获得的数据,那么从数据中提取信息的洞察力就显得尤为重要。你需要能运用恰当的数学和统计方法,特别是熟悉这些工具的基线。

黑客技术
数据作为电子交易的商品,需要借助黑客技术才能在“市场”中存在。为了躲避’黑帽’活动,数据黑客们必须能够处理文本文件的命令行,在算法上深入思考并不断学习新的工[……]

Read more

大数据助力社会科学研究:挑战与创新

[现代传播 2013.8】

大数据助力社会科学研究:挑战与创新

沈浩  黄晓兰

关键字:大数据时代 数据科学 网络科学 数据挖掘 社会科学 社交网络 微博

摘要:

大数据时代已经来临,如何从海量数据中发现知识,寻找隐藏在数据中的模式、趋势和相关性,揭示社会现象与预知社会发展规律,需要我们拥有更好的数据洞察力。 随着社交网络、移动互联网和物联网的兴起,大数据会越变越大,网络科学和数据科学提供了新的科学发展观和方法论。大数据对社会生活、媒介生态和商业带来机 遇与挑战是颠覆性的,大数据带来社会科学研究的春天,我们必须拥抱大数据,拓展新闻传播研究新疆界,勇于创新,迎接挑战。

“[……]

Read more

国内网络舆情服务技术特征和市场形态的观察与分析

——-国内网络舆情服务技术特征和市场形态的观察与分析

赖正权 (笔名:余青萍)

摘录:http://blog.gmw.cn/blog-1197-471220.html?utm_source=bshare&utm_campaign=bshare&utm_medium=sinaminiblog&bsh_bid=217163727

摘要:互 联网改变了信息传播和社会形态的发展。目前,在舆论场域存在着主流媒体与公民媒体(自媒体)之间的博弈。在这博弈过程中,政府部门除了通过硬性权力制定游 戏规则外,还尝试着电子政府的软权力和舆情预警提高风险管理能力的巧权力来加重[……]

Read more

谈谈大数据——Big Data时代的一点看法

    前两天老朋友更夫-海鹰兄在微博上问大数据问题,联想最近很多人都在问我大数据分析,或希望培训大数据课程。

说实话,我也没有见过大数据,我更愿意说这是大数据时代!

或许是大数据太热了,啥学科背景的人都在谈论,特别是人文学者、商界人士都在谈论,说明大数据时代到了,是他们点燃了大数据时代,这该感谢!

巴拉巴西的中文版《爆发》一书出版,俺写了推荐语:

         这是一个令人兴奋的时代,也是一个大数据的时代,社交媒体让我们越来越多地从数据中观察到人类社会的复杂行为模式。以数据为基础的技术决定着人类的未来,但并非是数据本身改变了我们的世界,起决定作用的是我们对可用[……]

Read more

Twitter数据建模——预测2012美国总统选举

013-04-04 23:06 阅读(2351)评论(1)

【善科文库:2012年美国总统选举】微博和数学的力量!Twitter和微博的搜索功能可以适时地收集大量信息;而Choy等人(2011)的文章中的数学模型,成功地运用了Twitter数据预测了美国的总统人选。这里面的奥秘是什么呢?
2012年美国总统选举
使用人口普查修正的Twitter模型Murphy Choy

关键词: 数学模型, 选举, 微博
美 国2012年总统大选一直是两位主要候选人之间势均力敌的一场角逐。这期间曾有几次非常激烈的比拼。此次选举反映了选民对现任总统奥巴马任内的成就的看 法。竞选活动历时数月,活[……]

Read more

词云可视化——中文分词与词云制作

 

近日在微博上大家都在问《个性化词云》制作方法。下面简单介绍实现步骤和思路:
随着微博研究的深入,社会网络分析和可视化技术的需要,面临中文处理问题,开始钻研文本挖掘的问题,过去的传统的数据挖掘一直研究的是结构化数据,文本挖掘和意见挖掘涉及内容更多,特别是中文处理是不可逾越的障碍!
注:俺的中文不好,甚至想过把中文google translate成中文进行研究,英文的文本挖掘技术基本了解!哈哈
从 网络分析、文本挖掘和意见挖掘角度看,主要解决以下内容:网络抓数据—MySql和Hadoop存储—API接口—创建网络数据—Knime和R语言挖掘 -KOL意见领袖和网络分析—中文语料和文本语[……]

Read more