闻 啸

淘宝的可视化工程师,淘宝花名宁朗,从事Web可视化和大数据集可视化的技术研究和开发。


2011年的冬天是个暖冬?

Theseus  2014.06.30
9-3-05

整理之前的文章,无意看到这一篇2012年写的文章还没有发布过。当时还在DataV.js的开发中,想当时刚刚实现的stream来看看能不能从冬装在淘宝平台上销售量来佐证2011是一个暖冬的观点。虽然时隔已经太久,但还是发出来和大家分享一下。

//////////////2012/////////////

微博上看到关于四季服装搜索量变化的stream图,评论中有提到2011年冬季特别短,导致许多商家冬装卖不出去,不知道这个想法是否正确于是手痒拿正在开发的可视化组件库多提了些数据试试。

more

Visualizing MBTA Data分享

Theseus  2014.06.24
MBTA

Visualizing MBTA Data   作者:Mike Barry and Brian Card

通过@数据挖掘与数据分析 转发的  @英特尔商用频道 的相关微博,看到了这个非常出彩的数据可视化分析报告。之所以称之为报告,是因为其中详尽的数据说明和清晰的分析层次,已经不能简单地说是一个数据可视化展示了。

 

交通数据一直是数据可视化的一个热点,Visualizing MBTA Data(VMD)这个作品也将视角锁定在了这个领域,并选取了地铁运行数据来进行数据可视化分析。先介绍一下背景。美国波士顿的马萨诸塞湾交通局掌管着繁忙度全美排名第四的地铁系统。最近马萨诸塞湾交通局将其大量的地铁运营相关数据通过API的形式向公众开放。该API提供的数据良好的遵守了GTFS(一种由GOOGLE制订的常用于交通运输数据的数据格式)规范。

该作品的两位作者正是基于马萨诸塞湾交通局提供的良好数据源,从中提取了2014年2月整月四条地铁主干道的地铁的行驶数据,同时又通过MBTA获得了各个地铁站检票闸的人流量数据。在此基础上,作者认为可以从三个层面来展现数据:地铁的行驶,人们如何搭车地铁,地铁和乘客两者从数据上反映出的相互关联。

可以看到在拥有良好数据源的基础上,作者在提出问题的过程中,完全没有试图去提出解决地铁运营或者改善地铁运营的设想,只是希望更好地展现数据本身。首先作者的前两个问题就将数据源维持在简单的单维度信息源上,没有基于设想两者的融合展示。然后也是希望通过将两个单维数据通过可视化的形式充分展示理解后,再找数据连接点。这无论是从作者自身分析问题,还是阅读者来看这个作品都是一个非常好的分析理解过程。这种前期问题的设定也是非常值得学习的,现在更多人总是在拿到一份数据后总在想通过数据可视化最终找到一个什么问题的症结所在从而解决一个问题,却恰恰跳过了最最重要的看清数据长什么样的过程。

具体对于问题一步步的分析文章里就不详述了,因为原文已经有了非常细致说明,在这儿就说说小编从这个作品中学到的几点。

  • 优秀的联动

 现在,我们在制作数据可视化作品的时候已经非常注意图表间的联动了。最早在袁晓如老师的课上了解做LinkView的优点,现在ECharts更加是做了很好地联动配置。但是在这个可视化作品里,我看到了自己一直忽视的说明文字与图表的联动。例如下图:

点击左边的时间段说明文字,右侧图表的时间轴会自动滚动到对应的时间段。如果说这个联动还太像图例,图中右侧的说明名字中的蓝色文字将会高亮需要注意的异常数据,这就是非常典型的文字说明与图表的联动。这样的联动在这种明细展示类型中特别好用,可以帮助用户快速进入分析过程,这种的分析结果输出不显得突兀,有别于单纯信息图表的信息输出。

  • 自身图表的完善

 说实话刚看到作品中第一个地跌行驶数据的可视化行驶,心中咯噔了一下,这种大规模数据的展示如果在页面中出现分页的情况,非常不利于可视化的解读。虽然良好的交互以及明白了作者所要体现的问题,让我体验的感觉好了不少,但还是觉得有更好地形式来展示这份数据。作者仿佛准备抓住了我的这种心里,在这个段落的最后给了我惊喜。

这张图其实相当于上图的压缩版,在非常小的空间里简洁明了的展示了总体数据的形态,也非常容易捕获异常数据的所在。同时在这一个可视化上面的说明文字中也与这幅图有联动,真是让人充分感受了良好的数据阅读体验。

  • 清晰层次

作者在用数据可视化展现数据的同时,也通过良好的分析层次结构展现出来。无论将总的问题拆成三个层次鲜明的三大部分,还是数据可视化方法从前到后由简到繁、从分到总得设计,都让读者仿佛跟着两位作者一同完成了这个作品,所以说这篇文章本身也是对于两位作者分析过程的一种可视化展示。

这个作品让小编非常激动,一口气写下了这篇文章,其中有什么错误的地方请大家指出,也欢迎大家在微博上继续和我们讨论。谢谢大家!

 

 

 

欧元危机-纸币危机的多米诺骨牌

Theseus  2012.05.25
11

 

自两年前希腊债务风波发生以来,欧债危机一波三折此起彼伏,近来呈现向欧元区核心国家蔓延态势。作为债务危机重灾区,欧洲已成为拖累未来全球经济增长的最大单个不确定因素。本文所讲述发表在纽约时报上的一个对欧元危机的可视化纵览。
more

浙大CAD&CG可视化与可视分析小组成果介绍

Theseus  2012.03.26
52

细雨绵绵白娘子折腾不停的江南三月里,datav社区成员来到了美丽的浙大紫荆港校区,跟浙大的师生们交流,收获颇多:)直接切入正题,以下是他们的一些研究成果,解决问题的思路和方法都很赞,爱好者们有福啦~

感谢实验室的编辑整理。

 

VAG可视化与可视分析简介

浙江大学计算机学院CAD&CG国家重点实验室可视化与可视分析小组(实验室主页 ,新浪微博:浙大可视化小组)成立于2008年9月,学术带头人是陈为教授(主页:http://www.cad.zju.edu.cn/home/chenwei,   新浪微博:浙大陈为)。

小组共有包括博士后、博士生、研究生、本科生等在内10余名成员,专注于可视化和可视分析的研究,研究方向主要包括:复杂数据的可视化、可视分析的基础理论与方法、面向领域的可视分析原型系统等。小组成员迄今发表6篇IEEE Visualization论文,包括中国大陆在此会议上发表的前三篇第一单位的论文(2004,2009)。

小组与国内外高校和科研机构广泛合作,包括普度大学、香港科技大学、加州戴维斯分校、北卡夏洛特分校、密西西比州立大学、博世北美研究院、微软亚洲研究院等。由小组5名成员在博世北美研究院合作开发的全球第一款非真实感三维GPS导航系统,已经投入全球汽车市场。

 

研究成果展示第一部分(I

主题超图:长文档的抽象可视化

一个长文档中的语义变化可以使读者在读文档之前对文中的事件演变加以了解,但是这种语义变化往往难以刻画。文档可视化工作用可视化的方法生动地表达了长文档的大纲和主题演变,使读者在阅读全文之前对文章有一个概览。该工作对长文档进行分段处理,然后将每一段看作一个节点,并用LDA文本分析算法对整个文档抽取若干个主题(每个主题由多个关键词组成),并构建一个层次的主题超图表达,即文档段作为节点、主题作为超边,用Bubble Set表达超图结构。

下图例子显示了《简爱》一书的4个不同层次的主题超图的表达结果。左图是系统的界面,右图是效果汇总。7个主题,一种颜色代表一种主题;38段文本,一个节点代表一段文本,同一种颜色的Bubble Set包围的节点拥有共同的主题。节点之间的位置关系用多维尺度分析(MDS)方法布局,表达了主题之间的相似性,即越相近的节点文本主题越相似。从结果中看到每个主题在不同章节的演化、过渡和混合情况。下右图顺时针依次是最顶层、中间层和最精细层(下排两个)的超图表达。

 

 

 

 

无线自组网的攻击模式可视分析

由移动网络设备(手机、平板电脑、笔记本等智能移动终端)和固定网络设备(基站、无线路由器等)组成的无线自组网是一个规模较小的网络图,无线自组网的攻击模式可视化工作模拟仿真网络中的攻击模式,监控该网络的安全性,识别package drop、bad mouthing、bragging、sybil、new comer等攻击模式和未知攻击模式。

下图对整个无线自组网进行了可视化。左上角的网络图展现了整个无线自组网的拓扑结构,左下角的折线图可以看出整个网络的丢包率等性能,相邻矩阵视图表达了行节点对列节点的评价,原则上评价基于列节点对行节点的包传送质量,丢包多评价就低,红色表示差评,绿色表示好评。可以看到虚线框中的红色值表现bad mouthing的攻击模式,就是攻击路由节点对普通节点的恶意差评;而实线框中有些普通节点对攻击节点有好评则是因为攻击节点的conflict behavior,即攻击节点对部分节点丢包率高,另一部分节点不丢包,以期达到比较好的评价;相邻矩阵视图右下角是攻击节点对攻击节点的评价,突出的一行绿色好评是bragging攻击模式,也即攻击节点对其它攻击节点好评。

更多细节请见:http://www.cad.zju.edu.cn/home/pengdichao/publications.html

 

 

基于节点绑定的图简化方法

在大规模图的可视化过程中总是会遇到视觉遮挡的问题,基于节点的边绑定工作从节点出发,通过控制点查找、样条曲线生成、透明度控制和交互图浏览集成四个步骤达到减少大规模图的视觉遮挡的目的,展示出复杂关系的方向性特征。与其它常规边绑定相比基于节点的边绑定从节点出发,大大降低了绑定的计算复杂度,能够达到实时的边绑定效果。

如下图展示的无线自组网信任关系的基于节点边绑定效果,从结果中可以看出同处于网络中间的A、B两点,A点的不信任评价来自于网络下半部分,而B的不信任评价来自于网络的上半部分;处于网络边界位置的C、D、E得到的评价较少,而同处于边界位置的F、G则得到更多的评价,这是因为F、G两点刚好处于图的分割位置,少了这两个点整张网络图将被分割成两张图。

更多细节请见:http://www.cad.zju.edu.cn/home/pengdichao/publications.html

 

 

最后付上datav社区成员和浙大师生的合影~希望以后有更多的爱好者在一起交流:)

PKUVIS微博可视分析工具

Theseus  2012.03.12
北大围脖

隆重推荐这个很赞的微博可视分析工具,出自北京大学可视化与可视分析研究组
原文转载自:http://vis.pku.edu.cn/weibova/about/intro/        应用地址:http://vis.pku.edu.cn/weibova/weiboevents/

微博这个名字,您一定不陌生,说不定您还是最积极的用户之一呢,但是如果您仅仅把微博用作亲朋好友交心、分享、聊天的工具,那么您仅仅看到了它的冰山一角。随着社交网络的发展,微博更成为事件传播的途径之一,各种各样的新闻和故事在微博的帮助下在微博用户的推动下更完善而壮大起来。

也许聪明的您早就洞悉到了这点,您可能还会说,“是呀,我经常用微博自带的事件查看功能查看热门事件,我还会利用微博的搜索功能寻找相关的微博呢”。但是您知道吗?使用这种方式,您看到的只是一条一条的微博列表,而并不容易看清事件发展的全貌,甚至会让您陷入到茫茫的微博海洋中而无法迷失方向。

您可能会问,“那怎么办呢?微博具有这么强大的挖掘故事的潜质,却没有一个好的工具帮我看清故事的概貌和细节,那不是一种很大的浪费吗?”。
more

嘿~一起来吧~~datav核心编辑团队招人啦~~

Theseus  2012.02.29
招人banner2

亲爱的数据可视化爱好者们~~

DataV网站上线已经有近一个月时间了。在这段时间里,我们深深的感觉到,要持续不断的向行业发布数据可视化领域最新信息,介绍和分析高质量的可视化案例,单凭我们几个人的力量是很难做到的。
同时,DataV的目标是建立一个国内数据可视化爱好者的社区(网站正逐步社区化改版中),“开放”和“分享”是DataV的发展宗旨。

基于上述原因,我们希望面向社区成员,征集并建立DataV核心编辑团队。
more

好莱坞电影大比拼

Theseus  2012.02.28
hollywood1

Hollywood Cinemetrics:
好莱坞电影是全球电影界响当当的品牌,但是在这个巨大品牌光环下的各部电影是否都在各方面有着类似的评分呢?Hollywood Cinemetrics可以回答这个问题。

more

tweets声响遍世界

Theseus  2012.02.24
450

A World of tweets:
社交网络数据一直备受可视化领域的青睐,twitter作为全球使用范围最广的一个社交网络及微博客服务网站,自然也是人们关注的重点。这次Frog Design出手了。

more

古刹灵隐的可视化

Theseus  2012.02.23
450 SAM_5420

随着人们对可视化认识的逐步加深,可视化会议也越来越多,比如今年一场可视化的国际会议VINCI’12就要在杭州举行,而杭州这座城市跟可视化的渊源可是要远早于此。。。。。
more

生活灿烂如花

Theseus  2012.02.20
450 1

继续回顾一个可视化的经典案例
Better Life:
经济合作与发展组织(OECD)几乎囊括了世界上所有发达国家,其中绝大部分国家都是世界银行“高收入”标准的经济体。那如何展现这些国家居住状况的差异并不容易。于是由Moritz Stefaner和Raureif制作的OECD Better Life Index诞生了。

more

上一页1 (of 7)下一页