fahui.jdk      ,     2012.01.20

O’Reilly Strata Conference, Santa Clara 2012

摘译自visualising data,从会议的行程简介里,我们能了解到数据可视化最前沿的发展趋势。

第三届O’Reilly Strata Conference将在2.28-3.1(今年是闰年) 于加州的Santa Clara召开。作为“数据的盛会”,会议吸引了最好的开发者、数据科学家、数据分析师,来参与这场数据革命。

数据可视化相关的专场‘Visualization and Interface’有一系列专家(演讲者名单)登场:Noah Illiinsky, Simon Rogers, Jock MacKinlay, Ben Goldacre, Pete Warden, Hal Varian and Max Gadney。


 2月28日,星期二

9:00 Designing Data Visualizations Workshop

9:00 数据可视化设计专题讨论会

Noah Iliinsky (Complex Diagrams)

与会者带上自己的数据和纸笔,向与会的他人交流自己的可视化设计经验,学习如何向陌生人介绍自己的可视化作品。

 

13:30 (1) Hands-on Visualization with Tableau

学习可视化工具Tableau

Jock Mackinlay (Tableau Software), Ross Perez (Tableau Software)

现在Tableau已从一大堆可视化工具中脱颖而出,风头盖过了粗糙的Excel和繁琐的html。 Tableau的两位专家将为你展现Tableau的出众品质。

 

13:30 (2) The Craft of Data Journalism

数据新闻的技艺

Simon Rogers (Guardian)

从《卫报》的获奖记者那里学习他们的绝技:如何以新闻界的速度融合数据、新闻、可视化技术来讲述引人入胜的故事。

 

 2月29日,星期三

8:45 Plenary

8:45 全体会议(非数据可视化专场会议)

Welcome (欢迎词)Edd Dumbill (O’Reilly Media, Inc. ), Alistair Croll (Bitcurrent)
The Apache Hadoop Ecosystem (Apache Hadoop 生态系统)Doug Cutting (Cloudera)
Decoding the Great American ZIP myth (揭秘the Great American ZIP)Abhishek Mehta (Tresata)
A Big Data Imperative: Driving Big Action Avinash Kaushik (Market Motive)
Keynote by Ben Goldacre Ben Goldacre (Bad Science)

 

10:40 (1) Dealing With Messy Data

处理杂乱数据

Q Ethan McCallum (independent)

混乱的数据消耗了数据分析者太多的精力。Q Ethan McCallum, Parallel R (O’Reilly)的作者, 将与我们分享快捷有效地清理数据的经验,使我们将更多的精力放到数据分析上。

 

10:40 (2) Science of Visualization

可视化科学

Jock Mackinlay (Tableau Software)

Tableau的专家将为你讲解可视化的价值。你将学到:1.多年来心理学家、统计学家们的研究成果对优秀可视化设计的启示。2.可视化设计的基本原则。3.如果用可视化来分析数据。

 

11:30 Effective Data Visualization

有效的数据可视化

Hjalmar Gislason (DataMarket)

DataMarket.com的专家向你讲述搭建网络可视化平台的经验:如何解决终端的兼容性,如何构建易于维护的可视化架构,以及如何设计用户友好的可视化应用。

 

13:30 Building a Data Narrative: Discovering Haight Street

让数据说话:探索 Haight Street

Jesper Andersen (Bloom Studios)

Jesper Andersen 将以地理应用中的Haight Street这条街道为例,展示如何在可视化应用中利用简单的技术手段融入数值,文本,图像,让Haight Street自己说话。同时也将介绍利用R、NumPy、OpenCV等工具进行数据处理,以及在地理应用中实现增强现实的技术。

 

14:20 Crafting Meaningful Data Experiences

 精心打造有意义的数据体验

Bitsy Bentley (GfK Custom Research)

数据可视化的一个重要目的就是传达信息。呈现出信息是一方面,让用户方便地理解信息是另一方面。好的数据体验离不开数据可视化和用户体验的完美结合。Bitsy Bentley将结合自己的商业可视化项目,为你介绍如何打造有意义的数据体验。

 

16:00 (1) Netflix recommendations: beyond the 5 stars

Netflix 推荐:超越五星评价

Xavier Amatriain (Netflix)

Netflix基于用户的评价和反馈为用户推荐他们喜爱的DVD,这项服务可以在多种设备上体验,风靡40多个国家。Netfilx的专家Xavier Amatriain将介绍如何在多种设备的紧凑屏幕上加入丰富的上下文信息,为Netflix的用户打造个性化的体验。

 

16:00 (2) Roll Your Own Front End: A Survey of Creative Coding Frameworks

玩转你的前端:可视化代码框架评析

Michael Edgcumbe (Columbia University), Eric Mika (The Department of Objects)

选择哪一种可视化语言、框架来实现特定数据的可视化?这是个困扰许多公司的问题。为了提供一种标准的解决模式,Michael Edgcumbe 和 Eric Mika 调研了各种操作系统(Mac OS X, iOS, Windows, 和Android)上的网络版和本地版的各种可视化代码框架,如Processing, OpenFrameworks, Cinder, Polycode, Nodebox, d3.js, PhiloGL, Raphael.js, Protovis, and WebGL。演讲者用各种代码框架编写可视化实例,评估各种代码框架的优缺点。我们将明白何种代码框架适合何种应用场景。

 

16:50 Sketching With Data

数据的素描

Fabien Girardin (Lift Lab)

为大数据集进行“素描”(建立快速的可视化原型),可以迅速地获取对数据洞察,从而促进决策,推出有用的服务和产品,获取巨大收益。Lift Lab推出了这种原型可视化工具,并且在实际应用中取得了巨大的效益,也受到了大量的关注。Fabien Girardin将给出更详细的介绍。

 

3月1日,星期四

8:45 Plenary

全体会议(非数据可视化专场会议)

Welcome (欢迎词)Alistair Croll (Bitcurrent), Edd Dumbill (O’Reilly Media, Inc. )
Democratization of Data Platforms (数据平台的民主进程)Jonathan Gosier (metaLayer Inc.)
Embrace the Chaos (拥抱混乱)Pete Warden (Jetpac)
Keynote by Usman Haque (Usman Haque的演讲)Usman Haque (Pachube.com)
Using Google Data for Short-term Economic Forecasting (用Google数据做短期经济预测)Hal Varian (Google)
Keynote by Coco Krumme (Coco Krumme 的演讲)Coco Krumme (MIT Media Lab)

 

10:40 Video Graphics – Engaging and Informing

视频图片-吸引、致知

Max Gadney (After The Flood)

视频是可视化的一种重要载体,经验丰富的视频可视化专家Max Gadney将为你介绍如何在视频中融入故事讲述和信息设计。

 

11:30 Rich Sports Data and Augmented Reality

 富体育数据和增强现实

Ryan Ismert (Sportvision, Inc)

体育比赛直播是数据可视化的一个重要应用场景,实时地自动收集比赛数据,并以增强现实的方式展示给电视机前的观众。Ryan Ismert将介绍体育比赛数据收集、展现的技术演变,并介绍当今最先进的棒球比赛数据收集系统FieldFX™ ,以及增强现实的适用原则:1,“看起来很酷”其实并不重要,即使是在体育比赛中。2,必须在适当的关联场景中出现,否则就不该出现。3,增强现实技术已经非常成熟,再精致的可视化效果也只会让专业人员吃惊几秒钟。4.我们有能力实现超预期的增强现实效果,但整个产业还需要时间去适应它。

 

13:30 Visualizing Geo Data

 地理数据可视化

Jason Sundram (Where, Inc.)

在移动设备日益普及的今天,我们收集到了越来越多的地理数据,可视化地理数据变得越来越普遍,不同类型的数据有不同的展现方式。思考地理数据通常有3种方式:1,数据随时间变化;2,统计各个区域(如国家)的数据总量;3,统计不同位置的数据密度(如热力图)。

另外地理数据可视化还要考虑多层次的缩放。这将便于用户理解,但也增加了实现的复杂度。

投影方式也很重要。虽然我们很多人习惯于墨卡托投影,但等面积投影通常是更好的实现方式。

Jason Sundram对同一数据集用以上3种方式逐一可视化。

第一个例子是用Processing 和Tile Mill实现动态缩放的地图,可播放一个月的数据,展示将简单分布的地理数据转化为视频的技术。

第二个例子用d3.js实现各个国家的区域分布图,探讨颜色模式和交互。

最后一个例子将探讨如何用数百万个点绘制热力图。

 

14:20 (1) Beautiful Vectors: Emerging Geospatial technologies in the browser

美丽的航向:在浏览器中融入地理空间技术。

Mano Marks (Google, Inc. ), Chris Broadfoot (Google)

Google的技术专家将为你介绍利用HTML5在浏览器中实现惊人的地理信息展示的技术。

 

14:20 (2) It’s Not “Junk” [Data] Anymore

不再有“垃圾”数据

Kaitlin Thaney (Digital Science), Mark Hahnel (FigShare), Ben Goldacre (Bad Science)

人们收集到越来越多的数据,但很多被认为没有价值而丢弃。特别是科学研究中,一些支持某种结论的数据被保留下来,不支持的被作为“垃圾”丢弃。甚至有人篡改数据。演讲者试图探讨一种数据收集、数据公证模式,使数据获得“公证处”公证,从而保护不支持结论的数据不被删除、不被篡改,进而使受数据支持的研究成果获取更高的可信度。这将有利于科研道德环境的改善。

 

16:00 From Big Data to Big Insights

从海量数据到深入洞察

Robbie Allen (Automated Insights)

随着语义算法、数据处理速度和大数据集读写技术的提高,软件已经可以像人一样讲述一个动人的故事。

Robbie Allen(Automated Insights的CEO)和他的团队利用开发的软件,已经在十个月的时间内为美国的各大体育赛事发布了10万篇报道。他们的关注对象不仅是体育,也开始涉及到财经、房地产、政府新闻、健康医疗等领域。

Robbie Allen将亲自为你介绍内容自动生成技术及其发展方向。

 

16:50 Exploring the Stories Behind the Data

发现数据后的故事

Cheryl Phillips (The Seattle Times)

一个国家调查会提供许多宏观的统计信息,但用户想知道的是这些信息对他个人意味着什么:我的社区有什么改变?我的周围发生了什么?我的邻居怎么样了?如果给用户一个可视化交互应用,这些问题他就可以自己找到答案了。西雅图时报Cheryl Phillips将结合新闻界的各种实例,介绍让用户发现自己故事的可视化策略。

 

参考资料:visualising data