数据可视化的概念

作者:  //  2010 年 7 月 10 日  //  可视化  //  没有评论

数据可视化的概念

这是风靡网络的Facebook全球用户热度图,该图是先从Hive中抽取用户的信息,再利用统计软件R进行数据挖掘,然后根据定义的权重值画线,最后用色盘来标识获得。当然最为复杂的是这些连线处理,因为这些线条并非两点间的直线,而是曲线。

理解数据可视化

数据可视化 Data Visualization 和信息可视化 Infographics 是两个相近的专业领域名词。

  • 狭义上的数字可视化指的是将数据用统计图表方式呈现,而信息图形(信息可视化)则是将非数字的信息进行可视化。前者用于传递信息,后者用于表现抽象或复杂的概念、技术和信息。
  • 广义上数据可视化是信息可视化其中一类,因为信息是包含了:数字和非数字的。
  • 从原词的解释来讲:数据可视化重点突出的是”可视化”,而信息可视化则重点是”图示化”。
  • 整体而言:可视化就是数据、信息以及科学等等多个领域图示化技术的统称。

数据可视化起源于1960s计算机图形学,人们使用计算机创建图形图表,可视化提取出来的数据,将数据的各种属性和变量呈现出来。随着计算机硬件的发展,人们创建更复杂规模更大的数字模型,发展了数据采集设备和数据保存设备。同理也需要更高级的计算机图形学技术及方法来创建这些规模庞大的数据集。随着数据可视化平台的拓展,应用领域的增加,表现形式的不断变化,以及增加了诸如实时动态效果、用户交互使用等,数据可视化像所有新兴概念一样边界不断扩大。

而我们熟悉的那些饼图、直方图、散点图、柱状图等,是最原始的统计图表,它们是数据可视化的最基础和常见应用。作为一种统计学工具,用于创建一条快速认识数据集的捷径,并成为一种令人信服的沟通手段。传达存在于数据中的基本信息。所以我们可以在大量PPT、报表、方案以及新闻见到统计图形。

但最原始统计图表只能呈现基本的信息,发现数据之中的结构,可视化定量的数据结果。面对复杂或大规模异型数据集,比如商业分析、财务报表、人口状况分布、媒体效果反馈、用户行为数据等,数据可视化面临处理的状况会复杂得多。

一般包括数据的采集、分析、治理、管理、挖掘在内的一系列复杂数据处理,然后由设计师设计一种表现形式,是立体的、二维的、动态的、实时的还是允许交互的。然后由工程师创建对应的可视化算法及技术实现手段。包括建模方法、处理大规模数据的体系架构、交互技术、放大缩小方法等。动画工程师考虑表面材质、动画渲染方法等,交互设计师也会介入进行用户交互行为模式的设计。

大型的数据可视化作品或项目的创建,需要多领域专业人士的协同工作才能取得成功,尤其是BI商业智能。人类能够操纵和解释如此来源多样、错综复杂跨领域的信息,其本身就是一门艺术。

讲透上述内容,读者就明白为何是使用EXCEL来完成数据可视化的了 。

数据可视化的应用

数据可视化的开发和大部分项目开发一样,也是根据需求来根据数据维度或属性进行筛选,根据目的和用户群选用表现方式。同一份数据可以可视化成多种看起来截然不同的形式。

  • 有的可视化目标是为了观测、跟踪数据,所以就要强调实时性、变化、运算能力,可能就会生成一份不停变化、可读性强的图表。
  • 有的为了分析数据,所以要强调数据的呈现度、可能会生成一份可以检索、交互式的图表
  • 有的为了发现数据之间的潜在关联,可能会生成分布式的多维的图表。
  • 有的为了帮助普通用户或商业用户快速理解数据的含义或变化,会利用漂亮的颜色、动画创建生动、明了,具有吸引力的图表。
  • 还有的被用于教育、宣传或政治,被制作成海报、课件,出现在街头、广告手持、杂志和集会上。这类可视化拥有强大的说服力,使用强烈的对比、置换等手段,可以创造出极具冲击力自指人心的图像。在国外许多媒体会根据新闻主题或数据,雇用设计师来创建可视化图表对新闻主题进行辅助。

数据可视化的应用价值,其多样性和表现力吸引了许多从业者,而其创作过程中的每一环节都有强大的专业背景支持。无论是动态还是静态的可视化图形,都为我们搭建了新的桥梁,让我们能洞察世界的究竟、发现形形色色的关系,感受每时每刻围绕在我们身边的信息变化,还能让我们理解其他形式下不易发掘的事物。

关于作者

Ms Office爱好者,仅仅就是一个懂得高效偷懒的伙计,但绝对不是属于Office软件的骨灰级玩家,相对注重实用。比较热衷数据可视化,当然这个爱好中忒注重视觉的部分,和我的工作基本无关,但就是喜欢。

查看所有 的文章