Computational Communication

Data Journalism

数据新闻

Nanjing



About

数据新闻是南京大学新闻传播学院新闻采写课程包系列中的核心课程之一,旨在为所有新闻专业和有志于从事新闻工作的同学提供数据新闻的知识和基本训练。数据新闻(data journalism)是指基于数据的抓取、挖掘、统计、分析和可视化呈现的新型新闻报道方式。本课程以《The Data Journalism Handbook》(2012)和《数据可视化的基本原理与方法》(陈为等,2013)作为授课教材。通过本课程的同学应该具备基本的数据新闻素养,具体包括收集数据、清洗数据、分析数据、可视化数据的能力,能准确地运用数据语言报道新闻事实。

05010520 数据新闻(20151-05010520-1)

2013 新闻-记者班 2014 新闻-新闻 周四 第1-2节 仙Ⅱ-218

二、教学内容

数据新闻的目标是为了生产数据驱动的新闻产品。它综合了新闻生产、新闻数据抓取、新闻数据分析、新闻数据呈现(如可视化)。从学科的基础而言,它建立在新闻传播学、数据科学、可视化技术三个领域之上。对新闻生产者提出了前所未有的高要求,即需要数据新闻生产者掌握新闻理论,又需要对数据科学、可视化技术有充分地理解,同时需要掌握各种各样的工具。一个成熟的数据新闻产品正是道、术、器三者完美的结合, 需要新闻编辑(具有数据新闻的敏感性)、数据挖掘程序员(掌握数据科学工具,Python或R)、前端程序员(掌握HTML5, JS)、设计师(掌握AI)四方的协同努力。完全掌握这些方面知识的人几乎没有,因而被Jonathan Stray称之为“独角兽”。

Jonathan Stray强调了计算机科学与新闻学的融合。但我们知道这背后除了计算机科学之外,还涉及到:

  • 可视化(visualization)
  • 自然语言处理(natural language processing)
  • 社会网络分析(social network analysis)
  • 统计学(statistics)
  • 机器学习

就数据新闻的生产过程而言,例如有人将数据新闻的生产过程分为四个阶段:数据(Data)、过滤(Filter)、可视化( Visualize)、故事( Story)。我们将之分为五个阶段:

  • 1. 数据新闻选题----关于数据新闻的理论(1)
  • 2. 新闻数据抓取----Python(2)
  • 3. 新闻数据分析----Python,R(2),Excel
  • 4. 传播数据新闻(如数据可视化)----Tableau(1),HTML5(1), Javascript(1), echarts(1), D3.js(1), Processing(1), Adobe Illustrator(1)
  • 5. 分析数据新闻效果----网站分析工具

值得注意的是,以上四个过程是存在交叉的。例如数据挖掘可以为新闻生产寻找故事(finding stories through data mining), 而故事的提炼需要从海量的信息当中过滤信息(filtering an overwhelming volume of information),分析数据新闻效果可以指导传播数据新闻(communicating what you’ve learned)和数据新闻选题。

综上,数据新闻涉及多种技能,其复杂性和线性的授课方式之间存在天然的矛盾。需要注意的是,作为一门框架类课程无法保障学生可以面面俱到,但我试图调和二者之间的矛盾。另外,作为一个快速发展的领域,数据新闻涉及到很多不断涌现的工具和方法。因此,需要在兼顾课程复杂性的同时,选取最重要的工具予以介绍。

Data Journalism's Toolbox

Speakers

  • 王成军 Cheng-Jun Wang, 南京大学新闻传播学院助理研究员,奥美数据科学实验室主任,计算传播学实验中心成员,香港城市大学互联网挖掘实验室成员。
  • week topic note
    1 数据新闻导论 https://github.com/data-journalism/djclass2015
    2 课程简介+github介绍 第一次作业
    3 R语言简介 第二次作业
    4 数据新闻:未来、现在、过去 第三次作业
    5 计算媒介:以processing为例 (上) https://vimeo.com/channels/introcompmedia/
    6 计算媒介:以processing为例 (上) 第四次作业
    7 数据获取 第五次作业:选题提案
    8 数据科学的编程工具
    9 python数据抓取简介 第六次作业:python抓取天气数据
    10 数据可视化:概念、案例和方法
    11 R语言可视化介绍 第七次作业:ggplot2练习
    12 H5和Javascript初步:HTML
    13 H5和Javascript初步:CSS
    14 H5和Javascript初步:JS
    15 H5和Javascript初步:D3简介 第八次作业:D3练习
    16 数据可视化:echarts简介 第九次作业:echarts练习
    17 传播网络分析: gephi的使用
    18 学生作品展示