22 数据整理逐字稿 高中 · 信息技术 · 人教中图版 · 必修1 数据与计算

admin252024-01-04 09:54:48

老师

大家好,我是北京市第三十五中学的李娟老师,今天咱们一起来学习数据整理这节课。首先让我们一起来回顾一下之前本单元学习过的内容。通过之前的学习,我们已经了解到数据处理的一般过程,包含数据采集、数据整理、数据分析和数据呈现四个过程。上节课我们已经学习了数据采集,并且通过活动体验了数据采集的方法和过程。那么采集到的数据是怎样保存的?常见的数据保存形式是云存储,数据库文件形式保存。那么什么是云存储?云存储是一种网络存储技术,用户可以通过网络随时存取文件,比如我们常见的百度网盘就是一种云存储的应用。数据库是一种保存管理数据的软件,它可以将数据以结构化的方式保存和管理,即使是数百万条的数据,也可以快速查找到所需要的数据。

老师

文件形式保存是我们最熟悉的方式,也是我们最常用的方式。以文件形式保存数据,常见的是文本 TXT 和 CSV 格式。 TXC 格式大家比较熟悉,其实 CSV 文件也是一种文本格式,但是里面的数据是以固定符号来分隔的,通常以英文逗号来分隔,这种格式可以直接用Excel、 WPS 等表格软件来打开。如图所示,文本数据行就是表格的一行,逗号间隔的数据就是表格中的列,这就是 CSV 文件的特点。

老师

上节课我们通过网络和传感器采集到了数据,那么这些采集到的数据是否可以直接使用?我们一起来看一下如图所示这部分的原始数据,这是一部分学生体质健康的数据,请仔细观察该数据存在什么问题。我想大家应该都观察到了,数据存在着重复、空缺和数据单位不正确的情况,如图中黄色趋于所示。其实一般数据采集都会存在一些问题,比如数据的缺失、数据错误、数据重复、数据非标准化的问题。这类存在问题的数据我们形象的称之为脏数据。我们对于数据处理的目的是为了从数据中提取出数据的价值,只有完整的、统一的、准确的数据才是有效的数据,而从有效数据中我们才可以提取出数据的价值,为分析决策提供依据。所以我们要对原始数据做出一定的处理,将其转变为清洁数据,这就是我们数据整理的目的。

老师

怎样才可以将问题数据处理成清洁数据?我们要通过去重来删除重复数据,通过补漏来补全缺失数据,通过刊物来纠正数据中的错误和非标准化的问题。下面我们通过几个活动来体验数据整理的过程。金山银山不如绿水青山,我们国家这些年一直致力于环境的治理、生态修复,也落实了很多政策,关停了很多污染企业。随着环境的治理,你所在的城市或地区

查看隐藏内容
《22 数据整理逐字稿 高中 · 信息技术 · 人教中图版 · 必修1 数据与计算》.doc
将本文下载保存,方便收藏和打印
导出文档