33 5.2.2 数据的存储和保护逐字稿 高中 · 信息技术 · 粤教版 · 必修1 数据与计算

admin282024-01-04 09:55:29

老师

同学们好,我们上节课学习了数据的采集,我们了解了数据采集的方法和工具,了解了 Python 的第三方库及其作用,还体验了网络爬虫的实现。如果我们采集的数据量很大,种类很多,无法使用上节课的电子表格简单存储,我们又应该如何去存储这些数据,保护数据安全?使用本节课,我们就来学习数据的存储与保护。同学们,在上节课,我们使用爬虫程序采集了网络数据,在数据采集结束以后,我们需要将之存储以供后续的处理。我们可以怎样存储这些数据?是的,我们可以把自己采集的数据存到电脑里、 u 盘里、移动硬盘或者 NAS 存储服务器中。这些指定位置存储的方式,即使服务器是在网络中,我们也称之为本地存储。除了存储到本地,我们还可以把数据存放在哪里?互联网中还有一种存储方式,你不需要知道文件具体存放在什么地方,只要有一个入口给你,你就可以存取数据。这种方式就是云存储,存储空间大,存储速度快,非常方便。综上所述,数据的存储主要有两种方式,本地存储和云存储。那么到底什么是云存储?云存储是把各类数据存储在虚拟的逻辑模型里,其物理空间存储在跨越多个地域放置的众多服务器中,为用户提供统一、灵活、安全的云存储服务。云存储由供应商负责管理,这些服务器管理数据的使用和访问权限,以及云存储环境的日常运营和维护。供应商会在后台设定存储的虚拟化资源,每当有存储任务发生,数据具体在哪个服务器存取,由供应商统筹,用户只要提出需求即可。

老师

对于用户而言,无需关注云存储系统的具体运行,仅需获取存储空间,把自己的数据存储进去,这样可以节约用户大量的资源。维护软硬件,只要把注意力放在数据本身即可。对于海量的云数据来说,我们常采用分布式文件存储或 no circle 数据库存储,其中分布式文件存储的方式如图,数据分散在很多个存储节点,每个存储节点也存放不同的数据。这样做的目的就是在数据存取的过程中,我们可以同时从多个存储节点存取数据,效率是单台服务器的很多倍。而且我们可以通过增加存储节点的方式快速扩容。我们还会在各个服务器上存储文件的冗余信息,以便在某存储节点损坏的时候不丢失数据。

老师

分布式文件存储有很多优势,总的来说,它具有大容量、高性能、高可靠、易扩展、一管理等特性。目前还流行着一种叫做 no circle 数据库的存储方式。对于 no circle,目前没有一个明确的范围和定义,主要指区别于传统的关系型数据库的

查看隐藏内容
《33 5.2.2 数据的存储和保护逐字稿 高中 · 信息技术 · 粤教版 · 必修1 数据与计算》.doc
将本文下载保存,方便收藏和打印
导出文档