19 算法与程序综合应用_第2课时逐字稿 高中 · 信息技术 · 人教中图版 · 必修1 数据与计算

admin492024-01-04 09:54:47

老师

同学们大家好,我是北京市西城区教育研修学院的熊雪婷老师。今天我们一起来学习算法与程序综合应用。2、经过前一段时间的学习,我们对算法有了初步的认识,也具备了一定的编程基础。上节课我们分析解决了一道经典的数学问题。实际上利用 Python 编程,它不仅能处理数值数据,解决数学问题,它在文本数据的处理方面也颇具优势。比如说我们经常看到的热词、榜词、云图、舆情领域分布、文本情感分析等等,这些都是利用 Python 编程对文本数据进行加工处理的结果。看到这些,你是不是有些动心了,今天我们就一起来分析解决一道文本数据处理的相关问题。

老师

好问题来了,我们一起来看一下学校开展经典诵读活动,小明在阅读三国演义的时候,为了分析该文学作品的内容及其写作特色,他想把小说中出现次数最多的 20 个词语查找出来,同学们想一想小明应该如何编程来实现,我们一起来分析一下这个问题。我们的核心任务是查找文章中的高频词,我们现在手里边有的是三国演义的文本文件,在编程的时候我们需要考虑有读取文件这一功能模块,我们要求解的目标是要找出高频词语,在编程的时候要实现显示输出。那么最核心的求解过程又是怎样的?我们可以根据求解目标来向前逆推一下。

老师

首先我们要从文章中识别提取出相关的词语,人在阅读文章的时候能够识别提取相关的词语,计算机能够做到吗?显然是不行的,那么我们需要将文章中切分成适当的词语来让计算机进行分析,这就需要中文分词模块,有了词语之后,我们需要统计出词语的出现次数,这需要词频统计功能。词频统计完之后,任务还没有完成,因为我们要输出符合要求的 20 个词语,所以我们需要相应的词频排序功能。

老师

经过上面的分析,我们将这个查找文章高频词这个较为复杂的任务分解成了读取文件、中文分词统计、词频排序和显示输出这五个功能模块。下面我们将逐一的对这五个功能模块儿进行分析和实现。首先我们来看看读取文件,在之前的学习活动过程中,我们通常是利用音铺的函数从键盘来获取用户输入的少量数据。那么 Python 如何实现读取文件来获取批量的数据?下面请同学阅读任务单活动一中的学习材料输入并尝试理解相关的语句。好,相信同学们都已经完成了任务。下面我们一起来分析一下。实现读取文件这个功能我们需要两步,首先我们要确定要读取的文件的具体的位置,文件的名字,读取的模式以及文件的编码格式。然后我们利用 open 函

查看隐藏内容
《19 算法与程序综合应用_第2课时逐字稿 高中 · 信息技术 · 人教中图版 · 必修1 数据与计算》.doc
将本文下载保存,方便收藏和打印
导出文档