banner

数据科学与大数据技术

发布时间:2021-08-04 浏览次数:

1.大数据技术导论

本课程4学分,课内学时72学时, 开设一学期,为专业必修课

大数据作为高科技时代的产物,在数字经济发展中具有重要意义。本课程围绕什么是大数据,什么是大数据技术,如何学习大数据技术等基本问题,主要讲述数据科学概述,大数据生命周期,大数据获取与存储管理,大数据抽取与清洗,大数据去与标准化,大数据约简与集成,大数据分析与挖掘,分析结果解释与展现等。

通过本课程的学习,使学生深入理解大数据技术的基本概念和主要功能,掌握常用大数据预处理与分析的基本方法,了解大数据处理环境是如何部署和运作的,从而为学生今后投身信息化建设、进行大数据应用开发打下基础。

先修课程序设计语言

2.Python程序设计

本课程4学分,72学时,开设一学期,为专业必修课。

本课程通过向学生介绍Python程序设计知识,使学生掌握Python程序设计的基本方法,培养学生面向过程和面向对象的程序设计思想,增强学生应用计算机编程处理实际问题的能力以及逻辑思维能力,同时注重培养学生编程能力、项目管理能力以及开源社区终身自主学习能力,为后续进一步学习编程知识,从事软件编程开发及算法研究工作奠定编程基础。

主要内容包括:概述,数值的表示,I/O系统交互与批量数据处理,Python编程中的逻辑与控制,函数,Python的文件处理,Python面向对象的编程技术,测试、异常与异常处理,Python包与模块功能规划基于Python的大数据项目演练

先修课程:无

3.数据结构与算法

本课程4学分,课内学时72学时,开设一学期,为专业必修课。

通过本课程的学习,学生将熟悉常用的数据结构和算法,理解各种数据结构及它们与算法之间的关系,掌握有效组织数据和处理数据的方法和技能。结合大数据技术中常用的数据结构及算法实例,在大数据及相关软件开发中选择合适的工具并设计高质量的程序,更好地为大数据专业服务,更好地服务于国家信息化建设。

本课程的主要内容:介绍数据处理中常用的数据结构——线性表、树与二叉树、图以及基本的数据处理技术——查找和排序方法。同时,把回溯法、分治法、贪心法、动态规划法等常用的算法设计方法融入其中,使数据结构和算法紧密结合。

先修课程:程序设计语言

4.大数据预处理

本课程4学分课内学时72学时开设一学期,为专业必修课。

通过本课程学习,使学生了解数据分析开始前提高数据质量、提高数据信息含量的数据预处理方法,并掌握实现上述方法的具体技术细节,为进一步学习专业知识和在实践中运用所学知识解决实际问题打下扎实基础,更好地服务于国家的大数据战略。
本课程的主要内容:大数据预处理概述、数据缺失及其处理、数据纠错与数据格式处理、异常值检测、数据离散化与分类型变量处理、低频分类数据处理、数据的归一化、标准化和中心化/零均值化、数据归约与变量选择等。
先修课程:大数据技术导论、Python程序设计

5.大数据分析与挖掘技术

本课程4学分课内学时72学时开设一学期,为专业必修课。

通过本课程学习,能够增强学生实际动手解决问题的能力,学会利用数据挖掘工具处理实际数据,适应国家对大数据人才的需求,服务于国家建设。

本课程的主要内容:在学生了解数据挖掘的基本概念和基本理论的基础上,介绍典型数据挖掘方法的基本思路和算法,教会学生能够利用数据挖掘软件分析实际数据。本课程主要以国际通用数据挖掘工具和大数据分析平台为主要教学工具,以实际工作中的数据进行实验教学。

先修课程:程序设计语言

6.数据可视化技术

本课程4学分,课内学时72学时,开设一学期,为专业必修课。

通过课程学习使学生掌握数据的一般处理、可视化方法,并能使用至少一种数据可视化工具。掌握常用的可视化软件使用方法,注重对学生的数据分析和思维能力的引导和培养,为培养信息技术应用人才奠定必要的专业基础。

本课程的主要内容:介绍数据可视化的基础理论和概念不同类型的数据可视化方法,结合具体实例介绍Echarts可视化工具的使用,并以交通、校园大数据为例介绍可视化综合应用系统。

先修课程:大数据技术导论、JavaScript程序设计