📊 IB00095 (2024)Introducation to Data Science and Big Data(数据科学与大数据导论)


Instructor:       Jinzhou Cao(曹劲舟)
Email:              caojinzhou@sztu.edu.cn
Time(2023级大数据 2 班):               理论:周一 6-7节;实验:周一 8-10 节(从第六周开始)
Time(2023级大数据 3 班):               理论:周二 3-4节;实验:周一 11-13 节(从第六周开始)
Credits:           4/72 课时


目录

Course Description

随着 IT存储、处理、计算和传感技术的进步,大数据已成为一种新的生活常态。计算机和传感设备逐渐能够捕获和分析来自各个领域的各种大规模数据——人、行为、信息、设备、传感器、生物信号、金融、车辆、神经学等。几乎所有行业正在迎接大数据的挑战,并希望挖掘有价值的信息以获得洞察力以解决他们的挑战。《数据科学与大数据技术专业导论》是数据科学与大数据技术专业开设的学科基础课和先导课程。

本课程旨在介绍数据科学和大数据分析的基础知识,包括数据分析的常用技术、发展前沿和应用案例,以及“大数据”的算法和标准工具,同时通过设计一系列的实践课程,使学生初步掌握使用数据分析手段,提升解决实际应用问题的能力,将科学的方法研究应用到社会需求中,以应对各种现实世界的挑战。

希望这门课程带给学生的是终身受用的大数据思维和创新能力。

 

What you will learn

  • 让同学们对数据科学与大数据有一个整体的认识

  • 针对不同类型的数据进行深入讲解

  • 了解数据处理与分析的基本工具与常用技术、发展前沿和应用案例

  • 树立数据科学的基本思路,了解数据的“能”与“不能”

  • 利用实验课,初步掌握使用数据分析手段解决实际应用问题的能力,独立或小组的形式完成实验内容和大项目

 

Textbooks

推荐教材(Recommended Teaching Materials):

  • 自编讲义.

参考教材(Additional Reading Materials):

  • 张祖平. 数据科学与大数据技术导论. 中南大学出版社. 2018年12月

  • 马学强. 数据科学方法与实践: 基于Python技术实现. 电子工业出版社, 2021.

  • Mining of Massive Datasets, by Leskovec, Rajaraman, and Ullman, Cambridge University Press, 2014, 2nd Edition, ISBN-13: 978-1107077232; ISBN-10: 1107077230

  • Foundations of Data Science, by Blum, Hopcroft, and Kannan

  • Python for Data Science, by McKinney, O’Reilly Publishers, 2012.

  • R Programming for Data Science, Roger Peng, Lean Publishing, 2014.

 

 

Grade breakdown

Requirements Percent Points Note
Participation 出勤 3%
Final Project 作业 20%
Laboratory 实验 27% 3 points each, 9 in total
Final exam 考试 50%

 

 

Class Schedule

[课程导言PPT]

  • 课件下载链接(课堂讲完后会上传到该云盘,请及时下载):点击此处
Weeks Dates Course Topics Experiments
1 02/26/24 大数据概述 Introduction to Big Data
2 03/04/24 数据科学基础 Data Science Fundamentals 实验1
3 03/11/24 大数据处理基础 Big Data Analytics Fundamentals[1] 数据采集,数据模型
4 03/18/24 大数据处理基础 Big Data Analytics Fundamentals[2] 数据预处理
5 05/25/24 大数据处理基础 Big Data Analytics Fundamentals[3] 数据探索性分析
6 04/01/24 大数据分析算法[1](聚类) Big Data Analytics Algorithms (Clustering)
7 04/08/24 大数据分析算法[2](分类) Big Data Analytics Algorithms (Classification)
8 04/15/24 大数据分析算法[3](回归、关联分析) Big Data Analytics Algorithms (Regression and Association Analysis)
9 04/22/24 大数据可视化 Big Data Visualization
10 04/29/24 专题1:城市大数据科学[1] Urban data science
11 05/06/24 专题1:城市大数据科学[2] Urban data science
12 05/13/24 专题2:图数据计算[1] Graph data computing
13 05/20/24 专题2:图数据计算[2] Graph data computing
14 05/27/24 专题3:文本挖掘 [2] Text Mining
15 06/03/24 专题3:文本挖掘 [2] Text Mining
16 06/10/24 大数据处理平台、工具和数据存储 Big Data Platforms and Tools and Data Storage
17 06/17/24 期末汇报
18 06/24/24 复习与答疑

Experimental Project

[Python环境配置] [Python入门基础]

Numbers Topics Materials Submission
1 Python基础 [实验1] 1班上传点击此处】 【2班上传点击此处
2 数据预处理与探索性分析实验 [实验2] 1班上传点击此处】 【2班上传点击此处
3 数据可视化实验 [实验3] 1班上传点击此处】 【2班上传点击此处
4 聚类算法实验 [实验4] 1班上传点击此处】 【2班上传点击此处
5 分类算法实验 [实验5] 1班上传点击此处】 【2班上传点击此处
6 回归算法实验 [实验6] 1班上传点击此处】 【2班上传点击此处
7 城市大数据分析与实践 [实验7] 1班上传点击此处】 【2班上传点击此处
8 图数据计算实验 [实验8] 1班上传点击此处】 【2班上传点击此处
9 文本挖掘实验 [实验9] 1班上传点击此处】 【2班上传点击此处