计算机科学 ›› 2020, Vol. 47 ›› Issue (7): 1-7.doi: 10.11896/jsjkx.200500088

• 学科建设 • 上一篇    下一篇

数据科学导论的课程设计及教学改革

朝乐门   

  1. 数据工程与知识工程教育部重点实验室(中国人民大学) 北京100872
    中国人民大学信息资源管理学院 北京100872
  • 收稿日期:2020-03-12 出版日期:2020-07-15 发布日期:2020-07-16
  • 通讯作者: 朝乐门(chaolemen@ruc.edu.cn)
  • 基金资助:
    2020年度教育部人文社会科学研究规划基金(20YJA870003)

Course Design and Redesign for Introduction to Data Science

CHAO Le-men   

  1. Key Laboratory of Data Engineering and Knowledge Engineering (Renmin University of China),Beijing 100872,China
    School of Information Resource Management,Renmin University of China,Beijing 100872,China
  • Received:2020-03-12 Online:2020-07-15 Published:2020-07-16
  • About author:CHAO Le-men,born in 1979,Ph.D,associate professor,is a member of Technical Committee of Information System of China Computer Federation.His main research interests include data science,big data analytics,andknow-ledge processing on the semantic Web.
  • Supported by:
    This work was supported by MOE(Ministry of Education in China) Project of Humanities and Social Sciences (20YJA870003)

摘要: 数据科学与大数据技术、大数据管理与应用等新兴专业的建设,以及计算机科学与技术、统计学、信息资源管理等传统专业的改革,均需引入一门关键课程——数据科学导论。在调查分析哥伦比亚大学、纽约大学、哈佛大学和中国人民大学等高校开设的具有一定代表性的数据科学导论课程的基础上,作者结合自己开设的数据科学导论课程以及国家同名精品在线开放课程建设的经验,探讨了该课程的教学目的、教学内容、试验操作、考核方法、教材选择、特色与创新等课程设计问题。现阶段已开设的相关课程的教学改革重点在于培养学生的数据能力,重视数据产品的研发,加强课程建设模式的创新,加快与社会人才需求的接轨,凸显其导论类的课程特征,重视编写代码能力的培育和数据沟通能力的训练。

关键词: 数据科学导论, 课程设计, 大数据

Abstract: Introduction to Data Science is an intrinsic course for not only the development of emerging majors (Data Science and Big Data Technology,Big Data Management and Application,and so on),but also only the innovation of traditional ones (Compu-ter Science and Technology,Statistics,and Information Resource Management,and so on).Course design issues for this novel course,including its objectives,contents,experiments,assessment methods,reference books,personalized design are discussed based upon conducting an in-depth for typical courses offered by Columbia University,New York University,Harvard University and Renmin University of China as well as the author’s teaching experience.The redesign of exiting courses on introduction to Data Science should focus on improving the abilities of target students on full-stack data science,data product development,co-ding for Data Science,and communicating with non-professional users,as well as leveraging alternative course construction mo-dels,reflecting social needs,highlighting its roadmap roles for the curriculums.

Key words: Data Science, Course design, Big data

中图分类号: 

  • TP391
[1] O’Neil C,SCHUTT R.Doing data science:Straight talk from the frontline[M].O’Reilly Media,Inc.,2013.
[2] PROVOST F.Data Science for Business Analytics Syllabus-Spring 2020[OL].http://web-docs.stern.nyu.edu/ioms/SYLLABI/PROVOST_TECHGB2336_Spring20.pdf.
[3] RASCHKA S,MIRJALILI V.Python Machine Learning:Machine Learning and Deep Learning with Python,scikit-learn,and TensorFlow 2[M].Packt Publishing Ltd,2019.
[4] Institute for Applied Computational Science.CS109a:Introduction to Data Science[OL].https://harvard-iacs.github.io/2019-CS109A/.
[5] JAMES G,WITTEN D,HASTIE T,et al.An introduction to statistical learning[M].New York:springer,2013.
[6] CHAO L M.Data science:srinciples and practices[M].Beijing:Tsinghua University Press,2017.
[7] CHAO L M,YANG C J,WANG S J,et al.Data ScienceCurri-culums Around the World:An Empirical Study [J].Data Analysis and Knowledge Discovery,2017,1(6):12-21.
[8] CONWAY D.The Data Science Venn Diagram[OL].http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram.
[9] CHAO L M,XING C X,ZHANG Y.Data science:the state of art and trend[J].Computer Science,2018,45(1):1-13.
[10] CHAO L M,XING C X,WANG Y Q.Unique Curriculums for Data Science and Big Data Technology[J].Computer Science,2018,45(3):3-10.
[1] 叶雅珍, 刘国华, 朱扬勇. 数据产品流通的两阶段授权模式[J]. 计算机科学, 2021, 48(1): 119-124.
[2] 赵会群, 吴凯锋. 一种大数据估价算法[J]. 计算机科学, 2020, 47(9): 110-116.
[3] 马梦宇, 吴烨, 陈荦, 伍江江, 李军, 景宁. 显示导向型的大规模地理矢量实时可视化技术[J]. 计算机科学, 2020, 47(9): 117-122.
[4] 顾荣杰, 吴治平, 石焕. 基于TFR 模型的公安云平台数据分级分类安全访问控制模型研究[J]. 计算机科学, 2020, 47(6A): 400-403.
[5] 李泳. 基于BigQuant 大数据平台的股票投资策略开发[J]. 计算机科学, 2020, 47(6A): 612-615.
[6] 葛雨明, 韩庆文, 王妙琼, 曾令秋, 李璐. 汽车大数据应用模式与挑战分析[J]. 计算机科学, 2020, 47(6): 59-65.
[7] 刘纪芹, 史开泉. 大数据分解-融合及其智能获取[J]. 计算机科学, 2020, 47(6): 66-73.
[8] 曾伟良, 吴淼森, 孙为军, 谢胜利. 自动驾驶出租车调度系统研究综述[J]. 计算机科学, 2020, 47(5): 181-189.
[9] 禹鑫燚, 施甜峰, 唐权瑞, 殷慧武, 欧林林. 面向预测性维护的工业设备管理系统[J]. 计算机科学, 2020, 47(11A): 667-672.
[10] 郝秀梅, 史开泉. 大数据智能检索与大数据区块元智能分离[J]. 计算机科学, 2020, 47(11): 113-121.
[11] 汪洋, 李鹏, 季一木, 樊卫北, 张玉杰, 王汝传, 陈国良. 高性能计算与天文大数据研究综述[J]. 计算机科学, 2020, 47(1): 1-6.
[12] 孔繁钰, 周愉峰, 陈纲. 基于时空特征挖掘的交通流量预测方法[J]. 计算机科学, 2019, 46(7): 322-326.
[13] 王震, 周颖, 黄赪东, 苗泉强. 面向大数据应用的区块链解决方案综述[J]. 计算机科学, 2019, 46(6A): 6-10.
[14] 赵颖, 侯俊杰, 于成龙, 徐皓, 张伟. 面向生产管控的工业大数据研究及应用[J]. 计算机科学, 2019, 46(6A): 45-51.
[15] 张新, 胡晓东, 魏嘉伟. 基于云计算的地理信息服务技术[J]. 计算机科学, 2019, 46(6A): 532-536.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 雷丽晖,王静. 可能性测度下的LTL模型检测并行化研究[J]. 计算机科学, 2018, 45(4): 71 -75 .
[2] 孙启,金燕,何琨,徐凌轩. 用于求解混合车辆路径问题的混合进化算法[J]. 计算机科学, 2018, 45(4): 76 -82 .
[3] 张佳男,肖鸣宇. 带权混合支配问题的近似算法研究[J]. 计算机科学, 2018, 45(4): 83 -88 .
[4] 伍建辉,黄中祥,李武,吴健辉,彭鑫,张生. 城市道路建设时序决策的鲁棒优化[J]. 计算机科学, 2018, 45(4): 89 -93 .
[5] 史雯隽,武继刚,罗裕春. 针对移动云计算任务迁移的快速高效调度算法[J]. 计算机科学, 2018, 45(4): 94 -99 .
[6] 周燕萍,业巧林. 基于L1-范数距离的最小二乘对支持向量机[J]. 计算机科学, 2018, 45(4): 100 -105 .
[7] 刘博艺,唐湘滟,程杰仁. 基于多生长时期模板匹配的玉米螟识别方法[J]. 计算机科学, 2018, 45(4): 106 -111 .
[8] 崔琼,李建华,王宏,南明莉. 基于节点修复的网络化指挥信息系统弹性分析模型[J]. 计算机科学, 2018, 45(4): 117 -121 .
[9] 杨羽琦,章国安,金喜龙. 车载自组织网络中基于车辆密度的双簇头路由协议[J]. 计算机科学, 2018, 45(4): 126 -130 .
[10] 韩奎奎,谢在鹏,吕鑫. 一种基于改进遗传算法的雾计算任务调度策略[J]. 计算机科学, 2018, 45(4): 137 -142 .