金数据处理技术 课程名称:CUR341金融数据处理技术Financial Data Processing Technology 课程性质:本学院选修,实验课程 学分课时:2学分,32课时,其中实验课时15 主讲教师:冯建芬副教授 所属院系: 金融学院金融工程系 电话:64495048,E-mail:jianfen feng@UlBE.EDU.CN 教学对象:金融学院大学二年级学生 考核方式:课下作业(10%),每章一次,提交程序和结果数据集 课堂实验(10%),每章1-2次,共计8次实验,提交程序和结果数据集, 期中考试(小组数据处理报告)(30%) 期末考试:开卷上机笔试(50%) 其中平时成绩包括课下作业和课堂实践,占20%,期中成绩占30%,期未考试占50% 学术诚信:本课程对于学生的学术诚信的要求遵从《对外经济贸易大学学生违纪处分条例》、《对 外经济贸易大学学生学习违纪处分实施细则》、《对外经济贸易大学考场纪律》的规定 教学方式:课堂讲授占比30%,上机实验占70%,教学中强调动手能力,采用实验教学、实践教学和研讨教学相结合的 方式。教学全程在金融实验室完成,结合SAS软件、Ocale实验教学平台、金融数据库和PPt进行教学。 出勤要求:遵从《对外经济贸易大学本科生课堂学习规范》,要求学生关闭一切电子设备;不能 无故缺席上课;上课专心听讲,积极参与课堂讨论;课后认真复习课堂上讲授内容,独立完成教师布置的任 务;并预习新课。学生缺勤不得多于总课时的四分之一。教师可以根据考勤情况决定学生是否可以参加考 试、是否扣分。 一、课程简介: 本课程通过大量案例,借助数据处理和分析软件SAS,学习处理金融数据的方法和技术,是一门金融和计算机紧密结合的实 践性非常强的综合课程。内容涉及:金融数据处理与分析软件(SAS)的基本应用、金融数据的批处理技术、常见统计分析方法的应 用及金融数据处理案例分析等。主要教学内容有:数据文件在不同数据库间的格式转换、数据筛选与清洗技术、循环处理技术、同时 处理多个文件的数据批处理技术(宏编程技术)等。 二、教学目标 本课程的教学目的是弥补学生在数据处理环节的不足,提高其金融数据处理与分析能力,为金融计算、金融时间序 列、 金融风险定量分析等后续课程学习及金融实践提供技术支持,为提高本科生的科研能力和实践能力排除障碍。 三、课程学习资料 1教材 《SAS编程技术教程》(第2版),朱世试,清华大学出版社,2013。 2.参考资料 《SAS编程技术教程》(第1版),朱世武,清华大学出版社,2007。 The little SAS book,Delwiche,Lora D.and Slaughter,Susan J.,2003,NC:SAS Institute Inc. 《BASE SAS软件使用手册》,高惠璇等,编译,中国统计出版社,1997年 《SAS编程与数据挖掘商业案例》,姚志勇,机械工业出版社,2010. Using SAS in Financial Research),Boehmer,Ekkehar,John Paul Broussard and Juha-Pekka Kullunki,2002,NC:SAS Institute Inc. 《金融计量学》,张宗新,中国金融出版社,2012. 《SAS统计分析与数据挖掘》,谢龙汉,尚涛,电子工业出版社,2013. 四、学习效果及达成途径 1.学习效果: 通过本课程的学习,希望达成的学习效果如下: 1)掌握SAS的BASE SAS模块的语法,理解SAS处理数据的原理,能够熟练的编制SAS完整的程序。 2).能够使用SAS对金融数据进行各种文件格式间的转换,并通过SAS熟练地访问和生成各种数据库文件、PC文件。 3).能够通过SAS查询金融数据库数据,远程访问金融数据终端。 4).掌握基于SAS软件的金融数据的各种清洗技术,包括研究数据的筛选、数据查询、缺失值处理、日期格式数据处理、多个数据 表的纵向合并、横向合并、多表查询、单表查询、数据表记录的添加、删除、更新。 5).掌握SAS帮助系统的查询和学习方法,能够自主利用SAS帮助系统学习其强大的统计分析功能、金融计量功进行金融数据挖 掘 6).掌握基于SAS的海量数据的批处理技术 7)掌握SQL数据库查询语言在SAS中的应用,能够灵活运用SQL语言进行多表数据的查询和链接。 2.达成学习效果的途径 善于动手,课前完成例题程序的上机任务;上课跟着老师思路走,积极参与课堂讨论;充分利用实验教学平台的讨论 区和教师指定的答疑时间及时答疑解惑;按时完成课堂实践任务和课下作业,协同完成小组金融实践任务,认真准备期 未考试
五、教学进度计划表 本课程教学周为16周,具体安排如下 周 教学 参考资料 作业与 次 内容提要 方式 考试 第一讲:认识 讲 教材第1章 课堂上 SAS 授、 机 实验 第二讲:SAS 教材第2,3 的数据存储与读 章,第4 章4.1- 2.1SAS对 讲 4.4, 2 数据文件的管 授、 4.14,第8 理 实验 章,第9章 2.2建立数据 集,读入原始 数据 学生实践:建 课堂实 立逻辑库,建 实验 践测验 立数据集,读 入数据 2.3输出原 讲 4 始数据 授、 实验 学生实践:外 课堂实 5 部文件与SAS 的数据传输:导 实验 践测 验;课 入与导出 下作业 第三讲查询语 教材13, 课下作 言SQL 14章 业 3.1SQL过 程与 SQL语言 简介 讲 6 3.2从单 个表中查询和 实验 加工数据 3.3从多 个表中查询和 拼接数据 学生实 课 7 践:利用SQL 实验 堂实践 语言查询和加工 测验 数据
周 教学 参考资料 作业与 次 内容提要 方式 考试 第四讲:数据 第4章4.5, 集的编辑与修 4.6.4.7 改 4.8.4.11 4.1改变 4.12,第5 8 变量或数据集 授 章,第6章 的属性 实验 4.2变量 和观测的选 学生实践:对 课堂实 数据的初步处 践测验 9 理,变量和观 实验 课下作 测的选择 4.3变量编辑与 观测的修改 4.3.1数据集拼 接增加变量和 讲 10 观测 授 4.3.2利用表达 实验 式与函数修改 观测 4.3.3利用循环 课 语句修改观测 讲 下作业 11 和变量 授、 4.3.4利用数组 实验 修改观测 学生实践:数 课堂实 据的进一步处 践测 理技术,变量 验; 12 与观测的修改 实验 布置小 技术应用 组金融 实践任 第五讲:宏编 教材第16 课下作 程技术 业 5.1宏 变量的 定义与 引用 讲 13 5.2宏 的定义 授、 与调用 实验 5.3宏程 序语句和宏函 数 5.4数 据步接口程序 学生实践:宏 课堂实 技术的 14 应用一 宏与数据 验 验 批处理技 术 第六讲过程步 讲 教材第 下作 15 的应用 11,12章 业 实验 16 学生小组演示 研讨 小组作 报告 业研讨
周 教学 参考资料 作业与 次 内容提要 方式 考试 17- 期末考试(学校统一安排考试时间及地点) 18 六、教学内容: 第-章:SAS入门 【教学目的和要求】 使学生了解SAS的基本操作界面和操作窗口,指导学生如何使用SAS强大的帮助系统,并通过部分案例使学生了解 SAS的数据处理功能。 【主要内容】 1.1SAS软件介绍 1.2SAS工作界面 1.3SAS窗口操作 1.4SAS帮助文档 1.5SAS安装 2,其中实验课时1课时 《SAS编程技术教程》第二版,第一章 作业与练习(课上实验,1课时): 1关闭日志窗口、输出窗口、编辑器窗口,重新打开上述三个窗口;(使用快捷键) 2关闭资源管理器,停放资源管理器; 3关闭结果窗口,停放结果窗口: 4.通过菜单建立逻辑库,删除逻辑库; 5打开程序”例1-1 class程序”,运行程序,另存程序; 6建立新的程序,输入如下代码: options noxwait; x md F:\data; libname data "F:\data"; libname data clear; 7逐行执行程序;保存新的程序; 8清楚日志窗口的内容; 第二章:SAS的数据存储与读取 【教学目的和要求】 使学生掌握如何建立SAS的数据集,以各种方式读入数据进行存储,包括直接输入方式、数据集导入方式、外部文 件(excel文件、txt文件、access文件,ODBC数据源、SPSS文件等)导入方式,并掌握如何将SAS数据集中的数据以 各种方式展现或导出到外部文件。 【主要内容】 2.1SAS对数据文件的管理; 2.1.1SAS逻辑库与SAS数据集功能及其属性 2.1.2建立逻辑库,读入文件: 2.2建立数据集,读入原始数据; 2.2.1建立空数据集 2.2.2直接对变量赋值建立数据集 2.2.3直接输入数据建立数据集 2.2.4从其他数据集导入数据建立数据集 2.2.5从外部文件导入数据建立数据集 2.3输出原始数据 2.3.1输出到Log窗口 2.3.2输出到输出窗口: 2.3.3导出的外部文件: 教学总时数:8,其中实验课时4课时 参考资料:1.《SAS编程技术教程》第二版,第二章,第三章,第四章:4.1-4.4,4.14,第8章,第9章 2.SAS系统帮助目录:SAS产品àBase SASaSAS语言字典语言元素字典 作业与练习: 课堂实验1(2课时): 1,通过菜单操作和llibname语句分别建立几个逻辑库,分别指向如下文件夹:
2建立各种空数据集 3.完成利用x发布主机操作命令的任务 4.完成注释语句的实验任务 5.通过赋值建立数据集的实验任务 6.完成通过数据行读入数据建立数据集的任务 课堂实验2(2课时) 1.利用importi过程导入数据的实验任务. 2.利用input--infile语句导入文本数据的任务。 3.利用put语句输出数据到log窗口 4.利用printi过程将结果输出到输出窗口 5.利用exporti过程将数据导出到外部文件 6.利用file-put语句将数据导出到文本文件 课下作业: 1)利用x命令,获取data文件夹中文件名前三个字符是stk的文件,将其存储到文件name.txt; 2)查找帮助,尝试在SAS的命令栏使用下列SAS命令,并说明其作用:keys,dlglib,libname,dir,var,submit, recall. 3)将name.txt中的内容读入到SAS数据集hwork.a,变量名为name,长度为9($9.),要求不能在同一行读入两条记录 (@)。(infile-inputi语句) 4)将hwork.a中的变量name输出到外部文件nongstk.txt,每一个变量记录添加字符串,如:stk000001变为: %stk(stk000001,result); 5)登陆锐思数据网站(账号:uibe/密码:uibe):www.resset.cn参考输出设置部分的"格式说明”文档,分别下载 如下格式的数据源,下载条数为500条,且将其转换为S八S数据集。要求设置好环境,并给运行结果正确的程序。 逗号分隔文本(*.CSV) 空格分隔文本(*TXT) Tab键分隔文本(*.TXT) EXCEL电子表格(*XLS) 字符型EXCEL电子表格(*.XLS) 6)用PUT和FILE语句写SAS程序,将数据集data.class直接输出为外部TXT文本。 7)在数据集中建立100个变量。 第三章:查询语言SQL 【教学目的和要求】 SQL是数据库通用的一种强大的查询语言,用它可以简化挑选和处理数据的过程。通过本章的学习学生可以学习从 单个数据文件或多个数据文件中进行合并查询数据的技术,以及在查询中进行简单计算和汇总的方法。本章要求学生掌 握SQL过程的简单应用;会使用SQL查询语句处理单个数据集和多个数据集的查询;会使用SQL查询语句进行简单的求和、求均值等 汇总运算。 【主要内容】 3.1SQL过程与SQL语言简介 3.1.1SQL语言简介 3.1.2SQL过程简介 3.1.3SQL中的语句及其作用 3.2从单个表中查询和加工数据: 3.2.1利用select语句处理和加工数据; 3.2.2创建新表存储查询结果; 3.3从多个表中查询和拼接数据; 3.3.1从多个数据表查询数据实例 教学总时数:4,其中实验课时2课时 参考资料:1.《SAS编程技术教程》第二版,第十三、十四章 2.SAS帮助目录:SAS产品àBase SASàSAS SQL过程用户指南 SAS产品aBase SASaSAS:过程a过程aSQL过程 作业与练习: 课堂实验(2课时)利用SQL过程完成单个表和多个表的金融数据查询和汇总任务; 1.a)从data.exchbdqttn.1中选择债券代码、日期、债券名称、收盘全价、收盘净价、净价成交金额、成交笔数,并 生成year、qtr、month:三个变量,存储日期的年、季、月,年限范围为2000年至2010年; b)将上述结果存储到数据集ex.ex3_1中; c)对数据集ex.ex31按照年、季、月排序, d).删除ex.ex31中成交笔数为0和收盘净价缺失的数据,将剩余结果保存到数据集ex.ex32中 2.将数据集ex.ex32中的数据导出到excel表格ex32.XLS 3.查询data.exchbdqttn1中所有不同的股票代码; 4.利用数据集data.dret计算各股票日平均收益,并按平均收益进行排序