课程概况

        爬虫俱乐部将于2019年5月2日至4日在武汉举行Stata编程技术五一训练营,此次采用理论与案例相结合的方式,旨在帮助大家熟悉Stata数据分析技巧,能够通过编程读取不同类型的数据源、实现复杂数据合并、清洗的程序化,并且熟悉Stata核心的爬虫技术。

爬虫俱乐部已多次举办线下培训活动,曾经在武汉大学、华中科技大学、中央财经大学、中南财经政法大学、华中农业大学、郑州大学、河南大学、福州大学、长沙理工大学、湖北大学和湖北经济学院等进行师资和研究生实证方法的培训,获得了一致的好评。爬虫俱乐部的公开培训也进行了十多场,场场爆满座无虚席。

我们会继续努力,以培养学生、技术研发为己任,在少量盈利的基础上,努力将公益事业做好,传播实证技术和数据分析方法、开发数据分析的工具等,造福于学术界!

 

授课老师

 

李春涛

 

        香港大学博士,中南财经政法大学金融学院教授、博士生导师;主要研究领域是公司治理和企业创新,在《经济研究》、《金融研究》、Journal of Comparative Economics等主流期刊上发表学术论文三十余篇。李老师是Stata统计软件的资深用户,有20多年的Stata编程经验,他有十多名学生正在或曾经在海外名校从事研究助理工作。

 

 

薛原

 

        曾任香港大学经济金融学院研究助理,现为华中科技大学管理学院博士生,爬虫俱乐部资深成员,擅长Stata和Python编程及网络爬虫技术。与李老师合作开发了cnar、chinagcode、chinaaddress、cnintraday、cnstock、subinfile、reg2docx、sum2docx、wordconvert等重要命令,实现了中国上市公司数据的命令化模块下下载、中文地址与经纬度之间的转换,实证结果的格式化集成输出等,曾在金融学国内顶级期刊发表过论文一篇。

 

闫续文

 

        爬虫俱乐部资深会员,长期讲授结果输出方法,现为香港岭南大学海外研究项目研究助理。

 

课程内容

 

第一部分:基础篇

 

1.     Stata的界面与DOS命令

2.     获取帮助的技巧(在线帮助、搜索帮助、人肉帮助)

3.     各种数据的读入(Excel、制表符、固定宽度等)

4.     不规则数据的整理、数据搬家与填充(基金经理变更案例)

5.     copy命令(文件转移、文件重命名、网络文件读取、网页源代码读取)

6.     日期定义和日期函数

7.     函数与基于扩展函数的generate

 

 

第二部分:宏与循环

 

1.     local概念与基本操作(如何定义local)

2.     global概念与基本操作(与local的区别)

3.     宏扩展函数(将dis结果、dir结果等赋值给local)

4.     循环(while, forvalue and foreach)

5.     跳出循环的continue 和continue, break

6.     上交所年报抓取案例(forvalue循环,日期函数、容错命令cap、循环过程中的终止)

7.     foreach循环, 读入多个csv文件

8.     大量数据文件的读取

9.     Excel多个Sheet数据的读取

10.   对变量取值的循环

 

 

第三部分:数据库操作

 

1.     数据的纵向合并(CSMAR交易数据为例、cntrade命令)

2.     数据的横向合并(财务数据为例)

3.     数据长宽变换 (wind财务数据、多列变一列reshape,stack命令)

4.     起死回生(preserve restore命令)

5.     label(文件label、变量label、观测值label)

6.     用label找变量(labelsof、label的宏扩展函数)

7.     字符串处理(长度、关键词、替换、提取、寻找总经理、寻找董事长、两职合一)

 

 

第四部分:Post命令

 

1.     post 原理

2.     定义post

3.     用post计算同步性和Beta

4.     基于云端数据的事件研究

5.     股本变更数据整理

 

 

第五部分:结果输出

 

1.     输出表格或图形到WORD文档、EXCEL文档和PDF文档:putdocx、putpdf、putexce

2.     基本统计信息:sum2doxc

3.     分组检验:t2docx

4.     相关系数矩阵:corr2docx

5.     简单线性回归:reg2docx

 

 

第六部分:网络数据

 

1.     上市公司公告的抓取

2.     上市公司高管任职信息抓取

3.     深交所信息披露考评数据抓取

4.     上市公司媒体关注(百度新闻相关结果数量)抓取

5.     港股交易数据抓取

 

 

培训目的

        本次培训通过具体的案例对每部分技术进行讲解,力图使大家掌握Stata的基本命令、编程、数据处理以及抓取网络数据的方法。专题式的讲解使你能在短时间内掌握Stata的精髓,精选的实例和翔实的配套资料能让你在课后快速拓展所学,并能够编写一些实用的Stata程序,为进一步学习和科研打下扎实的基础。

 

 

培训对象

       国内高校教师、硕士生、博士生、即将开始科学研究的准研究生、科研院所科研人员、社会团体及Stata爱好者。

 

 

报名方式

        即日起点击报名链接提交报名信息,并添加联系人微信,将缴费凭证发送给联系人,工作人员确认后即为报名成功。

 

 

报名费用及优惠

教师:3000元;

学生:全日制学生凭有效证件享受八折优惠。

 

 

支付方式

 

对公转账

 

开户名:武汉字符串数据科技有限公司

开户行:中国银行股份有限公司武汉中南财经政法大学分理处

对公账号:579473738265

 

 

支付宝转账

 

支付宝:张邯 

支付宝账号:13733331296

 

 

相关单位

主办方:武汉字符串数据科技有限公司、爬虫俱乐部

 

其他事项及培训安排

1.请学员自带笔记本电脑,我们将提供Stata原厂软件试用程序。

2.本次培训食宿及往返交通费用学员自理。

3.即日起开始正式报名和收费。

 

 

培训时间地点

时间:2019年5月2日-5月4日

地点: 湖北-武汉

 

 

联系方式

联系人:张邯

QQ:843136899

微信:17713137973

手机:17713137973

邮箱:843136899@qq.com