2019暑期Stata编程技术培训招生方案

        爬虫俱乐部将于2019年8月22日至28日在湖北武汉举行为期一周的Stata编程技术定制培训,此次采取初级班和高级班分批次培训。课程通过案例教学模式,旨在帮助大家在短期内掌握Stata软件编程、金融计量知识和实证分析方法,使大家熟悉Stata核心的爬虫技术,以及Stata与其他软件交互的高端技术。

        初级班主要是为了让学员掌握Stata数据分析技巧,并能独立撰写相关的程序。涉及内容包括多种数据格式的读取和输出、数据的合并、实证结果的输出以及爬虫俱乐部编写的命令介绍等。

        高级班主要是为了让学员掌握Stata软件进阶操作,涉及内容包括正则表达式、网络爬虫技巧、文本分析等技术。经过团队精心策划,此次课程新增北大法宝裁判文书信息提取和百度地图api调用两大案例,以及新兴实证研究方法介绍,相信定能让学员受益匪浅!

 
 

主要授课老师简介

 
 

李春涛

 

    ​    ​大学教授、博士生导师;香港大学博士;主要研究领域是公司治理和企业创新,在《经济研究》、《金融研究》、Journal of Comparative Economics等主流期刊上发表学术论文三十余篇。李老师是Stata统计软件的资深用户,有20多年的Stata编程经验,他有十多名学生正在或曾经在海外名校从事研究助理工作。

张川川

 

    ​    ​北京大学CCER经济学博士,哈佛大学经济系访问研究员、世界银行总部研究顾问。近年来在Journal of Population Economics、Health Economics、Demography等各领域顶级国际刊物和《中国社会科学》、《经济研究》、《经济学季刊》、《世界经济》、《金融研究》等国内权威刊物发表中英文论文40余篇;主持国家自然科学基金、北京市社科规划基金、霍英东高等院校青年教师基金和国家社科基金重大项目子课题等多项国家和省部级课题,并担任50余本国内外学术刊物的匿名评审专家。

薛原

 

    ​    ​香港岭南大学研究助理,爬虫俱乐部高级成员,擅长Stata编程、正则表达式、字符串处理及网络爬虫技术。与李老师合作开发了chinagcode、chinaaddress、cnintraday、cnstock、subinfile、reg2docx、sum2docx、wordconvert等重要命令,实现了中文地址与经纬度之间的转换,中国上市公司股票代码和分时交易数据的获取以及修改文本文件,在《金融研究》发表过文章。

 

 
 

初级班培训内容

 
 
 
 
 
 

初级班

 

第一部分:初识Stata与数据读入

1)熟悉界面

2) Stata常见函数

3)读入txt、csv、excel等格式文件

6)基金经理变更案例

第二部分:宏与循环

1)local、global与宏扩展函数基本操作

2)循环操作及案例

3)Wind交易数据处理案例

4)CSMAR交易和财务数据处理案例

第三部分:数据库操作

1)数据纵向合并与横向合并、数据长宽变换

2)美国流行歌曲目录案例

3) CSSCI期刊目录案例

4)字符串处理

第四部分:post命令及案例

1)post原理与定义post

2)用post计算股价同步性和Beta

3)基于网络数据的事件研究

4)股本变更数据整理

第五部分:回归分析及结果输出

1)putdocx命令及相关案例

2)实证结果输出

3)实证结果输出完整展示 

 

 
 
 
 

高级班

第一部分:正则表达式

1)正则表达式基本函数介绍

2)正则表达式元字符介绍

3)正则表达式匹配模式

4)正则表达式例子

5)正则表达式相关命令

第二部分:网络爬虫

1)爬虫初步

    a)新浪高管任职数据抓取

    b)NBER Working Paper信息的抓取

c)百度地图api调用

2)寻找真实链接

    a)和讯网港股数据

    b)深交所信息披露质量

    c)百度新闻逐年数据获取

3)调用curl

    a)新浪财经港股数据获取

    b)环保部AQI

第三部分:文本分析

1)分词原理

2)分词的实现

    a)ustrwordcount()和ustrword()

    b)调用Python的jieba和pynlpir

    c)Bosonnlp的API

    d)词频统计

3)高亮输出文章重点

4)词云图的实现

5)情感分析原理

6)情感分析的实现

    a)年报MDA语调分析

    b)构建词库计算情感值

    c)大众点评日料评论情感分析

第四部分:实证研究方法

1) 工具变量方法(IV)

  a)工具变量方法介绍

  b)现代IV方法:LATE

  c)IV方法应用一般步骤:论文案例与Stata实操

2) 断点回归方法(RD)

  a)RD方法思想和方法演进

  b)精准断点(Shape RD)与模糊断点(Fuzzy RD)

  c)RD方法应用一般步骤:论文案例与Stata实操

3) 倍差法(DID)

  a)DID模型设定、参数估计和假设检验

  b)DID方法与固定效应估计(FE):联系和区别

  c)IV方法应用一般步骤:论文案例与Stata实操

  d)DDD(三重差分)方法与应用:论文案例与Stata实操

 

 
 

培训目的

 
 

    ​    ​本次培训通过具体的案例对每部分技术进行讲解,力图使大家掌握Stata的基本命令、编程、数据处理以及抓取网络数据的方法。专题式的讲解使您能在短时间内掌握Stata的精髓,精选的实例和翔实的配套资料能让您在课后快速拓展所学,并能够编写一些实用的Stata程序,为进一步学习和科研打下扎实的基础。希望通过本次培训,各位学员能对Stata软件有更深入的认识,并在其工作岗位上有更出色的表现。

 

 
 

培训对象

 
 

    ​    ​国内高校教师、硕士生、博士生、科研院所科研人员、大数据工作者,出国留学人员、社会团体及Stata爱好者。

 

 
 

报名方式

 
 

点击链接填写相关信息即可报名,建议添加联系人咨询相关事宜后再进行缴费哦~

 
 

报名费用及优惠

 
 

初级班: 3000(非学生) 2400(学生)

   

高级班:4800(非学生)  4000(学生)

 

初、高级班:7000(非学生)6000(学生)

   

(学生报名需提供有效学生证件)

 

 
 

支付方式

 
 

对公转账

 

开户名:武汉字符串数据科技有限公司

开户行:中国银行股份有限公司武汉中南财经政法大学分理处

对公账号:579473738265

对私转账

 

支付宝:13237670191(杨慧琳)

 

 
 

主办方

 
 

武汉字符串数据科技有限公司

爬虫俱乐部

 

 
 

其他事项及培训安排

 
 

1.请学员自带笔记本电脑,我们将提供Stata原厂软件试用程序。

2.本次培训食宿及往返交通费用学员自理。

3.即日起开始正式报名和收费。

 

 
 

培训时间地点

 
 

初级班:2019年8月22日-24日

高级班:2019年8月25日-28日

地点: 湖北-武汉