其他
_variables介绍
本文作者:宁刘莹
文字编辑:朱巧利
导读
在stata的表达式中,除了外置变量之外,还有一种变量是内置变量,形式为“_variables”,它们是由stata创建和更新的内置系统变量,常见的有_n、_N、_b、_cons、_se、_pi、_rc等。需要提示的是,正是由于这些是系统内置变量,因此我们要避免使用这些单词来作为用户变量名,此外,stata还有许多内置变量也都是以下划线开头的,最好不要以“_”为第一个字元来定义变量。
1、_n和_N
_n和_N分别可以作为分组的计数器和总数用来索引观测值和生成数字序列,在处理数据时十分常用。举个简单的例子,在auto数据中,我们想分别给国产车和进口车进行编号并统计数量,那么就可以通过分组并使用_n和_N来实现:
clear all
sysuse auto, clear
bys foreign: gen count = _n
bys foreign: gen total = _N
2、_b、_cons、_se和_pi
3、_rc与capture
cap mkdir "D:\mainwork\_variables介绍"
if _rc != 0 {
dis "该文件夹已存在!" //若错误代码不为0,输出“该文件夹已存在!”字样
}
clear
cap mkdir "D:\mainwork\新浪上市公司公告"
cd "D:\mainwork\新浪上市公司公告"
copy "http://vip.stock.finance.sina.com.cn/corp/view/vCB_AllBulletin.php?stockid=600900&Page=1" temp.txt, replace
infix strL v 1-100000 using temp.txt, clear //读入抓取到的网页内容
clear
cap mkdir "D:\mainwork\新浪上市公司公告"
cd "D:\mainwork\新浪上市公司公告"
forvalues p = 1/10000 {
cap copy "http://vip.stock.finance.sina.com.cn/corp/view/vCB_AllBulletin.php?stockid=600900&Page=`p'" temp.txt, replace
while _rc != 0 {
sleep 5000 //当错误代码不为0时,休息5秒再继续运行
cap copy "http://vip.stock.finance.sina.com.cn/corp/view/vCB_AllBulletin.php?stockid=600900&Page=`p'" temp.txt, replace
}
}
关于我们
微信公众号“Stata and Python数据分析”分享实用的stata、python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到有关数据处理、分析等问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。