fs命令——我们的小帮手
本文作者:李婷婷,河南大学经济学院
本文编辑:任 哲
技术总编:余术玲
爬虫俱乐部沙龙活动
导读
在我们进行数据整理的过程中,我们经常会用到循环来写程序,那如果想对某一路径下的文件或文件夹进行循环,应该怎么操作呢?我们可以用宏扩展函数或者fs命令将文件或文件夹的名称放入局部宏或返回值中,再结合循环进行操作。那么今天我们就来简单介绍一下fs命令的用法~
一、命令介绍
fs命令可以在Stata结果输出窗口输出当前文件夹下或当前目录下的文件名称(不包括文件夹和目录),也可以列示指定路径或当前路径下指定类型的文件,并将结果储存在返回值r(files)中。例如,当我们更改到确定的路径之后,如果我们想要的是dta文件,就可以用fs *.dta
来获取路径下的dta文件,其中“*”
为通配符,表示可以匹配任意零个、单个或多个字符(当然,文件名不能为空,所以此处表示至少有一个字符);“.dta”
即表示dta文件;fs *.dta
就表示遍历当前路径下的所有dta文件。
与dir、list不同的是,fs命令可以给出不止一种指定类型的文件,而且fs命令还可以显示出隐藏文件。dir命令可以将文件大小、文件修改时间以及文件名称都列示在结果输出页面中。如果我们只想将文件名列示出来的话,就可以使用fs命令进行操作。
fs的命令语句为:
其中filespec是一个文件名称或者是一连串文件名称,这一连串的文件名称通常用通配符*或?来表示。
fs命令是Stata的外部命令,如果是第一次使用,需要先进行安装。
ssc install fs
二、举例介绍
1.简单小例子
接下来先通过一些简单的小例子来说明fs命令的一些基本用法。
首先我们可以通过cntop10命令来获取民生银行(600016)、中信证券(600030)、南京高科(600064)三家上市公司的十大股东数据。
clear all
cap mkdir D:\stata16\fs命令
cd D:\stata16\fs命令
ssc install cntop10
cntop10 600016 600030 600064
由下图可以看到我们得到了三家上市公司的十大股东信息,在D:\stata16\fs命令
路径下也可以看到生成了三个dta文件。
此时如果我想在Stata结果输出窗口列示出当前路径下的dta文件,就可以用fs命令。
fs *.dta
如图所示,在Stata的结果输出窗口就列示出了当前路径下的dta文件名称。
那如果我们现在不在D:\stata16\fs命令
这个路径下,而是在其它路径下,此时我们想直接得到这个路径下的dta文件,fs命令可以实现吗?当然可以!这时直接在程序中加上文件所在的路径即可。下边我们先更改一下路径,然后直接在fs命令后跟上文件所在的路径名称和所需要的文件类型来试一试。
cd D:\
fs D:\stata16\fs命令\*.dta
如图所示,同样可以得到相应路径下的dta文件名称。
如果我们想同时列示出当前路径下的dta文件和其它类型的文件,我们也可以使用fs命令。比如除了dta文件,我还想同时列示出当前路径下的do文件,那我也可以使用fs命令进行操作。
cd D:\stata16\fs命令
fs *.dta *.do
可以看到,在Stata结果输出窗口就同时列示出了当前路径下的dta文件和do文件。
如果想得到其它类型的文件,直接更换文件后缀即可,如 *.txt、 *.xlsx、 *.csv等等。
2.fs命令与循环结合使用
如果想将这三家上市公司的十大股东信息dta文件合并起来,应该怎么操作呢?大家可能较为熟悉的是通过宏扩展函数结合循环进行操作,但是这里通过前边介绍的fs命令也可以实现。
cd D:\
fs D:\stata16\fs命令\*.dta
在Stata结果输出窗口列示出了当前路径下的dta文件,即我们所需要合并的三家上市公司十大股东信息的dta文件。
return list
我们可以看出当前路径下的dta文件被放在一个r(files)里。
接下来就可以通过循环合并dta文件了。
clear
foreach file in `r(files)' {
append using `file'
}
如图所示,三家上市公司的十大股东信息文件就合并成功啦!
对于fs命令的介绍到这里就结束了。大家可以根据自己的需要来试一下fs命令的用法哦!
对我们的推文累计打赏超过1000元,我们即可给您开具发票,发票类别为“咨询费”。用心做事,不负您的支持!往期推文推荐
【邀请函】听说你还在为处理表格头大?
用stack取代excel的数据重整操作吧Seminar | 委托贷款:打开中国影子银行的黑匣子
Seminar | 电话会议中的"non-answer"
Python 爬虫必杀技:XPath
面对相对路径和绝对路径的分岔口,你选对了吗? 空间数据可视化之spmap命令朴素贝叶斯算法——以20Newsgroups数据集为例
【爬虫实战】利用scrapy框架爬取豆瓣图书信息
《我和我的家乡》影评高频词原来是这些!
Seminar | JPX400指数的公司治理效应Seminar | 企业社会责任披露如何影响企业绩效?【爬虫实战】恒大的底气?--恒大楼盘数量爬取Python遇上Stata--IPyStata介绍变量类型转换之encode&decode命令关于我们微信公众号“Stata and Python数据分析”分享实用的stata、python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。
此外,欢迎大家踊跃投稿,介绍一些关于stata和python的数据处理和分析技巧。投稿邮箱:statatraining@163.com投稿要求:1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到有关数据处理、分析等问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。