人大经济论坛 › 论坛 › 计量经济学与统计论坛五区 › 计量经济学与统计软件 › Stata专版 › 求助！在stata处理数据时，遇到以下问题，希望大家能予以 ...

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

发帖

楼主: may05lzu

3745 7

[数据管理求助] 求助！在stata处理数据时，遇到以下问题，希望大家能予以解答。 [推广有奖]

0关注
0粉丝

博士生

77%

还不是VIP/贵宾

威望: 0 级
论坛币: 376 个
通用积分: 0.3600
学术水平: 2 点
热心指数: 4 点
信用等级: 1 点
经验: 1850 点
帖子: 193
精华: 0
在线时间: 366 小时
注册时间: 2009-9-19
最后登录: 2023-8-25

楼主

may05lzu 发表于 2010-3-22 20:41:49 |只看作者 |坛友微信交流群|倒序 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

求助！各位高手，小弟在stata处理数据时，遇到以下问题，希望大家能予以解答。
数据格式如下：
编号    日期    变量1
1       2004    国家
1       2005    法人
1       2006    境外法人，国有
2       2005       ……
2       2006
3       2004
3       2005
3       2006
4       2006
5       2004
5       2005
5       2006
……
我的问题是：
1.每个编号应该有2004-2006三年的数据，如果缺失（如编码2和4），则应当删除，应该如何实现呢？
2.产生虚拟变量“变量2” ，当“变量1”中的字段包含“国”时则变量2=1，否则为0。
注：变量1为字符型变量，长度不起，为说明性文字。
此外，在考虑另一个回归模型时：y=a+b*x
要对上述每个编码做一个回归（每个编码有上百个数据，共有上百个编码），并保留每次回归的R-squared，同时形成一个新的表格如下格式：
编码 R-squared
1
2
3
……
不知这又该如何实现呢？
写论文急用，先行谢过大家了！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏4 回帖

关键词：Stata 处理数据 tata Squared Square Stata 求助！

回帖推荐

sungmoo 发表于4楼查看完整内容

g r2=. levelsof id,l(id) foreach i of num `id'{ reg y x if id==`i' replace r2=e(r2) if id==`i' } keep id r2 bys id: keep if _n==1

本帖被以下文库推荐

· Crush for Stata|主题: 69, 订阅: 9

奋斗！在奋斗！再奋斗！

使用道具举报

沙发

sungmoo 发表于 2010-3-22 21:38:51 |只看作者 |坛友微信交流群

may05lzu 发表于 2010-3-22 20:41 1.每个编号应该有2004-2006三年的数据，如果缺失（如编码2和4），则应当删除，应该如何实现呢？

*如果编号只有2004、2005、2006三种值

bys id: egen a=count(date)
drop if a<3
drop a

已有 1 人评分	论坛币	热心指数	收起理由
SpencerMeng	+ 10	+ 1	我很赞同

总评分: 论坛币 + 10 热心指数 + 1 查看全部评分

使用道具举报

藤椅

sungmoo 发表于 2010-3-22 21:43:32 |只看作者 |坛友微信交流群

may05lzu 发表于 2010-3-22 20:41 2.产生虚拟变量“变量2” ，当“变量1”中的字段包含“国”时则变量2=1，否则为0。
注：变量1为字符型变量，长度不起，为说明性文字。

g var2=indexnot("国",var1)==0

已有 2 人评分	学术水平	热心指数	信用等级	收起理由
zuihoudeyezi	+ 3	+ 3	+ 3	精彩帖子
SpencerMeng		+ 1		热心帮助其他会员

总评分: 学术水平 + 3 热心指数 + 4 信用等级 + 3 查看全部评分

使用道具举报

板凳

sungmoo 发表于 2010-3-22 21:52:11 |只看作者 |坛友微信交流群

may05lzu 发表于 2010-3-22 20:41 此外，在考虑另一个回归模型时：y=a+b*x
要对上述每个编码做一个回归（每个编码有上百个数据，共有上百个编码），并保留每次回归的R-squared，同时形成一个新的表格如下格式：
编码 R-squared
1
2
3
……
不知这又该如何实现呢？

g r2=.
levelsof id,l(id)
foreach i of num `id'{
reg y x if id==`i'
replace r2=e(r2) if id==`i'
}
keep id r2
bys id: keep if _n==1

使用道具举报