楼主: zkwzj
57753 11

[学习资料] [求助]数据非正态分布如何描述 [推广有奖]

  • 0关注
  • 0粉丝

小学生

14%

还不是VIP/贵宾

-

威望
0
论坛币
44 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
98 点
帖子
6
精华
0
在线时间
0 小时
注册时间
2008-7-22
最后登录
2012-4-3

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
<p>我的数据中有些变量非正态分布,描述时是不是就不能用均数、标准差了?是不是一定要用中位数、四分位间距描述?</p><p>我做线形回归分析时是不是要把这些非正态的数据都先转化成正态的才能做呢?我请教了一个同学他说只要原始数据的残差图可以就不用做数据转换,是这样的吗?恳请这里的高手指点一二。谢谢!</p>
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:非正态分布 正态分布 非正态 高手指点 回归分析 正态分布 回归分析 中位数 标准差 如何

回帖推荐

6789sg 发表于5楼  查看完整内容

線性回歸有幾個假設條件(書上都有寫,但很多人忽略)1. 所有殘差項的平均數為02. 殘差項的變異數具有齊一性(homogeneity),若非齊一性,則須以WLS方式處理3. 殘差項與依變數均為常態分配4. 每個殘差項之共變數為0,若非0,這叫自相關,則須以GLS處理5. 任何一個殘差項與自變數是無關的,若有相關,則不能以最小平方和方式處理,須以SEM來做6. x為固定變數,你可以控制,但y為隨機變數,意即常態分布另外你提及及log轉換,是指x的分佈非常態時1. 如 ...

本帖被以下文库推荐

沙发
zkwzj 发表于 2009-2-23 23:50:00 |只看作者 |坛友微信交流群
补充一下,我用原始数据做的残差图显示绝大部分观测量都在±2的范围内,这样是不是就说明我的原始数据满足线性与方差齐性就不必再做数据转换了呢?

使用道具

藤椅
崇拜李彦宏 发表于 2009-2-25 10:20:00 |只看作者 |坛友微信交流群

http://www.cos.name/bbs/read.php?tid=2963

这个对你应该有帮助

使用道具

板凳
zkwzj 发表于 2009-2-25 20:57:00 |只看作者 |坛友微信交流群
这回长见识了,非常感谢!!

使用道具

报纸
6789sg 发表于 2009-2-26 03:55:00 |只看作者 |坛友微信交流群

線性回歸有幾個假設條件(書上都有寫,但很多人忽略)

1. 所有殘差項的平均數為0

2. 殘差項的變異數具有齊一性(homogeneity),若非齊一性,則須以WLS方式處理

3. 殘差項與依變數均為常態分配

4. 每個殘差項之共變數為0,若非0,這叫自相關,則須以GLS處理

5. 任何一個殘差項與自變數是無關的,若有相關,則不能以最小平方和方式處理,須以SEM來做

6. x為固定變數,你可以控制,但y為隨機變數,意即常態分布

另外你提及及log轉換,是指x的分佈非常態時

1. 如果是左偏(看尾巴偏在哪一邊),則將x改成x^1/2

2. 如果是右偏,則x改成lnx

3. 若是很平,低濶峰,則x改成1/x

4. 若是很尖,則x改成x^2

統計的操作很簡單,但是關念要瞭解很難,希望上述的說明能回答你的問題

已有 1 人评分经验 论坛币 收起 理由
bakoll + 3 + 3 精彩帖子

总评分: 经验 + 3  论坛币 + 3   查看全部评分

使用道具

地板
lengshuiwuquan 发表于 2009-3-12 22:37:00 |只看作者 |坛友微信交流群
不管什么形状,可以用box-cox变换,把数据变成正态分布的

使用道具

7
calsunny 发表于 2009-3-13 00:56:00 |只看作者 |坛友微信交流群

不过回归分析的正太分布也不是这么严格的!

有的说只要DV正态就可以了,有的说residual正态分布就可以了,所以你同学说的没有错!如果residual也不正态分布,那么如果你的样本足够大,也没有关系。

使用道具

8
calsunny 发表于 2009-3-13 01:00:00 |只看作者 |坛友微信交流群
或者用楼上的方法,用SAS中的boxcox做出结果,看看需要做怎么样的transformation,然后再用SPSS做分析。

使用道具

9
janghee 发表于 2010-9-1 12:07:10 |只看作者 |坛友微信交流群
我的数据中有些变量非正态分布,描述时是不是就不能用均数、标准差了?是不是一定要用中位数、四分位间距描述?


我也遇到了这个问题,用中位数和四分位描述了,我还想做一些排序怎么办呢(问卷中几个测评维度或条目得分的排序),数据正态,大家都是用均数加减标准差来排序的,而偏态数据很多中位数都是一样的。。。 但是如果数据转换成正态后,转换方法不一样,又没办法放在一起比较大小了

求解
毕业课题纠结中。。。

使用道具

10
januszhao 发表于 2010-11-16 09:46:16 |只看作者 |坛友微信交流群
数据由非正态转换为正态分布后,数据本身结构发生变化,相关变量间关系出现偏差 导致估计误差增大。
达则兼济天下。穷则独善其身!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 20:42