2008年12月12日星期五

疑问与思考:如何避免英文论文中的抄袭

看PAPER的时候,赫然发现心理科学上的一篇综述大段翻译了另一篇同题材的英文综述文章,那就有这样几个问题
1.直接翻译算不算抄袭?当然算。英文论文的审阅已经有了识别抄袭的技术,现在应该开始开始训练避免有意或无意的抄袭。
2.翻译以后改成自己的话,例如被字句改成把字句,算不算抄袭?这个加工可能大多数是个非故意的过程,比如读一篇英文文献,由于读下来已经有一个再加工的过程,落在笔头上,写在文章中扬扬得意的一句话,其实还是原文而自己已经忘了或产生错觉了而已。
3.如何分辨抄袭?英文直译过来的抄袭方法,读起来必然有些不顺,这种分辨其实对自己避免抄袭毫无益处。看一手文献是王道。BY THE WAY,如何训练速读?觉得自己读PAPER太慢。
4.一个领域的综述已经做的很好了,我想把它引入到我的文章中,大段的引用并标注出处是可取的,但是很不好看;要是为了好看而自己重新写一个,又未免换汤不换药,做了个翻译再自我加工的过程,抄袭的不是原句,而是idear。

总结甘老师以前发过的一个关于阿肯色大学避免抄袭的课件
参考:
http://catalogofstudies.uark.edu/current/studies/734.htm
有几点是值得注意的:
1.文字,图片,表格,数据,idear都有版权的
2.引用原文,加引用符,杂志要求的引用格式,或者加以脚注
3.除非被广泛使用,否则关键词也需要加以引用
4.避免自我抄袭,新瓶装旧酒是不可以的
5.若说不清来源,干脆不要引用
6.拙劣的引用也比抄袭要好

关于参考文献:
1:林帼儿,陈子光,钟建安,. 组织公平文献综述及未来的研究方向[J]. 心理科学,2006,(4).
“组织中的公平研究始创于1965 年Adams 的公平理论(equity theory) 。该理论强调了个体投入和所得到结果的等价性(Cohen,Charash & Spector , 2001 ; Colquitt 等人, 2001) [15 ,2 ] 。根据该理论,人们在知觉一个结果是否公平时,首先会计算他们自己的贡献或投入(如,才能、学识、技巧、经验等) 与他们的产出之间的比率,然后把自己的这个比率同他人的比率进行比较,从而得出分配是否公平的结论。”
2:Colquitt, J. A., Conlon, D. E., Wesson, M. J., Porter, C. O. L. H., & Ng, K. Y. (2001). Justice at the millenium: A meta-analytic review of 25 years of organizational justice research. Journal of Applied Psychology, 86(3), 425-425.
“Before 1975, the study of justice was primarily concerned with distributive justice. Much of this research was derived from initial work conducted by Adams (1965), who used a social exchange theory framework to evaluate fairness. According to Adams, what people were concerned about was not the absolute level of outcomes
per se but whether those outcomes were fair. Adams suggested that one way to determine whether an outcome was fair was to calculate the ratio of one's contributions or "inputs" (e.g.,education, intelligence, and experience) to one's outcome and then compare that ratio with that of a comparison other. Although the
comparison of the two input-outcome ratios gives Adams's equity theory an "objective" component, he was clear that this processwas completely subjective.”

2008年12月9日星期二

主成分分析与因素分析之区分

主成分分析与因素分析之区分

因素分析FA分为探索性因素分析EFA与验证性因素分析CFA。因素分析与主成分分析PCA的关系,尤其是探索性因素分析与主成分分析之关系,参考一些资料之后,我将两者的主要分别总结如下。
1.PCA分析所有的变异,包括所有指标的变异与误差的变异,也包括只为一个指标所拥有的变异,用于对数据的所有变异做一个整体的概括,不丢失任何信息。FA分析共享的变异,不包括误差的变异,也不包括只为一个指标所拥有的变异
2.PCA不需要理论的指导,所分析出来的成份没有实际中的意义,更不应该为它附上一个标签。EFA要为分析出来的因素起一个实际有意义的名称,CFA则需要在进行分析之前有以验证假设为目的,在理论基础之上进行。
3.PCA成份之间彼此正交,即不相关。FA的因素之间则一般是斜交的,在EFA重要看因素旋转的结果,在CFA中看理论假设的模型与调整的结果。
4.PCA的目的是为了提取信息,对样本量的要求并不高。FA则要求样本量不少于100,至少保证指标与因素的比为5:1。
5.在PCA中,指标是自变量,成份是因变量;在FA中,指标是因变量,因素是自变量。在这里值得注意的是,SPSS中PCA和EFA未加以区分,所以特别容易混淆,一个简单的区别就是,在PCA进行之后,自变量和因变量已经悄然发生了转换,“主成分”从因变量变成了自变量,经过旋转之后,变成了有意义的“因素”。
6.在实际的应用中,PCA是为EFA决定提取的因子数的一个方法。事实上,还有其他的方法可以用来选择公因子的数目,包括公因子法,最小平方法,最大似然法,等等。在PCA后,根据特征值或者碎石图来进行因子数目的选择。特别值得注意的是,碎石图是PCA的专利,FA是没有碎石图的。

下面我用公式做出了PCA和FA的一个区分我们可以从公式里看到主成分(因素)在方程中未知的变化
Z_1=b_{11}x_1+b_{12}x_2+...+b_{1m}x_m
Z_2=b_{21}x_1+b_{22}x_2+...+b_{2m}x_m
...
Z_m=b_{m1}x_1+b_{m2}x_2+...+b_{mm}x_m
注意,这里的系数矩阵就是我们在svd中分析出来的$u和$v

区别
x_1=\lambda_{11}\xi_1+\lambda_{12}\xi_2+...+\lambda_{1m}\xi_m
x_2=\lambda_{21}\xi_1+\lambda_{22}\xi_2+...+\lambda_{2m}\xi_m
...
x_m=\lambda_{m1}\xi_1+\lambda_{m2}\xi_2+...+\lambda_{mm}\xi_m

参考资料:
侯杰泰,温忠麟:《结构方程模型及其应用》
Tabachnick&Fidell:《Using multivariate Statistics》
陈善林《因素分析的理论与方法》

2008年12月8日星期一

Budescu的优势分析

这几天看文献时注意到了一种基于多元回归进行的优势分析,在组织行为学领域有广泛的应用
总结了一些文献,概括如下:
在精确比较自变量对因变量的相对重要性
传统方法的问题:多重共线性,可能低估预测力较弱的自变量的重要性

理论依据:
1.以自变量预测因变量时降低的误差来确定
2.要直接比较相对权重,而不是根据相关的指标来推测
3.相对重要性比较的是一个自变量对因变量的直接效应。

Budescu:优势分析法

PS:
直接效应:自变量对因变量单独影响
总体效应:自变量与其他所有的自变量放在一起时,自变量对因变量的影响
部分效应:自变量与部分其他自变量放在仪器室,这个自变量对隐变量的影响。

分析:复相关系数平方R2的增加值,累加平均后再平均。最后计算在已经解释了的方差中,每个自变量单独所贡献的成分。

如有3个自变量X1,X2,X3,以X1为例X1的单独R2=a,X1X2X3为A
则x1看
X1,
X2,b
X3,c
X1X2,
X1X3,
X2X3,d
X1X2X3
这7中情况下,没有X1的情况下,加上X1后R2的增加值,分别为b,c,d则最后算出X1的相对贡献值为A1=[a+(b+c)/2+d]/3同理,可算出A2和A3。则A1+A2+A3=A

参考文献:
1.Budescu D V. Dominance Analysis: A New App roach to the Problen of Relative Importance of Predictors in Multip le Regression[ J ]. Psychological Bulletin, 1993, 114: 542 - 551.
2.李超平,时勘. 优势分析在组织行为学研究中的应用——组织公平与工作倦怠关系的实证研究[J]. 数理统计与管理,2005,(6).

2008年12月6日星期六

中介效应的检验,阅读笔记与实例演算

中介效应的检验
阅读笔记与实例演算

文献:
(1)中介效应的概述
MacKinnon, D. P., Fairchild, A. J., & Fritz, M. S. (2008). Mediation analysis. Annual Review of Psychology, 58, 593-614.
(2)SPSS,SAS计算中介效应及代码--单调节变量
Preacher, K. J., & Hayes, A. F. (2004). SPSS and SAS procedures for estimating indirect effects in simple mediation models. Behavior Research Methods, Instruments, and Computers, 36, 717-731.
(3)SPSS,SAS计算中介效应及代码--多调节变量
Preacher, K. J., & Hayes, A. F. (2008). Asymptotic and resampling strategies for assessing and comparing indirect effects in multiple mediator models. Behavior Research Methods, 40, 879-891.

一.中介变量的作用
简而言之:
1.进一步理解X,Y之间的关系。即X通过作用M再作用Y,值得注意的是即使XY之间可能不存在相关关系,可能是由于XM,MY作用的方向是相反的。
2.辅助试验设计
中介变量可以作为研究模型的一部分;中介变量可以替代结果变量。值得注意的是第二种情况,结果变量可能出于某种原因而不适合进行研究,比如研究失业与离婚的影响,08年的经济危机是一个好的契机,但要等这些在08年经济危机中的失业的研究者都离婚的话,未免太久,所以可以利用周期较短的中介变量代替结果变量来研究。
二.中介效应的基本统计原理
1.三个方程+一个图
\inline Y=i_1+cX+e_1
\inline Y=i_2+c'X+bM+e_2
\inline M=i_3+aX+e_3







所有的分析都是基于这三个方程和一个图
2.基本假设
假设1:方程2,3的残差是独立的
假设2:M和方程2的残差是独立的
假设3:MX在方程三中没有交互作用
假设中没有说明的问题:(1)方向xmy,ymx.(2)y-m(3)其他变量的影响
这些假设事实上可能根本没有办法证明,所以一般还是靠看其他的实验结果或质性研究。
3.几个概念:
(1)全中介(Complete Mediation)与部分中介(Partial Mediation)
方法,看c',若c-c'显著且c'显著,就是部分中介模型了
那么如何判断是全中介模型呢?c-c'显著且c'不显著,当然还不够,需要做c'的置信区间,确定这个“不显著”是“显著不”的,才足以说明此简单中介模型是全中介的。
(2)Consistent and Inconsistent Models一致与不一致模型
不一致就是调节的方向和xy的方向不一致,可能导致整个的效应不明显
三.中介效应的检验---a*b or a&b
有上面的方程我们知道a*b=c-c',如果a*b显著大于0,可以说存在中介效应;另一种说法,a,b作为相关系数,若同时显著也应该可以说明存在中介效应。两种检验都存在power较低的现象。
(1)a和b同时显著
局限1:要求a和b同时显著会降低了一类错误同时降低power。
局限2:这种检验方法的前提是x与y存在相关,所以同时要求a和b显著的,再判断c'的显著性的方法,受制于X与Y直接效应的大小。x与Y直接效应越小,power越小,最小的时候是全中介模型的时候。
结合温忠麟教授的《调节效应与中介效应的比较与应用》一文中“中介效应检验程序”。完全中介模型想通过判断ab同时显著得到验证的power应该是很小的。
那么这个power到底有多小,文中举了一个例子,如果a,b的效应量都不大的时候,想要得到0.8的power需要25000的样本量。
优点:被广泛应用;可以验证完全中介效应
PS:还是不很理解c'与power的关系,需要再考虑
2)a*b显著
检验a*b是对要求ab同时显著时power较小的一个补充
公式:
S_{ab}=\sqrt{b^2s^2_a+a^2s^2_b+s^2_as^2_b }

\inline S_{ab}=\sqrt{b^2s^2_a+a^2s^2_b}


事实上两个公式都可以

计算方法
A:sobel检验
局限:a*b不是正态分布。power小,用一个不符合正态分布的数据来做假设检验与参数分析,只能说如果不做Bootstrap的话,就是一个无奈的妥协了。
B:Bootstrap
可以一定通过resampling的方法来弥补a*b不是正态分布的缺陷,这个方法应该放进“中介效应检验程序”中作为补充,可以使power变大。
http://www.comm.ohio-state.edu/ahayes/sobel.htm
http://www.public.asu.edu/~davidpm/ripl/Prodclin/

我用SPSS跑了一下网页上的例子,结果如下:
a=.8186 p=.0106
b=.4039 p=.0340
sobel 假设正态分布:95%CI(-.0585,1.6653)
Bootstrap:95%CI(.0324 ,.7030)
可见,bootstrap调整的方法,即使在样本量只有30的数据中也得到了显著地结果。而且5000次的resampling情况下置信区间很窄,可以确定这个是显著性很高。

四:多中介变量模型
写了SPSS中sobel中命令的这个人又分析了多中介变量模型中的计算,并可以直接应用。这里略介绍一下含有多个调节变量的模型比单独分析调节模型的好处:
(1)就像含有多个预测变量的回归模型一样,可以评估整体的调节作用那个
(2)可以看在其他调节变量在场的时候,一个指定的M如何影响XY的关系,以及其他的调节变量如何影响M的影响作用。
(3)降低由于忽略调节变量带来的误差
*调节变量的共线性
多调节变量模型中的某一个M不包含与其他M重叠的部分,而单调节模型中的M还包括其他M与这个M相关而产生的调节作用。


待补充和明确的两个问题:
1.完全中介模型power较小的原因没有十分理清
2.r中sobel与bootstrap的计算

2008年12月5日星期五

office 2007完全卸载,推荐onenote

office莫名其妙的down掉了,居然把我的文档全部锁定,这才发现软件依赖的可怕性
office2007卸载不了,而且安装不上新的,经过一天一夜的奋斗,一切终于回复正常了

附加office完全卸载法,真的是要手动在注册表里一条一条的删
下面是转载的方法
第一步:
Office 2007无法卸载,也无法安装——我的同事计算机上安装的Office 2007坏掉了,想卸载后重新安装,但卸载也卸载不掉,安装也安装不上去。是软件,无非就是两个地方:注册表和文件,我查找了一下kb,然后结合以前的经验,成功的卸载并重新安装了Office 2007。强制卸载office 2007需要执行如下步骤:
  Office 2007文件夹文件
  %windir%\installer
  1、按住winkey(windows徽标键)+R,输入%windir%\Installer,回车。打开installer文件夹。
  2、右键点击窗口右边的空白处,查看-详细信息。
  3、到资源管理器菜单栏,查看,勾选状态栏。这样您就可以在资源管理器最下面的状态栏看到文件的详细信息。
  4、依次点击每个MSI,留意看状态栏的详细信息。找到每个Office 2007的相关文件,这可能包括word2007等相关组件。
  5、在每个Office 2007的msi上,点击右键,选择 卸载。
  Office Source Engine服务
  1、按住winkey(windows徽标键)+R,输入 services.msc,回车。打开服务器管理器。
  2、找到Office Source Engine,右键点击,选择停止。
  Office 2007安装文件和目录
  1、按住winkey(windows徽标键)+R,输入 %CommonProgramFiles%\Microsoft Shared,回车。
  2、删除Office12 和 Source Engine 目录
  3、按住winkey(windows徽标键)+R,输入%ProgramFiles%\Microsoft Office,回车。
  4、删除Office12目录
  5、按住winkey(windows徽标键)+R,输入 %appdata%\microsoft\templates ,回车
  6、删除 Normal.dotm 和Normalemail.dotm 文件。
  5、按住winkey(windows徽标键)+R,输入 %appdata%\microsoft\document building blocks,进入2052或者1033文件夹
  6、删除 Building blocks.dotx 文件
  7、按住winkey(windows徽标键)+R,输入 %AllUsersprofile%\Application Data\Microsoft\Office\Data 回车
  8、删除所有文件
  临时文件
  1、按住winkey(windows徽标键)+R,输入 %temp%,回车
  2、删除所有文件
  缓存文件
  1、在资源管理器 :工具菜单-文件夹选项-查看-高级设置,依次执行如下点击或勾选:
  ·勾选“显示系统文件夹内容"
  ·取消勾选“隐藏受保护的操作系统文件”
  ·点选“显示所有文件和文件夹”
  ·取消勾选“隐藏已知文件类型的扩展名”
  ·点击应用
  ·点击“应用到所有文件夹”
  2、查找所有本地硬盘的根目录,找到 \MSOCache\All Users 目录,进入。
  3、删除该目录下所有包含这样字样的目录: 0FF1CE)-
  Office 2007注册表
  1、regedit
  2、浏览到 HKEY_CURRENT_USER\Software\Microsoft\Office\12.0
  3、删除12.0这个子键
  4、浏览到如下子键,删除对应的子键
  • HKEY_CURRENT_USER\Software\Microsoft\Office\12.0
  • HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office\12.0
  • HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office\Delivery\SourceEngine\Downloads\*0FF1CE}-*
  • HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Uninstall\*0FF1CE*
  • HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Installer\UpgradeCodes\*F01FEC
  • HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Installer\UserData\S-1-5-18\Products\*F01FEC
  • HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\ose
  • HKEY_CLASSES_ROOT\Installer\Features\*F01FEC
  • HKEY_CLASSES_ROOT\Installer\Products\*F01FEC
  • HKEY_CLASSES_ROOT\Installer\UpgradeCodes\*F01FEC
  • HKEY_CLASSES_ROOT\Installer\Win32Assemblies\*Office12*
  注:上面以星号括起来的子键,例如 *office12*,表示前后都有文字,这个子键名称可能是变化的,但一定含有office12的字样。并不是说以星号开头结尾的子键。
  5、浏览到 HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Uninstall
  6、依次查看每个 UninstallString ,找到所有的 office12的相关项,这可能包含 \Office
Setup Controller\Setup.exe 这样的字样。
  7、删除每个找到的子键。
  
本文来源【学网】网站链接是http://www.xue5.com
第二步:下载office2007专业卸载工具
http://www.xdowns.com/soft/softdown.asp?softid=39167

第三步:重新启动计算机 重新安装Office 2007。

PS:我在迅雷上找到了一个非常好的office2007,3.2G,真正的正版加全版,而且是同时包括中英文双语两种版本。老师好像说过提供盗版软件是非法的哈,那我就不写地址了,在www.gougou.com上搜索
“Microsoft Office 2007 With Service Pack 1 中英文企业版 完美者”就可以了(它上面写2G,其实是完整版3.2G)速度很快,1M左右,建议下载一个,留着呗~
另外推荐office2007中的ONENOTE,集中式管理笔记,很方便
我的VOA听写积分