用户名: 密码: 验证码:
普通话水平测试中一些问题的统计分析
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
普通话水平测试是一项十分重要的语言测试。现行的测试制度是依据多年的测试经验制定的,相关的研究工作大多只停留在定性的层面上,而且普通话水平测试本身还是主观性测试,这些都导致现行的测试制度缺乏科学性和合理性,也就无法提供具有可操作性的测试质量监控手段。要建立科学合理的测试制度,就必须找出存在的缺陷,并依据严密的、定量的方法加以改进。
     本文就提出了现行的普通话水平测试制度中存在的两个缺陷:
     第一,现行的制度没有鉴别低信度的测试员并对他们给出的评分做一定的处理,而是将全体测试员的评分全盘认可,这会导致测试的整体信度下降。
     第二,现行的复审制度照顾面太小,既没有考虑对将高等级误判为低等级的情况加以复审,也没有考虑对除一级以外其他等级的复审。
     文章利用统计的方法处理了上述两个问题。对前一个问题,文章给出了一套鉴别低信度测试员的方法,并修正了这些测试员给出的评分;对后一个问题,文章利用区间估计的方法,找出了最有可能发生等级误判的分数段作为复审区间,进而拟订了新的复审制度。
PSC is a language test which is of great importance. The current regulations of PSC are based on many years of testing experience, and the study for it was mostly stayed on qualitative analysis/And more, PSC itself is a subjective test. All of those made the current regulations lack of scientificalness and rationality, and can't offer a method to control the quality of the test.
    To build scientifical and rational PSC regulations, we must find out the faults in current regulations and improve them by compact and quantitative methods.
    This paper found two faults in current regulations. The first, it will cause decrease of reliability of PSC to take granted all the candidates' score without distinguishing the examiners with low reliability from the others. The second, the range of re-test is too small. The candidates who are mis-judged to the lower grade
    from the higher one are not re-tested, and the same as the candidates who are not of the first grade.
    This paper dealt with the two faults by statistical methods. For the first one, we offer a way to distinguish the examiners with low reliability from the others, and correct the scores judged by such examiners. For the second one, the methods of interval estimate are used to find the intervals where the mis-judges of grade are most probably happen. Such intervals are regarded as the re-test interval, and so the new re-test regulations are built.
引文
[1] 宋欣桥,普通话水平测试员实用手册,北京:北京商务印书馆。
    [2] 刘照熊,普通话水平测试大纲,吉林:吉林人民出版社,1994.
    [3] 龙莉、熊明和谢民育,普通话水平测试员信度的统计分析,提交给《语言文字应用》.
    [4] 陈希孺,数理统计引论,北京:科学出版社,1981.
    [5] 宋欣桥,试论普通话水平测试(PSC),首届全国普通话水平测试学术研讨会论文
    [6] 中华人民共和国国家通用语言文字法,2000年10月31日第九届全国人民代表大会常务委员会第十八次会议通过
    [7] 戴梅芳,普通话水平测试研究,语文出版社,1997。
    [8] Kevin R.Murphy, Charles O.Davidshofer,Psychological Testing:Principles and Applications, Prentice-Hall Inc.,1994.
    [9] Robald K.Hambleton, et al.Advances in Educational and Psychological Testing: Theory and Applications,Kluwer Academic Publishers, 1990.
    [10] Seber, G.A.F.,Multivariate Observations,John Wiley&Sons, 1984.
    [11] Everitt,B.S.,An Introduction to Latent Variable Models,Chapman and Hall, 1984.
    [12] Yvonne M.M. Bishop, Stephen E.Fienberg, Paul W. Holland, Discrete Multivariate Analysis. Theory and Practice. Massachusetts Institute of Technology, 1975.
    [13] 张尧庭,方开泰,多元统计分析引论,科学出版社,2003.
    [14] 严士健,王隽骧,刘秀芳,概率论基础,科学出版社,1999.
    [15] 任栋 抽样调查技术 西南财经大学出版社,1992.
    [16] 柯惠新,黄京华,沈浩,调查研究中的统计分析法,北京广播学院出版社,1992.
    [17] 郑日昌 心理测量,湖南教育出版社,1988.
    
    
    [18] 张厚粲 心理与教育统计学 北京师范大学出版社,1990.
    [19] 张小蒂 抽样调查技术与应用,上海科学技术文献出版社,1991.
    [20] 金瑜 心理测量 华东师范大学出版社,2001.
    [21] 王福昌 军校学员的心理健康分析,数理统计与管理,2003年,第22卷第4期,6——11。
    [22] 王馥芳 优选理论的解释力 当代语言学,2003年,第5卷第3期,257——264。
    [23] 杨志明,张雷 标准参照测量及其等级线信度的概化理论分析,心理学探新,2003年,第23卷第3期,52——56。

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700