一份優質的報告,需要以總結性的語錄、合理的格式,進行工作與學習內容的記錄。想必你也正在為如何寫好報告而發愁吧?以下是小編精心整理的《spss期末統計分析報告》的文章,希望能夠很好的幫助到大家,謝謝大家對小編的支持和鼓勵。
第一篇:spss期末統計分析報告
常用統計方法(SPSS)期末考試題型總結
SPSS期末考試題型總結
一、 單樣本t檢驗(單個正態總體的均值檢驗與置信區間)(P48)
1、題目類型:某糖廠打包機打包的糖果標準值為問:(1)這天打包機的工作是否正常?
(2)這天打包機平均裝糖量的置信區間是多少?
,給出一系列抽取值。
2、操作:(1)Analyze Compare mean One-Sample T Test (2)將左邊源變量X送入Test Variable(s)中,在Test Value中輸入
3、結果分析:若Sig.>0.05,接受假設,即沒有顯著性差異
若Sig.<0.05,拒絕假設
,即有顯著性差異
置信區間(100+Lower,100+uppper)
二、 兩個樣本t檢驗(兩個正態總體的均值檢驗與置信區間)(P50)
1、題目類型:從A批導線抽取4根,從B批導線抽取5根。
問:這兩批導線的平均電阻是否有顯著差異?并求
的置信區間。
2、操作:(1)Analyze Compare mean Indepvendent Sample T Test
(2)將檢驗變量x送入Test Variable(s),將分組變量group送入Grouping Variable (3)選按鈕define GroupsUse specified values,分別輸入1和2.
3、結果分析:(1)若F顯著性概率Sig.>0.05,接受假設
性差異,即可認為兩組方差是相等的
(2)若t顯著性概率Sig.2-tailed>0.05,可以得出A、B兩批電
線的電阻值沒有顯著差異。
,兩組方差沒有顯著
三、 單因素方差分析(P54)
1、題目類型:6種不同農藥在相同條件下的殺蟲率。
問:殺蟲率是否因農藥的不同而有顯著性差異?
2、操作:(1)Analyze Compare mean One-Way ANOV
(2)將源變量x送入Dependent List(因變量),將類型變量kind送入Factor.
3、結果分析:(1)若Sig.>0.05,接受假設,即沒有顯著性差異
(2)若Sig.<0.05,拒絕假設
,有顯著性差異,此時進一步操作:
繼續操作:(a)Options Homogeneity of variance test (b)Post HocLSD
四、 雙因素方差分析(P62)
1、題目類型:三種濃度,四種溫度的每一種搭配下的產品產量。
問:試檢驗不同濃度,不同溫度以及它們之間的交互作用對產量有無顯著影響?
2、操作:(1)Analyze General Linear Model Univarate
(2)測試變量(產量)送入Dependent Variable,因素變量(溫度、濃度)一起送入Fixed Factor
3、結果分析:(1)若A因素Sig.>0.05,則A因素對產量無顯著性影響,反之
(2)若B因素Sig.>0.05,則A因素對產量無顯著性影響,反之。
(3)若A*B因素Sig.>0.05,則A與B的交互作用對產量無顯著性
影響,反之則反。
4、注意:(1)輸入數據時注意排版,因素A、B的分類。
(2)不考慮交互作用時, Model Custom,把要考慮的a、b等因素送入右邊;考慮交互作用時,Model Full factorial
五、 一元線性回歸模型(P71)
1、題目類型:某公司科研支出x與利潤y的表格
問:求出線性模型,并檢驗該模型是否顯著以及給出模型的標準誤差
2、操作:(1)作圖Graplsscatter/potsimple scatter,判斷為線性。
(2)Analyze Regression Linear (3)將因變量y送入Dependent,將自變量x送入Independent
3、結果分析:(1)B列的數值為回歸系數,其中Constant為常數項。Y=20+2x (2)若Sig.<0.05,則***顯著不為0,***是一個重要變量。
六、 多元線性回歸模型(P76)
1、題目類型:課本例子
問:試求y對x1,x2,x3,x4的最佳線性模型。
2、操作:(1)作圖Graplsscatter/potsimple scatter,判斷為線性。
(2)AnalyzeRegression Linear
(3)將因變量y送入Dependent,將自變量x1,x2,x3,x4送入Independent (4)若enter模型不好,則進行逐步回歸法,選Model stepwise
3、結果分析:(1)R值越接近1,模型越好。
(2)F值顯著性概率Sig.<0.01,回歸模型非常顯著。
(3)若Sig.<0.05,則***顯著不為0,***是一個重要變量。
4、預測:AnalyzeRegression Linear save 選Unstandardized(預測值),或選Individual(區間值)
七、 曲線回歸模型(P88)
1、題目類型:對200只鴨進行試驗,得到周齡x與日增重y的數據。
問:求出線性模型,并檢驗該模型是否顯著以及給出模型的標準誤差
2、操作:(1)作圖Graplsscatter/potsimple scatter,判斷曲線類型。
(2)AnalyzeRegression Curve Estimation
(3) 將因變量y送入Dependent,將自變量x送入Independent (4)在Model中,選Quadratic(二次曲線) 或其他
3、結果分析:(1)R值越接近1,模型越好。
(2)F值顯著性概率Sig.<0.01,回歸模型非常顯著。
八、 相關分析(P93)
1、題目類型:13名男生的身高與體重表。
問:試研究x與y的相關性。
2、操作:(1)Analyze correlateBivariate
(2)將源變量x、y送入Variables
3、結果分析:若Sig.<0.01,說明非常顯著,即身高與體重的相關性非常強。
九、 卡方檢驗(擬合度檢驗)(P103)
1、題目類型:200個觀察數據,包含組下限和頻數的表。
問:試檢驗該數據是否服從[0,1]上的均勻分布?
2、操作:(1)定義變量x,為組下限或上限。注意輸入方式
(2)確定Weight為頻數變量,Data Weight Class Weight cases by,將變量Weight送入Frequency Variable. (3)Analyze Nonparametric testChi-Square (4)將檢驗變量x送入Test Variable
3、結果分析:Sig.>0.05,故認為從該表抽取的數據服從[0,1]上的均勻分布。
十、 K-S檢驗(獨立性檢驗)(P112)
1、題目類型:從車間中抽取50個樣本,得到纖維強力指標。
問:試檢驗纖維強力指標是否服從正態分布?
2、操作:(1)Analyze Nonparametric test 1-sample K-S test
(2)將檢驗變量x送入Test Variable List,選Normal(正態分布)
3、結果分析:Sig.>0.05,故認為纖維的強力指標服從正態分布。 十
一、列聯表分析(P132)
1、 題目類型:研究兩類病人與自殺情緒之間有沒有某種連帶關系
2、操作:(1)輸入數據,注意形式。確定f為頻數變量,
Data Weight Class Weight cases by, 將變量f送入Frequency Variable. (2)AnalyzeDescriptive StatisticsCrosstabs
(3)把患者類型[kind]送入Row(行),把自殺情緒[emotion]送入Column(列) (4)選StatisticsChi-Square
3、結果分析:若Sig.>0.05,接受,故認為患者類型和有無自殺情緒是相互獨立。
【注意】:
1、怎樣區分雙因素方差分析和列聯表分析? 答:提問的方式不一樣。
雙因素方差分析:***是否有顯著影響。 列聯表:***是否獨立。
第二篇:SPSS數據統計軟件實驗報告
專業
信息與計算科學
班級
級班
組別
指導教師
姓名
同組人
實驗時間
2018
年
月
日
實驗地點
實驗名稱
方差分析
實驗目的
通過對數據的分析,使其掌握用方差分析的方法來比較數據。
實驗儀器:
1、支持Intel
Pentium
Ⅲ及其以上CPU,內存256MB以上、硬盤1GB以上容量的微機;
軟件配有Windows98/2000/XP操作系統及SPSS軟件。
2、了解SPSS軟件的特點及系統組成,在電腦上操作SPSS軟件。
實驗內容、步驟及程序:
一、1.實例內容:
下表給出銷售方式對銷售量的對比試驗數據,利用單因素方差分析來分析不同
的銷售方式對銷售量的影響。
2.實例操作:
Step
01
打開對話框。
打開數據文件,選擇菜單欄中的【分析】|【比較均值】|【單因素ANOVA】命令,彈出【單因素ANOVA檢驗】對話框。
Step
02
選擇因變量。
在候選變量列表框中選擇【銷售量】變量作為因變量,將其添加至【因變量列表】列表框中。
Step
03
選擇因變量。
在候選變量列表框中選擇【銷售方式】變量,將其添加至【因子】文本框中。
Step
04
定義相關統計選項以及缺失值處理方法。
單擊【單因素ANOVA檢驗】對話框【選項】,在彈出的對話框選中【方差同質性檢驗】、【平均值圖】復選框,然后單擊【繼續】。
Step
05
事后多重比較。
單擊【單因素ANOVA檢驗】對話框【事后比較】,在彈出圖中選中Bonferroni復選框,然后單擊【繼續】。
Step
06
對組間平方和進行線性分解并檢驗。
單擊【單因素ANOVA檢驗】對話框【對比】,彈出圖的對話框選中【多項式】,將【等級】設為【線性】,單擊【繼續】返回【單因素ANOVA檢驗】的對話框。
Step
07
單擊【確定】,輸出分析結果。
3.實例結果及分析
變異數同質性測試
銷售量
Levene
統計資料
df1
df2
顯著性
.346
3
16
.793
給出了方差齊性檢驗的結果。從該表可以得到
Levene方差齊性檢驗的P值為0.793,
與顯著性水平0.05相差大,因此基本可以認為樣本數據之間的方差是非齊次的。
變異數分析
銷售量
平方和
df
平均值平方
F
顯著性
群組之間
(合併)
685.000
3
228.333
7.336
.003
線性項
比對
196.000
1
196.000
6.297
.023
偏差
489.000
2
244.500
7.855
.004
在群組內
498.000
16
31.125
總計
1183.000
19
給出了單因素方差分析的結果。從表中可以看出,組間平方和是685、組內平方
和是196,其中組間平方和的的F值為7.336,相應的概率值是0.003,小于顯著性水平0.05,因此認為不同的銷售方式對銷售量有顯著的影響。另外,這個表中也給出了線性形式的趨勢檢驗結果,組間變異被銷售方式所能解釋的部分是196,被其他因素解釋的有244.5,并且組間變異被銷售方式所能解釋的部分是非常顯著的
4.事后檢驗
多重比較
因變數:
銷售量
Bonferroni
法
(I)
銷售方式
(J)
銷售方式
平均差異
(I-J)
標準錯誤
顯著性
95%
信賴區間
下限
上限
1.0
2.0
-7.0000
3.5285
.388
-17.615
3.615
3.0
9.0000
3.5285
.128
-1.615
19.615
4.0
4.0000
3.5285
1.000
-6.615
14.615
2.0
1.0
7.0000
3.5285
.388
-3.615
17.615
3.0
16.0000*
3.5285
.002
5.385
26.615
4.0
11.0000*
3.5285
.040
.385
21.615
3.0
1.0
-9.0000
3.5285
.128
-19.615
1.615
2.0
-16.0000*
3.5285
.002
-26.615
-5.385
4.0
-5.0000
3.5285
1.000
-15.615
5.615
4.0
1.0
-4.0000
3.5285
1.000
-14.615
6.615
2.0
-11.0000*
3.5285
.040
-21.615
-.385
3.0
5.0000
3.5285
1.000
-5.615
15.615
*.
平均值差異在
0.05
層級顯著。
給出了多重比較的結果,*表示該組均值差是是顯著的。因此,從表中可以看出,
第二組和第三組、第四組的銷售量均值差是非常明顯的,但是第三組與第四組的銷售量均值差話相卻不是很明顯。另外,還可以得到每組之間均值差的標準誤差、置信區間等信息。
平均值圖形
給出了各組的均值圖。從圖可以清楚地看到不同的施肥類型對應不同的銷售量均
值??梢?第三組的銷售量最低,且與其他兩組的銷售量均值相差較大,而第二組和和第三組之間的銷售量均值差異不大,這個結果和多重比較的結果非常一致
二、1.實例內容:
某研究機構研究了3種動物飼料對4種品系小鼠體重增加的影響,數據如圖下所示,變量a為飼料種類,變量b為鼠的品系,變量x為增重克數。
2.實例操作:
Step
01
打開對話框。
打開數據文件,選擇菜單欄中的【分析】|【一般線性模型】|【單變量】命令,彈出【單變量】對話框,如圖所示。
Step
02
選擇觀測變量。
在候選變量列表框中選擇【體重】變量作為因變量,將其添加至【因變量】列表框中。
Step
03
選擇因素變量。
選擇【飼料類型】和和【小鼠品系】變量作為因素變量,將它們添加至【固固定因子】列表框中,如圖所示。
Step
04選擇多重比較。
單擊【模型】按按鈕,彈彈出【單變量:模型】對話框,如圖5.23所示。選中【定制】單選按鈕,在左側列表框中選擇“因因素a”和“因因素b”變量并移至【模型】列表框中。選擇【構建項】選項組中【類型】下拉列表框中的【主效應】選項,再單擊【繼繼續】按鈕,返回主對話框。
Step
05其他選項選擇。
單擊【圖】按鈕,彈出圖5.24所示【單變量:輪廓圖】對話框。將因素b放入【單獨的線條】框,將因素a放入【水平軸)】文本框,單擊【添加】按鈕,再單擊【繼續續】按鈕,返回主對話框。
單擊【事后比較】按鈕,彈出圖所示對話框。將因素a和因素b放入【下列各項的事后檢驗】列表框,比較方法選擇LSD法。
單擊【選項】按鈕,彈出圖5.26所示【單變量:選項】對話框。將因素a和因素b放入【顯示下列各項的平均值】列表框,選中【比較主效應】復選框。選中【描述統計】復選框表示輸出描述性統計量;選中【齊性檢驗】復選框表示輸出方差齊性檢驗表。再單擊【繼續】按鈕,返回主對話框。
Step
06
完成操作。
最后,單擊【確確定】按鈕,操作作完成。
3.實例結果及分析
(1)主體間效應檢驗表
表所示為主效應模型檢驗,結果可見校正模型統計量F=6.772、P=0.000,說明模型有統計學意義。因素a和因素b均有統計學意義,P=0.000、P=0.037,均小于0.05。
主旨間效果檢定
因變數:
體重
來源
第
III
類平方和
df
平均值平方
F
顯著性
修正的模型
8929.625a
5
1785.925
6.772
.000
截距
167796.750
1
167796.750
636.304
.000
a
6487.875
2
3243.938
12.301
.000
b
2441.750
3
813.917
3.086
.037
錯誤
11075.625
42
263.705
總計
187802.000
48
校正後總數
20005.250
47
a.
R
平方
=
.446(調整的
R
平方
=
.380)
(2)成對比較表。
表所示為不同飼料類型兩兩比較結果,從Sig值(即P值)可見,飼料B與飼料C沒有差異(p=0.117),其余均有差異,p<0.05。
成對比較
因變數:
體重
(I)
飼料類型
(J)
飼料類型
平均差異
(I-J)
標準錯誤
顯著性b
95%
差異的信賴區間b
下限
上限
A飼料
B飼料
18.750*
5.741
.002
7.163
30.337
C飼料
27.938*
5.741
.000
16.351
39.524
B飼料
A飼料
-18.750*
5.741
.002
-30.337
-7.163
C飼料
9.188
5.741
.117
-2.399
20.774
C飼料
A飼料
-27.938*
5.741
.000
-39.524
-16.351
B飼料
-9.188
5.741
.117
-20.774
2.399
根據估計的邊際平均值
*.
平均值差異在
.05
層級顯著。
b.
調整多重比較:最小顯著差異(等同於未調整)。
(3)均值圖
圖所示為不同品系小鼠喂養不同飼料的體重增重的均值圖??梢夾飼料較好,B飼料和C飼料差異不大。
實驗小結:
通過該實驗,讓我懂得了利用數學思想解決實際問題,很好的把數學運用到實際生活中,在今后的學習中我會再接再厲的。
教師評語:
1.
實驗結果及解釋:(
準確合理、
較準確、
不合理
);占30%
2.
實驗步驟的完整度:(
完整、
中等、
不完整
);占30%
3.
實驗程序的正確性:(
很好、
較好、
中等、
較差、
很差
);占30%
4.
卷面整潔度:(
很好、
較好、
中等、
較差、
很差
);占10%
評定等級:(
)
教師簽名:
日期:
第三篇:SPSS統計軟件實訓報告
一、 實訓目的
SPSS統計軟件實訓課是在我們在學習《統計學》理論課程之后所開設的一門實踐課。其目的在于,通過此次實訓,使學生在掌握了理論知識的基礎上,能具體的運用所學的統計方法進行統計分析并解決實際問題,做到理論聯系實際并掌握統計軟件SPSS的使用方法。,
二、實訓時間與地點:
時間:2012年1月9日至2012年1月13日 地點:唐山學院北校區A座502機房
三、實訓要求:
這次實訓內容為上機實訓,主要學習SPSS軟件的操作技能,以及關于此軟件的一些理論和它在統計工作中的重要作用。對我們的主要要求為,運用SPSS軟件功能及相關資料來完成SPSS操作,選擇有現實意義的課題進行計算和分析,最后遞交統計分析報告,加深學生對課程內容的理解的。我們小組的研究課題是社會消費品零售總額的分析。
四、實訓的主要內容與過程:
此次實訓,我大概明白了SPSS軟件的基本操作流程,也掌握了如何排序、分組、計算、合并、增加、刪除以及錄入數據;學會了如何計算定基發展速度、環比發展速度等動態數列的計算;明白了如何進行頻數分析、描述分析、探索分析以及作圖分析;最大的收獲是學會了如何運用SPSS軟件對變量進行相關分析、回歸分析和計算平均值、T檢驗和假設性檢驗。通過這次試訓,我基本上掌握了SPSS軟件的主要操作過程,也學會了運用SPSS軟件進行各種數據分析。這些內容,也就是我們SPSS統計軟件實訓的主要內容。
四、實訓結果與體會
五天的SPSS軟件實訓終于結束了,雖然實訓過程充滿了酸甜苦辣,但實訓結果卻是甜的??粗〗M的課題報告,心里有種說不出來的感觸。高老師在對統計理論及 SPSS 軟件功能模塊的講解的同時更側重于統計分析在各項工作中的實際應用,使我們不僅掌握 SPSS 軟件及技術原理而且學會運用統計方法解決工作和學習中的實際問題這個實訓。我真真正正學到了不少知識,另外,也提高了自己分析問題解決問題的能力。 小組中每個人完成不同的任務,我的任務主要是用動態分析來了解農產品的價格變動,并利用圖表結合得出結論報告。通過對spss軟件對數據的實踐處理,我感覺顯著性檢驗問題還是比較簡單的,但對具體數據分析的目的性,實用性以及自己在做研究時如何使用,還有待進一步實踐和提高。
SPSS 有具體的使用者要求的分析深度,同時是一個可視化的工具,使我們非常容易使用,這樣我們可以自己對結果進行檢查。電算化老師曾經說過,學習軟件其實只是學習軟件的操作流程,而要真正掌握整個軟件,就得自己摸索探究,真真正正弄懂它,還要下一定的功夫的。我也深刻體會到了這點。前幾次實訓都是關于會計實驗的,雖然時間安排比此次實訓緊,任務量大,但實訓結束后,基本的試訓內容都完全掌握。而這次實訓,雖然時間安排較為輕松,內容也不多,操作起來也有一定的難度,另外受外界因素的影響,根本就聽不見看不見老師講的,即便后來老師一講就去前面,由于沒有條件跟著操作,導致一部分內容總是不熟練,請教同學他們也不會,不過,問題也總會用解決的辦法。經過我堅持不懈的努力,在本次實訓結束之前,我終于彌補了自己不熟練的那部分內容。
學習SPSS軟件,對于我們這些將來要時刻與數據打交道的人是有很大的幫助的,它主要的是運用SPSS軟件結合所學統計知識對數據進行需要的處理,相對于EXCEL處理,SPSS軟件處理不僅效率高,而且操作簡單。我個人覺得,SPSS軟件是一門專業性較強的課程,對于我們財務管理專業的學生是一門必備的課程,也是一門必須熟練掌握的課程,很慶幸,我是抱著將來要學習運用SPSS軟件進行此次實訓的。這次實訓,使我對統計工作的過程和 SPSS應用的流程取得一定的感性認識,拓展了視野,鞏固所學理論知識,提高了分析問題、解決問題的能力,也增強了我的職業意識、勞動觀點以及適應社會的能力,最重要的是它使我獲得了思想和課題分析處理上的雙豐收。
在SPSS學習中,我對它的認識由淺入深,循序漸進,在實踐中遇到的各種問題也能逐個攻克。學習這種在日常工作中有價值的分析方法,會使我們更能輕易應付日后的社會的信息工作;掌握這種高級的技能,對我們工作就業也提供了競爭優勢.但是,軟件的學習并不是一蹴而就的,在這個科技高速發達和知識不斷更新的時代,我們應該不斷學習不斷更新自己的知識體系,爭取做一名國家所需要的優秀的統計者。
唐 山 學 院
實 訓 報 告
經濟管理系
系 別:________________________
SPSS統計軟件實訓
實 訓 名 稱:________________________ 10國貿本2 班 級:________________________ 姓 名 學 號:______張巖巖_206________ 指 導 教 師:________________________ 高愛青 邊麗潔
2012年
1 月 12日
唐 山 學 院
實 訓 日 志
經濟管理系 系 別:________________________ SPSS統計軟件實訓 實 訓 名 稱:________________________ 10國貿本2 班 級:________________________ 姓 名 學 號:________________________ 張巖巖
206 高愛青
邊麗潔 指 導 教 師:________________________
2012年
1月12日
第四篇:利用統計軟件SPSS進行試卷質量分析
分 類 號: 密 級: 學校代碼: 10638 學 號:
碩 士 學 科 論 文
利用統計軟件Spss進行試卷質量分析
姓 名
敬曉萍
指 導 教 師 馮長煥 教授
培 養 單 位
數學與信息學院
學 科 專 業
教育統計與測評
研 究 方 向 數學教育
學 位 類 別
教育碩士
年 級 2010級
西華師范大學學位評定委員會
四川·南充
利用統計軟件Spss進行試卷質量分析
摘 要
試卷分析是教學工作中的重要組成部分,同時也是每個教師必須完成的工作。通過對試卷進行分析,可以反饋學生學習結果和教師教學效果,幫助教師發現教學活動中的薄弱環節,提高教學質量。課程期末考試的試題應該如何命題,怎樣組卷?如何把握一份試卷的整體難度和分量,使考試成績及其成績的分布符合正態,防止平均成績的大起大落,避免不及格率的過高過低,以適應大眾教育的需要等,這對穩定學校正常的教學秩序,保證學生正常的學習心態和情緒,直至就業應聘是否順利等都會產生直接的影響。本文利用統計軟件Spss對試卷分析的各項指標進行了定量分析,介紹了操作方法,以便為廣大教師進行試卷分析提供一種模式參考,從而科學地進行試卷質量分析,提高教學質量和效率。
關鍵字:成績統計;試卷分析;難度;區分度;信度
考試是教育評價的有效辦法,隨著高職高專技能教學改革的深入開展,對教學評價的要求越來越客觀,對教學結果的分析越來越依賴于統計理論和方法。本文的目的是借助統計學軟件Spss,介紹對試卷質量定量分析的方法。
一、考試試卷的統計分析[1]
(一)試卷難度的分析
所謂難度是指考試中試題或者試卷的難易程度,是考試題目對學生知識和能力水平適合程度的指標。
1.難度的計算
以往教師在考試中對試題難度的測定大部分是憑感覺。這種方法本身比較模糊,對有經驗的教師也并不是非常有效。根據難度的概念,得到如下公式:
若第i題全部答對,則di=0;若第i題全部答錯,則di=1;當di=0.5,說明此題難度適中。
試卷難度:
試卷難度的測定建立在試題難度的基礎上,以試題難度為變量,以試題滿分值為權數的加權算數平均數:
一般而言,試卷都是以100分為滿分,于是:
對于學校的常規考試,目的在于測量個體差異。當d=0或d=0.5時,即試題全部答對或答錯,該題便無法提供個體差異的信息。而只有當d=0.5時,題目才能做最大程度的區分度。但在實際工作中要使每題難度均達到0.5有一定的困難。
因此,一般要求試卷平均難度為0.5左右,各試題的難度控制在0.5±02之間。
2.難度的比較
按以上公式計算的試題及試卷難度,只能看出不同試題或不同試卷的難易程度,但卻不能分析題目或試卷之間的相對難度。如某試卷中,第一,第二,第三題的難度分別是0.3,0.4,0.5。從難度數據中可以看出,第一題相對較容易,第三題較難。但第二題與第一題的難度差和第三題與第二題的難度差是否相等?這卻不一定。原因是不同試題的難度位于不同的等距量表,因而不具有可比性。為解決試題及試卷之間難度的相互對比,需要將以上公式計算的難度,通過正態分布表,轉化為標準分。如:d=0.3,z= -1.88;d=0.4,z= -1.75;d=0.5,z= 0。顯然,第二題與第一題的難度差為0.13,第三題與第二題的難度差為1.75,難度差并不相等。
(二)試卷區分度的分析
區分度也叫鑒別力,就是通過一次考試將不同程度,不同能力的學生區分開來的重要指標。比如一道題目,水平高、能力好的同學都答對,而水平低、能力差的同學都答錯,那么這道題就有好的區分度。
計算公式:
1.試題的區分度:
式中:Hi為班級中高分組同學第i題的平均成績;Li為班級中低分組同學第i題的平均成績。(一般而言,高分組與低分組的同學人數是以班級同學人數10%-15%確定)
當高分組平均成績與低分組平均成績差距較大時,Gi較大,這時對試題的區分度評價就比較好。
2.試卷區分度
區分度的評價標準:
(三)常用指標簡介[2]
平均值:反映一組數據的總體情況。 方差:反映一組數據的波動大小。
峰度:用來描述某變量所有取值分布形態趨勢程度的統計量,是與正態分布相比較的量。峰度為0表示其數據與正態分布的趨勢程度相同;峰度大于0表示比正態分布更加陡峭;峰度小于0表示比正態分布更加平坦。
偏度:用來描述數據的對稱性的統計量。偏度大于0表示正偏差數值較大;偏度小于0表示負偏差數值較大。而偏度的絕對值越大表示分布形態的偏差程度越大。
二、具體操作步驟[3] 1.原始數據錄入
下面我們以我校數學與信息學院《統計分析》期末考試試卷為例來說明各個指標的實現方法。
1.1試卷結構
本試卷(滿分100分)有兩個部分組成:客觀性試題與主觀性試題,其中客觀性試題共40分,占40%,主觀性試題共60分,占60%。具體情況見下表。
分值分布圖
注:q1是填空題、q2是選擇題、q3是判斷題、q4是簡答題、q5是問答題、q6是計算題。
1.2數據定義
圖1 變量定義窗口
圖2 試卷質量分析數據窗口
在SPSS軟件中,點擊Variable View標簽,在Name標題下定義:學號、題號、總成績、平時成績,其中總成績定義為total,平時成績定義為daily,然后在相應的標簽名中進行注釋。在Type標題下定義各個項目的類型,其中學號定義為String類型、題號和平時成績定義為Numeric類型,其余選項使用默認即可。如圖1所示。
1.3數據錄入 點擊Data View標簽,將47份試卷按照各部分得分情況和他們的總成績、平
時成績輸入到相應的表格中。如圖2所示。
2.基本描述性統計分析
主要包括參加考試的學生總數、缺考人數、每個部分的最高分、最低分、極差、平均分、標準偏差(方差)等。
在試卷質量分析數據中,運行菜單:Analyze→Descriptive Statistics→Descriptives,把除平時成績外的所有變量加入到Variables中,點擊Options選項對話框,選中Mean、Minimum、Maximum、Range、Std.deviation、Variance。點擊Continue,再點擊OK。運行后得到結果如下表所示。
描述性統計分析表
3.難度分析
試題難度是指測驗題目的難易程度,難度系數一般用字母P表示,且0≤P≤1。對是非題和論文型的題目,我們可以統一為P=M/W(M:全體學生某題的平均得分;W:某題規定的最高得分)。對于選擇題我們先計算得出難度系數P,然后再根據公式cp=(kp-1)/(k-1)(k為選項個數)算出矯正難度系數cp。(單項選擇題學生可能隨機猜測,此公式能排除這種影響)試題難度系數與試題實際難易程度正好相反,越大表示能夠正確解答該題的學生越多試題越容易,而越小則試題越難。一般認為,難度適中更能客觀地反映出學生的學習效果情況,多數試題應分布在0.3~0.7之間,選拔性測試為0.5左右為宜,通常期末考試為目標參照性考試,可適當偏高,全卷平均難度以0.7左右為宜,0.6~0.8為正常。
根據上表,很容易得到各個部分的難度系數,如下所示。
各個部分的難度系數
注:q2的難度系數為矯正難度系數 4.區分度分析
對于客觀題來說,使用等級相關分析,在此使用斯皮爾曼(Spearman)等級相關分析。對于主觀題來說,樣本數為47,大于30,可以看成非等間距測度的連續變量,在此采用皮爾遜(Pearson)相關分析對試題進行分析。
具體操作如下:Analyze→Correlate→Bivariate。在彈出對話框中選擇各個客觀題題號變量和總成績進入Variables,然后在Correlation Coefficients中單擊Spearman,完成后即可得到客觀題的區分度。主觀題的區分度分析方法同上,只需選擇主觀題和總成績進入,然后選擇Pearson即可。得到每個部分的區分度,見下圖:
各個部分的區分度
三、分析結果
(1)基本描述統計數據上來看,學生總數為47人,無人缺考,學生的的卷面總成績平均分為82.83分,最高分為99分,最低分為59分,分數極差為40分,標準差為10.538,標準差比較大,說明學生個體間存在較大的差異,主要影響因素是他們入學時學歷結構、上課聽講、作業完成、課后復習等。對一部分后進學生,在今后的教學過程中應當充分關注,努力調動他們的學習積極性,經常鼓勵他們,從而達到提高學習成績的目的。(2)從難度上來看,第二題(0.983)、第三題(0.996)難度系數過大,說明此題出的太容易,建議此題不宜進入題庫,在修改后參加下一輪的遴選。(3)從區分度上來看,除了第二題、第三題區分度較低,其余都比較好,基本達到了考試要求。
四、成績考試的信度分析[4]
“考試信度對于任何一種有效考試來說都是必不可少的,只有信度高的考試才能使教師對學生的評價客觀、可靠,考試成績才能正確地反映被試者的程度”。[5]教育測量學、教育統計學在理論上為考試的科學化和現代化奠定了基礎,使得考試分析數量化,而SPSS統計軟件又使廣大教師使用計算機進行學業成績考試信度的定量分析成為可能。
(一)考試分數的信度系數
衡量一次考試的可靠性指標叫做信度,表明信度大小的量叫做信度系數。雖然教育測量和統計書上介紹計算考試分數的信度系數有多種方法,但因為學科或學業成績考試具有一般不進行前測和復測的特點,且試題多含有主觀題,因而Cronbach’s α系數是最適合學科考試的信度分析。因為Cronbach’s α系數不僅適合主觀題,也可以用于多項選擇題等客觀試題。
下面我們以我校外語學院語音考試題考試題為例介紹用Spss進行信度分析的步驟。
1.Cronbach’s Alpha系數的計算步驟
步驟1:選擇信度分析程序。在數據編輯窗口中單擊Analyze打開下拉菜單,選擇Reliability Analysis„„程序,進入信度分析主對話框。
步驟2:選擇要進行分析的原始變量。在信度分析主對話框中選擇第1-5題共五個變量,單擊右向箭頭將其移入Items方框中。在Model的下拉菜單中選擇Alpha模型,即表示希望獲得Cronbach’s Alpha系數。在信度分析主對話框點擊Statistics按鈕,進入定義信度分析統計量對話框。
步驟3:在定義信度分析統計量對話框Descriptives for 中勾選Scale ifitem deleted復選項,表示要求在輸出結果中顯示刪除各個項目之后的系數變化情況。然后點擊Continue按鈕,回到信度分析主對話框,并點擊OK提交系統運行,出現運行結果。
2.信度系數輸出結果及說明
按照上述參數設置,Spss軟件在輸出信息觀察窗口輸出一個表格(表1)。該表報告了“語音聽力考試成績”各題的信度分析結果。表首為分析方法,意為選擇了Alpha模型。表中的第1欄為變量,是語音聽力考試的五道大題。第二欄為刪除該項目后試題的平均值。第三欄為刪除該項目后試題的方差。第四欄為該項目與試題總分的相關系數,相關系數較低的項目往往是有問題的試題。例如表中第5題與試題的相關系數僅為.2854,說明該題應該修改或刪除。
最后一欄為刪除其中某個項目后考試題的Alpha系數變化情況,該欄在檢驗信度差的試題方面很有用。如果刪除某一道試題后的Alpha系數比試題的信度系數大,則可考慮將該題刪除。本例中刪除第5題后,信度系數將由原來的.7491提高到.7819,由此我們可以從提高信度系數的角度,確認該題應該修改或刪除。
Cronbach’s Ahlha系數介0-1之間,系數越高,說明試題的內在一致性越強,測試的結果越可靠。通常自編考試的Cronbach’s Ahlha系數“要求0.60-0.80之間,而標準化考試則要求在0.90以上”。[6]本例的信度系數為.7491,因此我們可以得出信度較好的結論。
二、考試分數的正態分布檢驗
李筱菊認為考試“分數拉開距離,它們的分布才可能正態。分數分布正態,說明它反映了人的能力分布實況,說明考試有信度。”[7]因此,我們除了使用信度系數還可使用考試成績正態分布的數據及分布圖來測量和檢驗信度。
考試分數是否服從正態分布,可以用曲線圖來觀察,也可以計算偏態值和峰值的方法來確定。
1.正態分布圖表的制作方法
步驟1:在Spss數據編輯視窗,點擊Analyze命令,Descriptive Statistics在下拉菜單中選擇Frequencies„,打開頻數直方圖編輯對話框。
步驟2:在頻數分析主對話框中左邊變量列表中選擇第1-5題和總分共六個變量,點擊向右箭頭將其移入Variable::(變量)下白方框中,然后點擊Statistics „按鈕,進入頻數分析數據編輯子對話框。選擇Display normal curve,表示同時顯示正態分布曲線。
步驟3:在頻數分析數據編輯子對話框中Distribution.中選擇Skewness和Kurtosis,表示要求計算正態值與峰值。點擊Continue返回頻數分析主對話框,單擊Options„按鈕,進入圖形選項對話框。
步驟4:在頻數分析圖形選項子對話框中Chart Type下選擇Histograms(單選項,表示要求輸出直方圖,并選擇With normal curve復選項,表示要求輸出的直方圖帶正態分布曲線。點擊Continue按鈕返回到主對話框,單擊Ok按鈕提交系統運用。
2.正態分布圖及解釋
按上述參數設置,Spss共在輸出信息觀察窗口輸出6幅圖形與7個表格(其中6個表格是6個變量的頻數分布表)。我們只以其中一幅圖形和描述統計表格為例介紹報告結果的含義及解釋。
考試分數是否服從正態分布,可以通過帶正態分布曲線直方圖來觀察。直方圖是以長方形面積表示頻數分布的一種圖形,它的長度和寬度均有意義,而且由于數據值具有連續性,所以各長方形須相連排列。圖中的頂點是平均成績。直方圖中的曲線稱分布曲線。正態分布曲線是中間高、兩邊低且左右對稱的曲線。曲線的最高峰,即頻數最多處,是曲線的中間位置。這一位置的分數正好是分數的平均值。由于帶正態分布曲線的次數直方圖具有以上特點,所以可以直觀地確定分數分布是否服從正態分布。
3.正態分布表及結果解釋
表2是該考試五道大題和總分共六個變量的偏態值和峰值描述統計表。表中第一行為變量名;第二行N Valid為參加考試的有效學生人數;第三行為缺考人數(Missing);第四行為偏態值(Skewness);第五行是峰值(Kurtosis)。
偏態值和峰值為0時表示完全正態,偏態值的正、負表示正、負偏態。峰值的正負表示峰的“高瘦”(分數集中)和“矮平”(分數分散)。
偏態值如表2第三行所示,本例中單詞聽寫、短文聽寫和聽對話簡答三題的偏態值均為負數,是負偏態,表示這三題分數分布偏向了右邊,也就是偏向了高分,得分高于平均分的人數超過50%。而聽句子簡答、短文聽力理解和總分三個變量的偏態值均為正數,即正偏態,表示分數分布偏向了左邊,也就是偏向了低分,得分低于平均分的人數超過了50%。
峰值如表2第四行所示,本例中單詞聽寫、聽對話簡答和總分的峰值為正數。表示峰比理想正態分布的峰高尖,也就是分數過分集中在中分段。而短文聽寫、聽句子簡答和短文聽力理解三個變量的峰值為負數。表示這三個變量的峰比理想正態分布峰矮平,也就是分數過分散開。
表2 偏態值及峰值描述統計表
“一般說一個考試偏態值和峰值能控制在±1之內,便算其分數基本符合正態分布”。[8]因此,我們可以得出結論:語音聽力部分考試的五道大題和總分基本符合正態分布,這份試題總體信度較好。
綜上所述,本文為不太熟悉數理統計的廣大教師介紹了用Spss軟件計算Cronbach’s Alpha系數和正態分布檢驗學業成績考試信度的方法,從而使我們可以較好地測量出考試成績是否正確反映了學生的學習程度,考試對教學的評價是否可靠。再用信度檢驗數據查找出影響信度的試題、修改提高試題質量,這對發揮考試評價教學的作用和改進教學效果、提高教學質量無疑是很有好處的。
參考文獻:
[1]樓裕勝. 學生成績的統計分析[D].杭州:浙江金融職業學院,2007. [2]李良.巧用Excel和SPSS軟件分析考試成績[J].金華職業技術學院學報.2008年4月.第8卷第2期. [3] 王雪、鄧振偉、陳玲、田七. SPSS軟件在試卷質量分析中的應用[N].讀與寫雜志.2009年3月.第6卷第3期. [4] 秦志強、賈真真. 學業成績考試的信度分析[J].教育理論與實踐.2006年第26卷第7期.第4-6頁. [5]鄒申,楊任明.簡明英語測試教程[M].北京:高等教育出版社,2000. [6]宋兆鴻,劉世表,張才美,張國華,張頌增,彭成獎等.現代教育測量[M].北京:教育科學出版社,1986. [7][8]李筱菊.語言測試科學與藝術[M].長沙:湖南教育出版社,1997.
第五篇:管理統計學SPSS數據管理 實驗報告
數據管理
一、實驗目的與要求
1.掌握計算新變量、變量取值重編碼的基本操作。 2.掌握記錄排序、拆分、篩選、加權以及數據匯總的操作。
3.了解數據字典的定義和使用、數據文件的重新排列、轉置、合并的操作。
二、實驗內容提要
1.自行練習完成課本中涉及的對CCSS案例數據的數據管理操作 2.針對SPSS自帶數據Employee data.sav進行以下練習。
(1)根據變量bdate生成一個新變量“年齡”
(2)根據jobcat分組計算salary的秩次
(3)根據雇員的性別變量對salary的平均值進行匯總
(4)生成新變量grade,當salary<20000時取值為d,在20000~50000范圍內時取值為c,在50000~100000范圍內取值為b,大于等于100000時取值為a
三、實驗步驟
1、 針對CCSS案例數據的數據管理操作
1.1.計算變量,輸入TS3到目標變量,在數字表達式中輸入3,把任意年齡段分成三個組20-30設為1組,1-40設為2組41-50設為3組。圖1,
圖1 1.2.對已有變量的分組合并,在“名稱”文本框中輸入新變量名TS3單擊“更改”按鈕,原來的S3->?就會變為S3->TS3,單擊“舊值和新值”按鈕,系統打開“重新編碼到其他變量:舊值和新值”,如下圖2,
圖2
圖3 1.3.可視離散化,選擇“轉換”->“可視離散化”,打開的對話框要求用戶選擇希望進行離散化的變量,單擊繼續,如下圖4,
圖4 單擊“生成分割點”,設定分割點數量為10,寬度為5,第一個分割點位置為18,單擊“應用”,如下圖,
圖5 結果顯示如下,
圖6 2.針對SPSS自帶數據Employee data.sav進行以下練習。
2.1.根據變量bdate生成一個新變量“年齡”,選擇“轉換”->”計算變量”, 如下圖,
圖7 結果顯示如下,
圖8 2.2.根據jobcat分組計算salary的秩次,
圖9 結果顯示如下,
圖10 2.3.根據雇員的性別變量對salary的平均值進行匯總
圖11 結果顯示如下,
圖12 2.4.生成新變量grade,當salary<20000時取值為d,在20000~50000范圍內時取值為c,在50000~100000范圍內取值為b,大于等于100000時取值為a
圖13 結果顯示如下,
圖14
四、實驗結果與結論