統(tǒng)計表和統(tǒng)計圖都是將已整理的資料用簡明的表格或圖形表達出來,使人獲得明晰而直觀的印象,避免冗長的文字敘述,便于比較分析。
一、統(tǒng)計表
統(tǒng)計表(statistical table)是從整理表中選出需要的資料,經過統(tǒng)計加工為各種指標后,列成便于對比分析的表格。
。ㄒ)統(tǒng)計表的結構和要求
表的結構要簡潔,最好一事一表,避免臃腫龐雜。
例17-1 吳氏等研究某些疾病發(fā)生高催乳素血癥的頻率,結果歸納如表17-1。
表17-1 高催乳素血癥的發(fā)生率
診斷 | 總例數(shù) | 高催乳素血癥例數(shù) | 發(fā)生率(%) |
嫌色細胞瘤 | 80 | 62 | 77.5 |
肢端肥大癥 | 41 | 17 | 41.5 |
蝶鞍部其他腫瘤 | 29 | 10 | 34.5 |
原因不明閉經 | 67 | 14 | 20.9 |
月經量少 | 20 | 3 | 15.0 |
單純泌乳 | 5 | 0 | … |
精神分裂癥 | 1 | 1 | … |
資料來源:吳建中等 中華婦產科雜志20:34,1985年
以該表作為典范,說明統(tǒng)計表的結構特點:
1.標題 簡練,用詞確切,能表達中心內容,左側有表號以備查考(必要時還應標明資料來源和時間)
2.標目 有橫標和縱標目,橫標目又稱主辭,是研究事物的對象,通常位于表內左側;縱標目的是研究事物的指標,又稱賓辭,列在表內上方,其表達結果與主辭呼應,讀起來就是一完整句子。例如第一行可讀成:“嫌色細胞瘤80例,有62例出現(xiàn)高催乳素血癥,發(fā)生率77.5%!
3.線條 力求簡潔,該表除有較粗的頂線和底線外,表內只有一條隔開縱標目的的細橫線,簡單明了。
4.數(shù)字 位置上下對齊、準確、率的小數(shù)點后所取位數(shù)也上下一致。該表最后兩個率因為構成的絕對數(shù)太小,作者在發(fā)生率欄中用“…”來表示,這是對的。一般如果某格無數(shù)據(jù)或暫缺資料,也可用“-”或“…”來表示。
5.內容排列 一般按事物發(fā)生頻率大小順序來排列,對比鮮明,重點突出。
。ǘ)統(tǒng)計表的種類
常用的有四種:
1.簡單表 常用以比較互相獨立的統(tǒng)計指標,主辭未經任何分組。表17-1即屬簡單表。
2.分組表 主辭按一個標志分組,結構形式與簡單表基本相似。通常設有合計欄,以利說明綜合水平。
例17-2 1984年上?h隨機抽查30歲以下的正常人群的麻診免疫水平,共檢查733人結果統(tǒng)計如表17-2。
表17-2 1984年上?h部分健康人群麻疹抗體
年齡(歲) | 檢測人數(shù) | 陽性人數(shù) | 陽性率(%) | 平均滴度之例數(shù) |
0~ | 124 | 123 | 99.2 | 43.52 |
5~ | 141 | 141 | 100.0 | 37.64 |
10~ | 147 | 147 | 100.0 | 21.43 |
15~ | 109 | 102 | 93.6 | 15.50 |
20~ | 91 | 89 | 97.8 | 17.94 |
25~ | 121 | 119 | 98.3 | 19.78 |
合計 | 733 | 721 | 98.4 | 25.14 |
資料來源:鄭平等 上海醫(yī)科大學學的增刊53頁,1987年
表17-2的主辭是按年齡分組的調查對象,亦就是按年齡一個標志分組,所以屬于分組表。
3.復合表 主辭按兩個以上標志分組。在安排上可將部分主辭放在表的上方,與賓辭配合起來。
例17-3 胡氏介紹改良陰道縱隔手術治療子宮脫垂132例,療效統(tǒng)計表如表17-3。
表17-3 132例子宮脫垂手術前后癥狀比較
癥狀 | 手術前 | 手術后 | ||
例數(shù) | % | 例數(shù) | % | |
下墜感 | 126 | 95.45 | 13 | 9.85 |
性生活不滿意 | 123 | 93.18 | 3 | 2.27 |
腰酸痛 | 47 | 35.60 | 9 | 6.82 |
排尿困難 | 36 | 27.27 | 0 | 0 |
壓力性尿失禁 | 17 | 12.88 | 0 | 0 |
資料來源:胡麗華 中華婦產科雜志20:56,1985年
復合表是否需要合計應從有無意義來決定
4.列聯(lián)表 把數(shù)據(jù)資料列成交叉分類的表格,使一種屬性的亞類以水平方向(行)表示,另一種屬性亞類以垂直方向(列)表示。這樣行變量與列奕量之間的聯(lián)系便顯示出來,并加以檢驗。最簡單的列聯(lián)表是四格表(2×2表);還有多維分類形式的列聯(lián)表。
例17-4 羅氏等應用國產放射免疫檢測試劑“北方RIA”與進口試劑“AUSRIA”對肝癌發(fā)高發(fā)區(qū)居民乙型肝炎表面抗原(HBsAg)進行配對檢測,結果統(tǒng)計如表17-4。
該表資料可以應用配對x2檢驗法作進一步分析,具體方法將于第二十章介紹。
表17-4 兩種試劑檢測HbsAg結果比較
北方RIA | 進口AUSRIA | 合計 | |
+ | - | ||
+ | 244 | 107 | 351 |
- | 149 | 1146 | 1295 |
合計 | 393 | 1253 | 1646 |
資料來源:羅斯等 腫瘤論文匯編125頁,1987年廣西壯族自治區(qū)
二、統(tǒng)計圖
統(tǒng)計圖(statistical diagram)一般是根據(jù)統(tǒng)計表的資料,用點、線、面或立體圖像鮮明地表達其數(shù)量或變化動態(tài)。醫(yī)學統(tǒng)計常用的有線圖、直方圖、長條圖、圓形圖和統(tǒng)計地圖等。
。ㄒ)制圖通則
1.根據(jù)資料性質和分析目的正確選用圖形。
2.要有確切的標題和編號,其位置通常安排在圖體下面。
3.在同一圖內比較幾種不同的事物時,須用不同的線條或顏色表示,并附圖例說明。圖例位置要與圖體協(xié)調、美觀;如有礙于形象,則不要放在圖體內。
4.有縱軸和橫軸為坐標的圖形,一般都以第一象限為準則作圖,以兩軸交點為起點,縱、橫軸都應有標目,并注明尺度的數(shù)量單位。
。ǘ)醫(yī)學常用統(tǒng)計圖及繪制法
1.線圖(line diagram)
。1)適用于連續(xù)變量資料。說明某事物因時間、條件推移而變遷的趨勢。
(2)橫軸常用以表示某事物的連續(xù)變量,縱軸多表示率、頻率或均數(shù)。
。3)縱軸采用算術尺度,從零開始。如果圖形的最低點與零點差距很大,則可在縱軸基部作折斷口,使線段降低以求美觀。橫軸可以不從零開始,如果以組段為單位,則每組均以組段下限為起點。但繪圖的坐標點則應以組段中點為宜。
。4)同一圖內不宜有太多曲線,以免混淆不清。如有幾條線作對比,則用不同線形來區(qū)別,并有圖例說明。
例17-5 根據(jù)成都學齡前兒童生長發(fā)育的3年追蹤調查,身高的年增長值按性別分組統(tǒng)計比較如表17-5和圖17-1。因為身高發(fā)育是連續(xù)性變量資料,用曲線圖來表示是適宜的。該圖很微妙地反映出兒童少年生長發(fā)育期的規(guī)律:女孩身高從8歲起增長很快,10歲左右達到突增高峰。男孩則在10歲起才迅速增長,13歲左右達突增高峰。這和生理上女孩青春期了育比男防早一些,是十分吻合的。
表17-5 1979~1982年成都學齡前兒童身高年增長值(cm)
(歲) | 男 | 女 | ||||
人數(shù) | 均數(shù) | 標準誤 | 人數(shù) | 均數(shù) | 標準誤 | |
7~ | 72 | 5.90 | 0.93 | 108 | 6.07 | 0.94 |
8~ | 198 | 5.88 | 1.01 | 213 | 5.42 | 1.58 |
9~ | 322 | 5.17 | 1.13 | 234 | 6.18 | 1.84 |
10~ | 351 | 5.26 | 1.53 | 338 | 6.78 | 1.72 |
11~ | 356 | 6.49 | 2.30 | 370 | 6.59 | 1.72 |
12~ | 322 | 7.72 | 2.45 | 316 | 5.13 | 1.96 |
13~ | 296 | 7.93 | 2.38 | 293 | 3.75 | 2.16 |
14~ | 266 | 4.55 | 2.61 | 200 | 1.46 | 1.27 |
15~ | 173 | 3.16 | 2.12 | 121 | 1.24 | 1.10 |
資料來源:張興儒等 中華預防醫(yī)學雜志21(6):338,1987年
圖17-1 成都市男女學生平均身高年增長值曲線
另外不有一種線圖叫半對數(shù)線圖(semilogline diagram),縱軸用對數(shù)尺度,橫軸仍用算術尺度。這種圖常用于比較兩組相對數(shù)的比值相差較大的動態(tài)數(shù)列。原因是同樣的增長速度在對數(shù)尺度上的距離是相等的。例如表17-6中的三組數(shù)據(jù),由時間A到B分別繪在算術格紙(圖17-2a)和半對數(shù)格紙(17-2b)上,呈現(xiàn)兩種不同的結果。a圖三條直線坡度相差懸殊,這是三組數(shù)據(jù)的絕對差相差懸殊之故;b圖則因三組數(shù)據(jù)的對數(shù)差相等,下降坡度亦一樣。
圖17-2 三組數(shù)據(jù)繪在算術(a)和半對數(shù)(b)格紙上的線圖比較
表17-6 絕對差與對數(shù)差的比較
A→B | 絕對差(A-B) | 相對比(A/B) | 對數(shù)差(IgA - IgB) |
1000→100 | 900 | 10 | Lg1000-lg100=3-2=1 |
100→10 | 90 | 10 | Lg100-lg10=2-1=1 |
10→1 | 9 | 10 | Lg10-lg1=1-0=1 |
下例進一步說明半對數(shù)線圖應用的實際意義。
例17-6 美國疾病控制中心(CDC)報道,自從應用白喉類毒素作為兒童常規(guī)免疫接種后,白喉發(fā)病率和死亡率明顯下降,但病死率仍停留在一定水平上。三者動態(tài)變化表達如圖17-3。
圖17-3 應用類毒素免疫接種后的白喉發(fā)病率、死亡率和病
死率的動態(tài)變化比較(1920~1975年)
(資料來源:CDCNo.12,1978,Atlanta,Ca,USA)
該圖很形象地表明在55年內白喉發(fā)病率和死亡率下降速度基本一致。但兩組數(shù)據(jù)的前后絕對差卻很懸殊,如果用算術格紙來描繪,直觀上將產生發(fā)病率下降坡度明顯大于死亡率下降的錯覺。圖中還反映了白喉病死率自1920~1970年間變化不明顯,與白喉死亡率不同;這里存在兩個率的含義不同的原故,本教材的第二十四章將予闡明。
2.直方圖(histogram)
(1)直方圖是以面積表示數(shù)量,適用于表達連續(xù)性資料的頻數(shù)或頻率分布。
。2)橫軸表示變量,尺度可以不從零開始。同一軸上的尺度必須相等。
(3)作圖時各直條的寬度應等于組距,高度應等于該組的頻數(shù)或頻率。組距相等的分組資料才能作圖,否則應先換算成相等組距。以下是120例T3比值頻數(shù)表作圖(圖17-4)。
圖17-4 120例正常血漿結合125I-Ts樹脂攝取比值分布
將各組直方的頂端中點相連,即成多邊圖,也可用來表示連續(xù)性資料的頻數(shù)頒布情況。
3.直條圖(bar chart)
。1)直條圖是用等寬直條的和長短來表示各統(tǒng)計量的大小,適用于彼此獨立的資料互相比較,有單式和復式兩種。
。2)作圖時,一般是以橫軸為直條圖的基線,縱軸表示頻數(shù)或頻度,從零開始;直條間的距離一般以條寬的1/2為宜。排列順序若非自然順序資料,則按由高到低的次序排列,便于比較。
。3)復式直條圖的制圖要求與單式相同,但每組的直條最好不要過多,同組直條間不留空隙,組內各直條排列次序要前后一致。
例17-7 上?h統(tǒng)計了1960~1962年和1978~1980年兩段時期的居民前10位死亡原因,F(xiàn)將其中可配比的9對資料繪成直條圖(圖17-5)比較如下。
圖17-5 上?h居民在1960~1962年與1978~1980年間死亡原因變化的比較
資料來源:GuXingyuan et al ,AJPH72(Sup.)p.22,1982
該圖給人的鮮明印象是原居首位的傳染病死亡率與第6位的惡性腫瘤死亡率互易位;同時腦血管病和心臟病分別進到第2位和第3位。
4.百分條圖(percentchart)
用以表達構成比的圖形,繪制簡便,而且可將多條并列作比較,以闡明疾病的動態(tài)變化。
例17-8 某礦采用濕式作業(yè),粉塵濃度明顯下降。若干年后,新發(fā)矽肺減少,歷年存活矽肺患者的期別也隨之發(fā)生變化。作者根據(jù)表17-7統(tǒng)計資料繪制百分條圖比較如圖17-6。
5.圓形圖(circulargraph)
用途同百分條圖,是以圓的半徑將圓面分割成多個大小不等扇形來表達構成比。作圖法是先將各個百分比乘以3.60,獲得圓心角度數(shù),按其大小排列從0時開始,且量角器順時針方向劃分為一系列扇形。圖17-7是某廠某年工傷分析百分比圖。
表17-7 某礦1961~1965年矽肺患者期別構成比
矽肺分期 | 1961年 | 1962年 | 1963年 | 1964年 | 1965年 | |||||
例數(shù) | % | 例數(shù) | % | 例數(shù) | % | 例數(shù) | % | 例數(shù) | % | |
Ⅰ | 48 | 50.5 | 54 | 47.8 | 61 | 43.9 | 64 | 41.3 | 67 | 39.9 |
Ⅱ | 33 | 34.7 | 41 | 36.3 | 53 | 38.1 | 60 | 38.7 | 66 | 39.3 |
Ⅲ | 14 | 14.8 | 18 | 15.9 | 25 | 18.0 | 31 | 20.0 | 35 | 20.8 |
合計 | 95 | 100.0 | 113 | 100.0 | 139 | 100.0 | 155 | 100.0 | 168 | 100.0 |
圖17-6 某礦1961~1965年各期存活矽肺構成比的動態(tài)
圖17-7 某年某廠工傷病例百分比
6.點圖(scatterdiagram)
表示兩種事物變量的相關性和趨勢。醫(yī)學上常用于觀察兩種生理指標之間的動態(tài)變化關系,或臨床上兩項檢測結果之間的量變關系。點圖繪測方法是先繪出適學的坐標,一般以兩軸正交點為0點,但也可按兩變量的全距中最小值起點加以高速調整。x變量定在橫軸,y變量定在縱軸;然后將每受檢者測得兩變量值,找出P(x,y)所在的方位,并繪出各自的坐標點。最后根據(jù)點的頒布情況進行分析。
例17-9 某中學測得最高年級100名男生身高、體重的結果,繪成點圖如圖17-8。
7.疾病狀況動態(tài)結構圖
是有目的地觀察幾種主要病傷類別構成的動態(tài),從而評價衛(wèi)生工作效果,指導以后工作的規(guī)劃和策略。圖17-9是美國1900~1973年間11種主要傳染病歷年占總死亡率百分比的動態(tài);從1900年占40%到1970年僅6%;相應的中風、腫瘤和心臟病在該期間從20%上升到59%;意外事故死亡所占比重則變化不大。
以上只介紹幾種常用統(tǒng)計圖、表范例和繪制通則,讀者可根據(jù)資料內容和需要靈活運用和發(fā)展。
圖17-8 某年某校100名男生身高體重相關圖
圖17-9 1900~1973年間美國傳染病和慢性疾病死亡率構成動態(tài)變化