2007年10月15日 星期一

漢子的統計筆記(1.2)--變項的概念

Variables (變項、變數、變因)

變項是每一個個體的某一特性。這個特性會隨個體而不同,如性別或年齡。

這裡說的個體可以是個人、團體、組織或國家。我們一般研究當中做的研究假設,就是在說明自變項與應變項之間,我們假設他們應該有一定的關係,而透過研究去證明。

1、 自變項(Independent variables):被認為是「因」(cause)或用來解釋其他變項的變項。
2、 應變項(Dependent variables):被認為是「果」(effect)或是被解釋的變項。

  • 自變項與依變項:這兩者間的關係簡單來講可以用自變項→依變項來表示,當自變項改變,依變項也會著變化。(在實驗研究中前者為實驗變項,後者為結果變項)
  • 間斷變項(Discrete variable ) :是一種只能取出特殊的值,而不能取出任何值的變數,比如我有2個孩子,而不會有人說我有1.5個孩子。

    舉例:選舉的票數、骰子的點數。

  • 連續變項 (Continuous variable):連續變項只這一連續不斷的系列上的任何部分可以加以細分,以得到任何的值,也就是說任何兩值間,都可以得到無限多介於兩者間大小不同的值。

舉例:智商:0, 80, 120, 113, . . .身高:140、178、190…

間斷變項和連續變項影響到統計方法的使用,所以在問卷、量表或是實驗設計上必須先考量。

  • 名義變項(nominal variable):名義變項又稱類別變項(classification variable)是指使用數字來辨認任何事物或類別。例:學號20號、40號,編號9527的警察之類的。
  • 次序變項(ordinal variable):就某一特質多少或大小次序團體中的各份子加以排列的變數,適用『a>b,b>c,a>c』的規則,但是只描述次序,不描述份子與份子之差異的大小量。依此原理,中位數、百分等級都是如此。比如說第一名、第二名等等名次。
  • 等距變項(interval variable):除了可以說出名稱和排出大小次序之外,還可算出差別之大小量。其基本特性是『相等單位』(equal unit),除了要A>B>C,還要B-A=C-B。比如溫度、明暗等等。平均數(mean)、標準差(standard deviation)以及積差相關等統計方法,均適用等距變數。
  • 比率變項(ratio variable):除了可以說出名稱、排出次序、算出差距之外,還可以說某比率與某比率相等的變數。其重要條件是要有絕對零點(absolute zero)亦即所使用的數量需代表從自然原點(natural origin)開始起算的一段距離。比如身高,都必須從0公分或0英吋開始算,溫度就不是。
  • 變項之間的轉換:基本上等距、比率、連續變項要轉成次序變項或是名義變項是比較容易的,只要訂出高低,或是將條件列出來就可以轉換,比如說將某一班的段考成績(連續變項),訂出高分、中分、低分等三組,訂出組距的標準你就可以將這些樣本變成三組了。但是次序變項或名義變項就不能隨意的轉換成連續等距、比率、連續變項,假使真的要轉換就必須以『虛擬變項』來處理,這個我們留在多元迴歸分析的時候在講好了。

整理圖:


沒有留言: