生物有很多不一樣的性狀,有些性狀可以很簡當的量化,例如體重或是體長等等可以輕易的測得單一的值,然後可以進行所有母數類型的統計分析。如果這些類型的性狀是研究員有興趣的,那這個研究員真的是很幸運,可以很直接的測得想要的資料(當然也有個前提就是要有足夠的樣本數)。
在生物學(尤其是演化及系統分類學),很多有趣的性狀其實都是沒辦法直接測得可以分析的“值”。例如不同隻鳥有不一樣形狀的鳥喙,有的是尖尖長長的,有得卻很像勾勾。其他又像葉子的形狀可以很不規則,那我們到底要怎樣比較這些差異呢?

Kuhl與Giardina在1982年發表的一篇文章,大大的改變生物學上對形態分析的方法:本來只能用文字表達的個體差異現在可以轉化成數值做統計分析。例如本來你只能說種A百分之90是正三角形百分之10是等腰三角形,種B是矩形跟直角三角形之類的,現在都可以轉換成主成分分析。
R有一個很棒的package叫做Momocs可以很方便地做elliptical Fourier(橢圓傅立葉轉換?)類型的分析(此外Momocs也可以做tangent angle及radii variation Fourier行的分析)。這個package雖然不像geomorph可以直接處理圖檔,但是處理圖檔並不困難,下面就用最容易的powerpoint來介紹怎麼把jpg檔的圖檔裡面我們要的shape變成XY-coordinates給Momocs分析。

首先先打開PPT並畫一個黑色的正圓(這應該很簡單):
ppt_circle
用這個目的是讓之後的每個圖都可以在同一個XY-dimension中。黑色的圓可以當所有形狀的同源中心:大家都有這個一樣的地方,之後做elliptical Fourier分析需要對齊,有一樣的XY象限,又有一樣的point of origin,才能確定我們分析的真的是形狀上的不一樣,而不是因為不同角度造成的不一樣。

畫完元之後就把你的照片貼到PPT上(把你有興趣的地方疊到黑色的圓上面):
horn

然後把這個檔用PPT直接存成jpg檔之後用imageJ打開,然後用process裡面的binary把你的jpg檔變成binary format(黑白檔):
imageJ
然後在toolbar裡面按下這一個仙女棒:
tool_outline_select
你就可以發現你的圖的otline被選起來了(黃色的線)!
選起來之後就把這個檔用imageJ存成XY-coordinates就完畢了,Momocs就可以吃這個檔案了:
outline

在做elliptical Fourier之前一定要做的就是讓所有檔案的point of origin變成一樣的及center the file。Momocs把txt檔(你剛剛存的XY-coordinate)裡面的第一個XY值當成是the point of origin,所以我們需要手動改一下所有的txt檔。還記得所有的檔都有同樣的圓嗎?我們可以在圓上面隨便選一個點當the pont of origin,因為所有的圖都會有那一個相同的點:
poo
你可以用各種不一樣的text file editor來改txt檔,我用wrangler來改我的檔案,讓所有txt檔的第一個XY-coordinate都是696 260:
poo_wrangler


改完txt檔之後就可以用Momocs把所有的XY-coordinates都讀到R裡面去了(我隨便選了四個不同種的長戟,各有2到4個大型雄蟲個體的頭角形狀):
#################
記得要center記得要center記得要center!!
#################
read.txt

檔案讀進去之後下一步就是要決定用多少harmonics(等距離分佈的點)來描述你的形狀!這很重要,用越少的harmonics分析越快,但是形狀跟原本的形狀就越不像,下面用四個例子來看4,8,16,及32個harmonics對不一樣的outlines的描述:
harmonics
用眼睛看起來32個harmonics比其他數量的harmonics對輸入的outlines的描述好很多。
但是除了用眼睛看之外,其實還是可以用統計方法來看,下面我就分享兩個Momocs裡面常用的方法(上圖看如果你在新的outline上面隨機選幾個點,他會與原本的outline相差多遠,下圖就是算harmonic power):
hpow
32個harmonics真的比其他好很多,所以就先用32來玩!(harmonics沒辦法比你輸入的XY-coordinates多就是了,最多就是用你的original XY-coordinates來當harmonics)。

先用eFourier這個function可以把存進去的outlines一起做elliptical Fourier的分析:
eF


得到harmonics的coefficients之後就可以根據這些值來做主成分分析了:
PCA

是不是很方便呢?除此之外還可以看每個PC的描述範圍,看在那個PC上面的不一樣outlines可以差多少:
PC

如果真的想做形質(多變量)分析也可以用Manova之類的分析,或是就用hierarchical clustering來做80年代分類學家會做的nummerical taxonomy:
cluster


現在很多博物館都把館藏標本數位化!這代表著既使我們沒辦法採集到一些樣本,我們還是可以做很多形態演化的分析的!這個連結裡面有一個很有趣的研究,他們就是用很多小提琴的照片(很多是不一樣的館藏經典不同年代的小提琴設計)來分析不同時代設計家演奏員到底是用什麼不一樣的小提琴(小提琴形態的演化)。

博物館館藏數位化是很重要的工作,很多博物館都已經分享的大量的資料。但是除了大家分享資料之外,我們也要想辦法讓這些資料變成研究交流的重點,而不是放在那裡沒人用。Momocs就是一個可以活用大家已經分享的數位資料的package。
arrow
arrow
    全站熱搜
    創作者介紹
    創作者 airbugs 的頭像
    airbugs

    airbugs

    airbugs 發表在 痞客邦 留言(0) 人氣()