這兩天發現我的blog裡最熱門的文章竟然是無心插柳的那篇資料已經過時的舊文「台灣最受歡迎的百大網站」,瀏覽數超過150人,尤其因為這幾天它在hemidemi那邊變popular書籤之後,那篇在yahoo或googel的排名變前面了,導致居然搜一些色情網站的名字也會排前幾名,所以很多人就這樣連進來了,也為blog增加不少人氣,還真是XD。

不過這篇要講的重點是,那篇真的沒什麼了不起的,只要會使用alexa網站,人人都可以很輕易地整理出這樣一篇東西,以下是一點簡介。


alexa網站(http://www.alexa.com)是alexa公司成立的網站,1996年成立,1999年該公司被亞馬遜公司買下,該網站雖然也提供其他許多的服務,但最被人重視的就是網站訪問量排名的功能,現主要就介紹這個功能。(其他功能我也很少用)

使用這個功能很簡單。最基本的功能,是查詢任何一個網站的排名,即進入網站以後,在上排選擇 traffic rank的功能,然後輸入網站的網址即可,輸入後會進入該網站的資訊頁,一般資訊會提供網站的相關網頁,以及如果有人發表過該網站評論的話也可以點閱,再點入Traffic Details,可以看到它更詳細的數據,包括名次、每天使用人數、每人平均使用頁數、以及使用總頁面數的數字或走勢表,也可以看到該網站的主要子網域,佔了其網站總使用量的百分比。此外也可以運用比較的功能,在圖上比較幾個網站的發展情況。


除了每個網站的資訊頁面之外,另外很有趣好用的就是各種排行榜,點入畫面上方的top500,可以進入根據alexa統計排出的全球500大網站。一開始只會顯示出10大,再按see more就可以了。除了全球排名之外,它還有按照各地區使用者使用、網站使用文字以及主題來作排列的。可以在前述顯示出10大的畫面按country'、language或subject作選擇。其中每個國家(目前只提供70多個網路人數較多的國家)和語言會列出前100名的網站,而按主題分類則視該分類網站數量而定。台灣最受歡迎的一百網站就是根據排國家的列表整理出來的。

那麼,alexa的排名是怎麼樣算出來的呢?首先是資料的取得,alexa的資料是透過一種叫alexa toolbar的工具列(主要可以擋廣告以及顯示網站的排名和相關連結)統計的,網站將所有裝有該toolbar的網路使用者的瀏覽網頁資料回傳之後,再作出統計,所以是屬於一種抽樣統計。

統計出的基本的數字有兩個,一個是一天之內該網頁的總瀏覽頁數佔所有網頁的比例,第二個當天進入該網站的人(ip)佔當天使用網路者的比例。簡單的說就是網頁數和人氣數,不過因為是抽查,所以只是相對而非絕對的數字。alexa的排名,即是根據這兩個數字的幾何平均數(相乘開根號)。alexa的資料頁上會列出單日、一週平均,以及三個月平均的排名,而真正排行榜的排名即是三個月以來每天的數字平均起來得到的,所以短期的使用量變動,通常不會對排名影響太多。

此外,說明一下alexa如何定義「網站」alexa是以網址後半的相同與否作為同一網站的標示,例如yahoo.com和tw.yahoo.com是屬於同一個網站,但yahoo.co.jp就是屬於另一個網站,這種畫分方式也會對網站排名造成影響(例如各地區的google就被劃歸為不同的網站,所以只以英文版排名全球第3)

大致了解了使用方法和計算方法之後,很重要的問題就是,既然是抽查,那這個數字可靠嗎?首先問題是,到底有多少人裝alexatoolbar?該網站自稱全球有1000萬人以上裝了,但有人從小站的使用量變化估算,認為它單日的統計樣本大概在數十萬左右,(也就是有裝該bar且該日上網的人數)相較於全球近十億的上網人口來說,還真是九牛一毛。

不過相較於量,抽樣最重要的還是樣本是否合理分布。alexa網站也自承因為某些分布的因素,其排名的幾項缺點:由於alexatoolbar只能裝在IE上(此外火狐也可以透過某種工具設定讓本身資料上傳到alexa,但使用的比例應會比IE要低一些 ),所以如果是某個特定瀏覽器使用者常上的網站,其排名就會被嚴重低估,此外,由於alexa是亞馬遜的相關網站,所以亞馬遜的排名很可能被高估(alexa網享本身則沒列入排名)。此外,也提到排名在較後面(例如全球100000名以後)的網站,因為得到的訪問樣本數太少,所以可能少數人的使用就會影響排名,因此其排名僅能供大概參考。最後,早期有些人會用程式來作弊提昇自己網站的排名,聽說alexa已經用許多方式加以管理甚至懲處這類網站(例如永不收錄)

但alexa沒有提到的一點,就是地區的差異,alexatoolbar的普及程度,在世界各地有所差別,我自己根據alexa相關網站http://www.alexaradar.com/中提供的alexa資料中各國網民資料所佔比例,與各國網路人口的數字作比較,發現二者的相對比例氏所差距,可見某些地區裝alexatoolbar的比例高,有些地區低。例如,華人世界兩岸三地的人使用alexatoolbar的比例很高(可能是華人對這種排名特別在意),中東、美國和拉丁美洲比例也都偏高,也就是說這些地區人常上的網站會在全球排名被高估,歐洲(除了波蘭等少數東歐國家之外)、日、韓、南亞、東南亞、加拿大、大洋洲國家則裝的比例較低,因此這些地區的網站可能被低估。

儘管alexa排名有以上種種可能的問題,但它還是目前最常被使用,被認為較具參考性的網站使用量排名。事實上同類較著名的網站如http://news.netcraft.com/http://scripts.ranking.com/,其採用的統計方式也與alexa大同小異,但其抽樣的全球普及程度遠不及alexa,這造成其網站排名變成幾乎就是「美國人常用網站排名」而已。





















arrow
arrow
    全站熱搜

    ffaarr 發表在 痞客邦 留言(1) 人氣()