2018年12月23日 星期日

柯文哲變白所以吸到藍營票?

有個神祕的說法,柯文哲「白綠分手」後,在政治上的光譜越來越趨中,或是另一種說法:「超越藍綠」,而獲得一些淺藍民眾的支持。

其實上篇分析就已經顯示,台北市國民黨的支持率幾乎維持四年前的水平,絲毫沒有改變;這篇我更加把2018選舉中的柯文哲與姚文智分開做估計,結果仍然顯示,2014年到2018年間,柯文哲幾乎沒有再從藍營手中搶到什麼票。

當然,柯文哲不出來選,這26%的人,必然會有不少回到國民黨手上。但我強調的是:這四年間柯文哲似乎沒有爭取到更多藍營的支持。

柯文哲「白化」後,爭取到淺藍選民的支持,這種說法可能很有問題。


[1] 不過我們也不確定「如果白綠繼續合作」的反事實造成效果如何,說不定這樣2018比起2014會流失一些原本的支持者。我們只能從已發生的事實,說他沒有爭取到更多藍營支持者。



2018年12月12日 星期三

續:票投國民黨還是不投民進黨-跨層次推論的方法


接續回應熱烈的前文票投國民黨還是不投民進黨?我運用跨層次推論(生態推論 Ecological Inference)的方法,應證了前文所講的:國民黨在高雄選勝主因並非倒戈,而是將上一次不投票的人,動員出來投給韓國瑜;以及今年不少民進黨支持者未出來投票。


一般而言,整體資料不能推論個體層次的行為,會有「區位謬誤」的問題。例如一個經典的例子:移民越多的區域,識字率也越高。原因不是移民識字率比較高,而是移民居住在都市,而都市識字率較高。

但是「跨層次推論」,可以克服這個問題,我主要使用Gary King的方法簡單來說是在一些前提假設[1]下,運用電腦模擬的方式,創造出數十萬套虛擬的個體資料,然後挑選出當中相似機率較高的出來進行估計。我透過R的"eiPack"套件進行分析,每個縣市大約模擬五十萬種個體資料可能的分配,挑選出當中合適的一千套樣本計算平均。


2018年12月11日 星期二

票投國民黨還是不投民進黨?

民進黨大敗意味著「綠轉藍」的發生了嗎?還是只是藍綠支持者是否出來投票的各自消長?前些日子葉高華老師的一文提醒:「得票率可能誤導人......要談選舉變遷,支持度是比得票率更可靠的指標。其分母是選舉人數而不是有效票數,反映某黨能夠從所有選民當中獲取選票的能力。」


得票率 = 得票數 / 有效票數
支持率 = 得票數 / 有選舉權人數

如果單單看得票率,民進黨在台灣所有的選區幾乎是大幅流失,而國民黨大幅增加。但是如果看支持率就很有意思了,其實各縣市藍綠板塊的消長模式並不相同。像是鄭文燦的支持率實際上比陳其邁還要低,可是卻大敗國民黨。



接下來的圖表,是以村里為單位[1],分析國民兩黨的支持率[2]在2014至2018年間的變化。X軸代表民進黨支持率的衰退,越大代表出來投給民進黨的人變少了;Y軸則代表國民黨支持率的提升,越大代表出來投給國民黨的人變多了。


並且,縣市大部分的村里(點點)若是坐落於紅色區域,則代表相較2014的選舉,此次選舉藍綠板塊變化的主要是藍營支持者增加;若大部分坐落於橘色區域,則代表主要是綠營支持者減少。


  • 高雄與台中,兩個支持率變化不同的縣市


以兩個民進黨同樣慘敗的台中與高雄為例,高雄藍綠板塊的變化,主要動力來自於國民黨支持率的增加;而臺中市的變化主要來自於民進黨支持率的衰退。當然高雄民進黨的支持率有衰退、台中國民黨的支持率也有增加,但力道小於主要動力。

看來「韓流」最大的效果是將上一次不投票的人,動員出來投給國民黨,這也是高雄市投票率硬生生比其他縣市高了10%的原因。



  • 桃園大贏?還是藍營不投票?

比較有趣的是桃園,這次是鄭文燦大勝嗎?恐怕只是國民黨未成功動員支持者出來投票,然後民進黨有穩住支持者,沒有流失支持率。在桃園,民進黨整體的支持率是31.8%,但號稱慘敗的高雄支持率是32.5%,其實比桃園還來得高。


另一個民進黨同樣選贏的基隆市,民進黨一樣有穩住支持者,然後國民黨支持率「回血」的不夠多,所以最後還是贏了。若是像其他縣市一樣,民進黨支持率大幅減少,大概也會輸掉。



  • 台南國民黨越來越有機會?

至於過去一向號稱「綠到發黑」的臺南市,這次國民兩黨的得票率接近,但看國民兩黨的支持率變化,只是民進黨支持率流失,但流失的選票完全沒讓國民黨的支持率增加,而且這個現象在台南各里似乎相當一致。


  • 各縣市的情形

以下是各縣市國民、兩黨支持率的變化,各縣市國民兩黨支持率的變化方式並不相同。有些縣市民進黨支持者減少與國民黨支持者增加確實高度相關,但更多縣市卻並非如此。另外,有幾點注意:

1.民進黨14或18年在部分縣市未提名,因此未列入分析
2.有部分村里在4年間合併或重劃,無法連結的村里將替除,但數量不多(台南稍多)。
3.台北市18年我仍將柯文哲與姚文智合併計算




  • 整體資料對於「倒戈」推論的限制

文章開頭提到,究竟「綠轉藍」倒戈的現象是否有發生?基本上戈的情形無法從整體資料中確定,還是需要民調的個體資料確認。以上的作法是退一步透過間接猜測,假設倒在某個縣市中是普遍發生,那各村里民進黨支持率變化與國民黨支持率變化,理應該高度相關,不過結果是很多縣市的相關係數相當低。

而且這個猜測有很強的假設,如果高雄市確實有大量倒
,但是各區狀況不一樣,那繪製出來的圖可能也是低度相關;而上圖國民、兩黨支持率變化高度相關的南投與彰化等地區,事實上也無法肯定是「倒」發生,另一種可能是個村里民進黨支持者不投票的比例等於國民黨支持者出來投票的比例。

簡言之,此篇文章繪製村里藍綠支持率變化,最合宜的詮釋是了解各縣市是「投給國民黨變多」?還是「投給民進黨變少」?或是「國、民兩黨支持率的消長是否高度相關?」至於在個體層次上,倒有沒有發生,只能依靠相關性做比較合理的猜測。

不過,真的試圖想從個體資料推論,可以運用「跨層次推論」(生態推論 Ecological Inference)的技術,這個方法也是我寫完這篇文章,受老師指點才學到。這部份的分析我寫在新的文章以及此文文末。


[1] 為了呈現整體趨勢,我刪除分布於2個IQR外的極端值
[2] 得票數/有選舉權人數


※後記:跨層次推論的方法

跨層次推論的方式,簡單來說是在一些前提假設下,運用電腦模擬的方式,創造出數十萬套虛擬的個體資料,然後挑選出當中相似機率較高的出來進行估計。

我以高雄、台中兩個地方為例,更多說明請見最新一篇文章

下面這個表是運用跨層次推論出「個體層次在兩次選舉中的投票行為」。DPP14代表2014年投給民進黨,KMT18代表2018年投給國民黨,non代表未投票與投給其他候選人。交叉表的部份例如[DPP14 , DPP18]=31.5,代表2014年投給民進黨、且2018年也投給民進黨的人,佔所有選舉人的31.5%。

從高雄來看,綠營倒戈藍營僅佔7.2%,真正藍綠得票消長是靠動員出未投票的人出來投韓國瑜這群人,[non14 , KMT18]讓韓國瑜支持率足足多了12.6%;再加上今年不投票的14年綠營支持者,讓陳其邁少了5.8%。這種「出門投國民黨、窩在家不投民進黨」的效果,一來一往讓雙方支持率差了17.4%,換算成今年的選舉得票率,那是足足差了25%!

至於台中,也與前文散佈圖所推測的一致,台中藍綠得票消長的主要原因在於有7.7%民進黨2014年的支持者不願意出來投票。不過倒戈的也佔了5.6%。

跨層次推論的方法,在做估計時有相當強烈的假設,此方法目前仍有爭議。我認為最終的推論,仍要回到個體資料上最為保險。

2018年11月26日 星期一

民進黨高雄市各里得票與變化的空間分析

2014-18選票流失比例
本文製作了高雄市2018與2014年市長選舉的地圖。首先是2018年各里的得票。
再來則是2014-2018年之間民進黨各里所流失的選票百分比。高雄所有村里相比2014年,民進黨得票率都是衰減的,在5%~40%之間,平均值為22.2%,大於平均值以藍色畫出,小於平均值以綠色畫出。
以上兩張圖片的PDF檔案我掛在雲端上,是向量型態可以無限放大,歡迎自行下載,觀察自己家裡屬於高衰退區還是低衰退區。

不過需要注意,不要被地圖的顏色面積誤導,面積越大的里,往往人越少,舊高雄縣有些里比舊高雄市一個區還要大,不應用面積大小進行詮釋。

整體來說,民進黨各里得票衰退,具有非常強的空間相關性,某里的得票嚴重衰退,周圍各里大致上也嚴重衰退;某里得票衰退輕微,周圍各里也不致於衰退太嚴重。

我以一個里與周圍兩層的里做空間相關運算,空間自相關(Global Moran's I)=0.35。

下面這張則是高度/低度衰退的聚集熱區,以及變化孤島。



2018年11月19日 星期一

淺談社會變遷的職業編碼與社經地位分數

許多學術問卷調查中,最複雜的就是職業編碼,社會變遷調查的職業編碼採用ISCO系統更高達450多種職業分類,不少研究者看到就直接放棄使用。

此篇文章為大家介紹社會變遷調查中職業編碼的演變、架構、與如何轉換為可以分析的分數。這篇文章,如有參考本篇文章進行學術書寫,請務必附上引用。

2018年11月14日 星期三

中山大學碩士論文頁數

爬了一些資料,就隨手做出來啦。
看來碩士論文社會所頁數沒有特別多,甚至跟一些工科差不多,不知道其他學校是否相似。
延伸閱讀:台灣博士論文的頁數統計

2018年10月25日 星期四

結婚會讓男性的工資提高嗎?



「男性婚姻薪資溢酬」(Male Marital Wage Premium)究竟存不存在,一直是社會學研究的重要課題,但這個問題非常難回答,因為婚姻本身有很強的選擇性效果:薪水高的人容易結婚。

今天分享一篇我很喜歡的論文,發表在社會學頂尖期刊ASR,提出最新關於「婚姻溢酬」的發現。

2018年9月30日 星期日

國小100m內不能有娃娃機會發生什麼事?


前幾天有則新聞「夾娃娃機退出校園100公尺外!新北修法要管了」,其實不只娃娃機,像是網咖台北市也有規定必須距離200公尺。看到新聞後,我滿想知道如果國小方圓100公尺不能有娃娃機店,會造成什麼影響,畢竟國小密度滿高的。

上圖畫出了雙北所有國小,同心圓深綠色部分是方圓100公尺,淺綠色是方圓500公尺。很明顯的100公尺幾乎不會有什麼影響;不過如果是500公尺,基本上市中心不能開任何一家娃娃機店了。

下圖為雙北市全圖。

2018年9月22日 星期六

滾雪球抽樣能夠估計母體?


「你這滾雪球抽樣,可能總同一群人,難以了解更異質的群體……」「滾雪球如果一開始找到錯的人,一路滾下去就會出問題……」質性研究在針對社會邊緣人士、次團體進行訪談時,因為研究對象難以接觸,經常會以滾雪球的方式徵詢受訪者。許多人認為會是滾雪球面臨的問題,滾出來的人經常差異不大。

但事實上,統計學家、社會網絡學家,早已對滾雪球做過不少研究(學術上通常稱之RDS, Respondent-Driven Sampling)。只要符合一些假定,不論一開始找誰滾雪球,在數波滾雪球後,樣本分配會趨近於平衡,甚至可以反應母體分配。

2018年9月4日 星期二

KMT 19‰的連署死亡率?平均87歲就有可能

我根據2017年台灣的人口死亡率,推估發現國民黨公投連署19‰(千分之十九)的死亡率其實是非常合理的,只要連署的平均年齡大約87歲即可。


國民黨三個連署「反空污、反核食、反電廠」的提案審理大約都在七月初時通過,且在八月底送件,中間經歷兩個月的時間,當然可能發生簽署連署書後,連署人死亡的狀況。不過根據報導,國民黨的連署死亡率高達19‰,讓許多網友質疑造假。[1]

2018年8月24日 星期五

tag抽獎,能讓資訊擴散嗎

封面故事:tag網絡

FB常出現tag n位朋友,即可參加抽獎的訊息,但這真的能有助於訊息傳播嗎?效果又有多大呢?


2018年8月7日 星期二

PTT政治人物熱門榜


我將4~7月PTT八卦版上所有的文章全部掃下來,進行簡單分析,看看哪位政治人物相關的文章討論度最高,以及最容易被噓。

2018年6月24日 星期日

政黨認同、統獨立場、台灣人認同


1960年《The American Voter》出版確立密西根學派在政治學至今的地位,密西根學派認為,政黨認同(partisanship)是一種長期的政治承諾,不僅在投票行為上有強大的解釋力,一切的政治行為幾乎都與partisanship牽扯在一起。你的黨說什麼,你就支持什麼。

我將以下這幾題相減,製作成政黨認同、統獨立場、台灣人認同這幾個指標。

請問你怎麼看國民黨?非常認同(10)還是非常不認同(0)
請問你怎麼看民進黨?非常認同(10)還是非常不認同(0)
有人主張臺灣應該儘快宣布獨立﹔也有人認為兩岸應該儘快統一﹔還有人的看法是在於這兩種看法之間。請問你比較接近哪裡?儘快獨立(10)還是儘快統一(0) 請您用0至10分來表示你自認為是台灣人的程度,請問你會選幾分?完全是台灣人(10)、完全不是台灣人(0)
請您用0至10分來表示你自認為是中國人的程度,請問你會選幾分?完全是中國人(10)、完全不是中國人(0)


繪製出來的散佈圖如上,相關係數都在0.44左右,這在個體資料是相當高的關聯性。

「台灣人認同」中有群台灣人10分/中國人0分的人,政黨分數卻是0分(獨立),可能的原因:1.台灣人認同逐漸成為社會共識。2.「台灣人」對不同的人來說語境不同,強政黨認同的人可能涉及民族主義的意義,無政黨認同可能只是代表一種在地的稱呼(如:你是高雄人)。


[1]本資料來源為小熊問卷評來,屬於網路問卷,不具有樣本代表性。不過在年齡、教育、性別都有一定程度的變異,並非那種丟在FB上隨意填寫的網路問卷。

2018年6月15日 星期五

中山大學12%的非異性戀

三年前(2015)中山大學基本調查曾發表一篇「出櫃或入櫃?」,調查發現中山大學有12.4%的非異性戀,遠高於台灣社會變遷調查4.6%的結果。經過兩年,本文一次比較三個調查,推估中山學生的性傾向分配比例。


(本文同步發表於中山大學基本調查

除了2018中山大學基本調查再度調查中山學生的性傾向,另外在2016年筆者曾執行過「中山大學性別友善宿舍意見調查」,同樣是具有樣本代表性的隨機抽樣調查,也有詢問性傾向的題目。

三個調查的結果如下,整體調查的結果相當一致,異性戀約88%、同性戀約2%、雙性戀約7%、不確定約2%。有趣的是雙性戀多數似乎是女性、同性戀多數似乎是男性。
 


2018年6月8日 星期五

交互作用模型的估計,能信嗎?新增Q/A問答

封面照片
今天分享一篇頂級期刊的論文"How Much Should We Trust Estimates from Multiplicative Interaction Models? Simple Tools to Improve Empirical Practice."這篇文章即將被 Political Analysis刊出。

該文複製近年來22篇政治學頂級期刊的論文,發現裡面46個交互作用模型,有七成無法通過作者的設計的模型檢驗。這篇文章絕對足以對社會科學的量化研究投下震撼彈。

2018年5月4日 星期五

你同意「施行民主政體」嗎?中國有96%的人同意

政治學怎麼測量民眾的民主態度?許多研究很愛使用跨國大型調查World Vaule Survey的一道題目:

下面我們將列舉幾種不同的政治體制,如果在我們的國家用這些政治體制,請問您認為是很 好、好、壞,還是很壞?

◎施行民主政治體制?

結果大家怎麼回答?

2018年4月30日 星期一

小世界網絡與Watts的小手段

有個有趣的實驗大家一定聽過,就是一個人在美國西岸,寄信給美國東岸的陌生人,平均只需要經過六步,就可以送達。這個「六度分隔實驗」背後的概念就是「小世界」。


小世界的概念簡單來說,就是世界上的人們各自群聚,大家分裂成東一塊、西一塊的,但是隨意的兩個人之間,卻能透過很短的步數連結起來。以送信的實驗為例子,美國的每個郡裡面的人民各自群聚,有很多的連結;而郡跟其他郡之間的人很少有連結,但是美國的任意兩個人,卻還是能透過六步的距離連起來。

2018年4月12日 星期四

欣欣向榮的民主?再探台灣的政治態度

封面故事:欣欣向榮的民主?

前幾天菜市場政治學根據台灣民主基金會的調查,發表了一篇〈七成台灣人願意為台灣而戰、支持民主、反對統一:台灣年輕世代的政治態度[1]媒體也熱烈報導討論此調查結果。而文中有張統計圖如下,其中20-39的年輕世代,近年來對於民主制度的同意度高的嚇人,有85%認為這是個最好的制度。



圖片取自:菜市場政治學



  • 與其他研究報告的落差


我眉頭一皺,覺得這跟之前的認知落差實在太大,近年不少研究報告皆指出[2],不僅台灣、連世界的民主態度都呈現衰退現象。其中,在2014太陽花學運之際,葉高華老師在巷仔口社會學發表一篇〈搖搖欲墜的臺灣民主?從民主態度調查談起[3],就有類似的分析,結果如下列圖表。這篇文章有兩個小結:1.台灣的民主態度這10年來正在衰退。2.且越年輕世代,反而覺得民主並非最好制度。

2018年4月4日 星期三

誰跑紅帖?

封面故事:你選的是西瓜還是政治家?(改自民進黨官網)

長期以來民意代表最投入的工作是跑紅白帖,似乎已是全民共識。要在殯儀館遇到民意代表(不管是民代、議員、立委),說不定比在議會或服務處還要容易;而筆者還真的曾經在殯儀館,隨隨便便就遇到了立委,還上來握手節哀致意。

不過這種紅白帖文化,選民也漸漸開始反思。事實上在2008年的TEDS調查中,選民理想的立委,認為其最重要的工作是「服務選民」不過才3.4%。


取自菜市場政治學:「安力」玩哪招?

2018年3月28日 星期三

素每,同志真的會讓天氣異常嗎?

封面故事:同志遊行完後下大雨?請見內文。


筆者的身為素每的粉絲之一,對於名言「人若不照天理,天就不照甲子,現在都幾月了還這麼熱」當然是朗朗上口。

不過,學過地球科學的人應該都知道,同志與天氣二者毫無關連,同志當然不可能影響天氣。不過秉持著實證科學精神,我們還是拿出經驗數據來檢驗吧!

素每名言 (取自民視綜合頻道


2018年3月23日 星期五

基督教特別反同 可能不過是近十年的事

封面故事:基督教反對同婚機率變遷

基督教自古以就按照天理,特別反同或反同婚嗎?至少在台灣,我認為「反同/反同婚神學」是在近十幾年,才逐漸被完整建構出的知識體系。這不是說基督教或聖經本身不反同,而是反同在台灣的基督教教義中,要成為一種「知識」,是近十幾年才有的事情。


會這樣說,一來有數筆相當可靠的實證數據指出這樣的現象;二來是如果對照基督教界關於同性戀討論的出版物,會發現反同論述幾乎是在這一二十年才出現;三來從教會界的行動來看,不過是近五年才開始產生反同的集體行動。而二、三在2016社會學年會的「宗教右派的祕境與除魅」論壇中,曾有討論過。那麼我就來提供 一 的實證數據。



按照天理的基督教「家長」 (取自民視綜合頻道


如果基督教的「反同/婚神學」是在近一二十年才成為知識,那麼在一二十年前,基督教徒與非基督教徒對於同婚、同性戀的態度應該相異無幾。正好,台灣社會變遷基本調查[1]1991、2012、2015都有關於同姓婚姻的題目,用詞與選項雖稍有不同,不過應不致於影響分析,後面會做更詳細的題目校度說明。


  • 同性戀的人應有彼此結婚的權利(1991):非常同意、同意、無意見、不同意、非常不同意
  • 同性戀者也應該享有結婚的權利(2012):非常同意、同意、無所謂同不同意、不同意、非常不同意
  • 同性戀的人應有彼此結婚的權利(2015):非常同意、同意、不同意、非常不同意、無意見(訪員不主動揭露此選項)


由於2012與2015時間過近,我直接視為同一個時間點。另外為了處理選項不一致的問題,我把選項合併為「不同意」與「同意+無意見」的二元變項。這樣就能使用邏輯迴歸分析,探討「反同婚」相對於「非反同婚(含無意見)」的勝算。廢話不多說,直接來看下面跑出來的模型吧。

看到迴歸大怪獸不要怕,下面有視覺化圖表。

性別、世代、教育程度、城鄉、婚姻狀態這些變項我都有做控制,不過礙於版面以及本次探討的主題,就不特別秀出來了。在模型(1)中,基督教反同的勝算相對無宗教顯著較高;但是當模型(2)加入宗教與調查時間的交互作用後,基督教的顯著性消失。這意味著在1991年的時候,基督教與其他宗教對於同姓婚姻的態度,並沒有明顯的差異;而這個差異要來到2012/2015年才出現。

而模型(3)與模型(4)是用另外一種宗教編碼方法,直接分為基督教與非基督教,結果並不改變。



看不懂迴歸報表沒關係,看下面視覺化的圖表。x軸是1995年與2012/2015年兩個調查時間點,y軸是反對同婚的機率(有控制其他條件為相同情況)。塗色部分則是95%的信賴區間。當Probability超過0.5意味著比較傾向反同婚。

這兩張圖示應該夠清楚說明何謂「基督教特別反同,不過是近十幾年的事」了吧。

不同時間各宗教反同婚機率

不同時間基督教反同婚機率
機率計算方式:控制變數以平均值帶入,最後將勝算轉換為機率。


如果我們把模型改成「同意同婚」相對於「非同意同婚(含無意見)」,結果仍然一樣,基督教到了2012/2015年對同婚的態度,才與其他宗教有所差異。這個模型確保了「無意見」的編碼方式,並不會影響到結論。





此外,還有更多的實證數據都指向相似的結果,中研院社會所鄭雁馨老師在2016年的一篇期刊"Changing Attitudes toward Homosexuality in Taiwan, 1995-2012",就已經發現類似的現象,不過她沒有對此多做討論。

她使用的資料並非社會變遷調查資料而是「世界價值研究調查」,問題則是「你覺得同性戀是正當的嗎?(1-10)」。不同的資料、不同的問法,結果依然相似,讓我們能夠更相信這個這個推測。

如上圖,比較Model 3 與Model 5,同樣要到2012年,基督教與其他宗教對同性戀的態度才出現差異。


最後提醒一下,所謂的「基督教到近十幾年,對同性戀的態度才與其他宗教產生差異」,這樣敘述可能更為精準:「十幾年來社會對同性戀的態度日漸開放,唯基督教始終保持二十年前的態度」。而使這個態度維持的原因,我猜測跟近十幾年來反同知識的建構相當有關。



是說這篇文章有點難,可能不能上廁所看,不然會澇賽(làu-sái)或便秘。


註解 [1] 台灣社會變遷基本調查是每年中研院社會所執行的大型調查計畫,其資料品質、抽樣方法、訪員訓練、訪問方式都是台灣數一數二好的調查。


2018年3月13日 星期二

夜市麻將賓果中獎率高嗎?

每次去夜市,都會看到「麻將賓果」這樣遊戲。這個遊戲規則通常是100元可以玩6局,每局抽15張麻將牌,在6*6的賓果上對獎,連成一線即中獎;當沒有連成一線,但有湊滿5張牌時即「聽牌」,可以再抽3張。如果中獎,可以得到娃娃一隻,或是其他獎品。

夜市麻將(圖片來源 CC授權


那麼這個遊戲到底中獎律高不高呢?這當然可以用機率算,在不考慮聽牌規則的機率算法如下:
那有聽牌規則下的中獎機率呢?好複雜我也不想多想了,這種問題,就交給電腦處理吧!電腦不就是用來處理複雜、龐大的計算嗎。我用R寫了一個麻將賓果模擬程序,請它跑了100萬次,結果如下圖。

在有聽牌機制的情況下,連成一線的機率為 10.493%,連成二線的機率為 0.288%,連成三線的機率為 0.0015%。所以100元玩6局的得獎率為1-(1-10.7825)^6,大概是近五成。你覺得這樣的機率高不高呢?

另外,如果沒有聽牌機制,抽15張就連成一條線的機率大約只有3.56%,很低呢!


不過既然都做模擬了,我們就來看一下各種條件下,獲勝的機率是多少吧。黑色的線代表花100元獲獎的機率,紅色代表單一局獲勝的機率。

其實從上面的圖可以看出,夜市麻將「100元玩6局,每局抽15張牌,聽牌再抽3張」讓玩家獲勝的機率拿捏的剛剛好,是很有數學根據的!


這邊也釋出我寫的模擬程式以及code,如果你有裝R,可以直接點開 夜市麻將模擬器.Rdata,就會載入function了。

output<- mahjong(nmahjong = 15, draw = 3, games = 6, simula = 100000)

nmahjong是每局抽的牌數,draw是聽牌再抽的數量,games是100元玩的局數,simula是模擬次數。上面的數字都是可以隨意更改的,也可以直接mahjong()就會按照預設值跑出來。R的計算速度其實很慢,不建議模擬超過百萬次。

2018年3月10日 星期六

選情告急?

許多人漸漸覺得,網路選戰越來越重要,鄉民們更是時不時爆料某某政黨在養「婉君」試圖帶輿論風向。那麼,之前2016的立委與總統大選的網路局勢為何?

我透過facebook aip進行爬蟲,蒐集73個區域立委泛藍與泛綠候選人的FB粉專資料。


下圖是泛綠陣營(包含民進黨禮讓選區)選前一個月跟得票率的關係。我發現這個相關性後,快笑死也快到。



等等,怎麼發越多文得票率越低?難道是發太多文讓選民覺得很煩,不投你了?當然不是,是因為選情告急,趕快發文拉拉票啦。這是我快笑死的原因。

嚇到的原因,則是若把連江、金門兩個特殊情況的選區扣除,可以發現民進黨候選人的「FB貼文數」是一個對「得票率」非常有解釋力變數。可見,民進黨候選人的網路行為,確實反應了選舉局勢。


那麼國民黨呢?



嗯~看來國民黨的網路行為與選舉結果,真的是毫無相關呢。大家說國民黨不善於網路選戰,看來一點都沒錯。其實不只如此,我在爬蟲時,就發現國民黨有粉專的立委候選人、粉專上的發文量、按讚、分享數都遠遠不如泛綠陣營,有些候選人甚至選輸後就馬上把粉專關掉了。加加油好嗎?

開站:臺灣博士論文頁數統計

「上廁所看統計」今天起正式開站。

未來我時不時會發文,分享關於描述社會百態的統計圖表、網絡、地圖。或是偶爾談談一些統計觀念,不過我也不敢自稱在談論「統計學」,畢竟自己並非統計專業背景,只是對於透過統計描述社會現象很感興趣。

「上廁所看統計」的第一張統計圖,對於大多數人來說可能相當無聊;不過對於有在學術研究圈子的人,應該是滿有趣的。這是一張台灣各領域博士論文頁數盒狀圖。

這張圖是模仿國外網站所製作的。我用網路爬蟲把臺灣博碩士論文網100-105 (2011 Aug - 2016 Jun) 學年出版的博士論文相關資訊通通抓下來。而學術領域的分類方法,我沒有按照教育部的學門/學類分類,因為這個分類實在太糟糕了。我除了參考國外分法重新進行分類,也加入不少自己的主觀判斷,結果如表。所以,這不一定是最好的,歡迎大家提供更棒的分類方式。



其實臺灣的統計結果我有點小意外,第一名竟然是法律(國外是歷史,另外奇怪的是國外那張圖沒有「法律」領域),而歷史才排名第四,文學、人類學都比它來的多。至於頁數最少的幾名,一點都不意外,都是理工、數學相關的科系;不過財管博論頁數也挺少的,它可能是文組裡面頁數最少的呢。

另外,會選這張圖作為開站第一則貼文還有另一個原因,就是他是我近期最滿意的一個作品XD。