一言以蔽之:新竹市東區關新里五連霸全臺最富里。
財政部「綜合所得稅申報初步核定統計專冊」已於六月廿八日公佈,扣除納稅單位小於10戶的,那麼臺灣前二十名(按照中位數排名)的鄉鎮村里如下表格。
縣市鄉鎮村里 | 今年名次 | 去年名次 | 納稅單位(戶) | PR75第三分位數(萬元) | 平均數(萬元) | PR50中位數(萬元) | PR25第一分位數(萬元) | 變異係數 |
---|---|---|---|---|---|---|---|---|
新竹市東區關新里 | 1 | 1 | 2061 | 598.0 | 461.1 | 354.3 | 164.1 | 11.5% |
新竹市東區龍山里 | 2 | 2 | 4632 | 453.8 | 328.1 | 249.1 | 97.1 | 10.3% |
新竹縣竹北市東平里 | 3 | 3 | 6144 | 455.7 | 336.0 | 240.6 | 97.7 | 10.8% |
新竹市東區埔頂里 | 4 | 6 | 3483 | 388.1 | 283.1 | 214.0 | 80.8 | 9.9% |
新竹縣竹北市鹿場里 | 5 | 4 | 5111 | 433.7 | 333.0 | 202.7 | 76.9 | 15.1% |
新竹縣竹北市中興里 | 6 | 5 | 4020 | 457.1 | 347.5 | 197.9 | 68.6 | 18.3% |
新竹縣竹北市隘口里 | 7 | 7 | 1687 | 380.8 | 288.2 | 190.3 | 69.9 | 21.5% |
新竹市東區東勢里 | 8 | 8 | 1780 | 336.7 | 257.1 | 183.1 | 67.8 | 13.5% |
新竹縣竹北市北興里 | 9 | 9 | 3319 | 349.3 | 260.4 | 179.8 | 80.2 | 13.0% |
臺南市善化區蓮潭里 | 10 | 11 | 2162 | 290.2 | 212.9 | 166.5 | 76.7 | 9.7% |
新竹縣竹北市十興里 | 11 | 10 | 3173 | 324.6 | 245.9 | 165.9 | 66.7 | 11.8% |
新竹縣竹北市中崙里 | 12 | 12 | 3069 | 333.6 | 244.8 | 152.0 | 56.5 | 12.5% |
新竹縣竹北市東興里 | 13 | 13 | 3885 | 294.0 | 219.2 | 144.8 | 61.7 | 11.9% |
新竹市東區豐功里 | 14 | 16 | 1772 | 361.2 | 274.3 | 141.0 | 45.9 | 14.1% |
新竹市東區東園里 | 15 | 15 | 2520 | 290.3 | 212.8 | 135.2 | 52.1 | 11.4% |
新竹縣竹北市斗崙里 | 16 | 14 | 3416 | 309.7 | 241.3 | 132.6 | 52.6 | 14.8% |
新竹縣竹北市興安里 | 17 | 17 | 1616 | 284.5 | 219.7 | 121.7 | 44.3 | 13.4% |
新竹市東區光明里 | 18 | 18 | 1225 | 288.0 | 235.8 | 120.4 | 43.2 | 15.5% |
臺北市內湖區寶湖里 | 19 | 19 | 3850 | 266.8 | 242.8 | 114.3 | 44.4 | 61.8% |
新竹縣寶山鄉大崎村 | 20 | – | 795 | 258.6 | 221.7 | 112.0 | 37.1 | 14.5% |
新竹市東區關新里已連續五年蟬聯最富里的頭銜,其綜合所得,不管是平均數、第三分位數、中位數、第一分位數,都是居於全臺灣冠軍。
最厲害的是連PR25的第一分位數,也就是關新里連『最窮的四分之一族群』,年收入都有164.1萬元(如果這樣也叫窮的話),超過第二名的新竹縣竹北市東平里97.7萬元,足足有66.4萬元之多。
除了第九名以外,前十名的富有里都是位於新竹科學園區週邊。而臺南市善化區蓮潭里,拜臺南科學園區所賜,近年來一直都是臺南最富有的里,同時也是全臺南生育率最高的里,今年首次進入前十名的榜單。
至於第十一名~第二十名的富有里,第十九名在內湖科技園區週邊,其他也都是竹科相關。
另外一個後起之秀是第二十名的新竹縣寶山鄉大崎村,顯然是因為台積電全球研發中心以及2奈米先進製程晶圓廠房都座落在這裡,就會有許多台積電的員工搬遷至此。
如果考慮變異係數(標準差/中位數),除了臺北市內湖區寶湖里以外,其他十九個村里的變異係數都很低,表示園區附近村里內的財富是很平均的,不是被特別有錢的幾戶拉高的。其中,新竹市東區又比新竹縣竹北市平均,這也跟竹北的豪宅比較多有關係。
備註:2023年全臺灣最富有的鄉鎮村里請參考連結。
最後,教大家如何取得這些資料。
這些都是公開資訊,以本文為例子,原始資料在111年度綜合所得稅申報初步核定統計專冊,抓取HTML的原始文字檔案,解壓縮後,裡面有111_165-A.html、111_165-B.html……111_165-Z.html,這就是各縣市鄉鎮村里統計分析表。
接著使用程式分析一下html文字檔案,就可以得到上面的這些表格了。下面這段小程式是用C語言來實現的,將編譯後的執行檔與111_165-*.html放在同一個目錄,雙擊執行檔就可以列印出以TAB分隔的文字檔,再將文字複製貼上Excel,即可計算。
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
static void *str_copy(char *dst, char *str)
{
char *ptr;
ptr = dst;
while (*str)
{
if (*str != ' ') /* ignore ' ' */
{
*ptr = *str;
ptr++;
}
str++;
}
*ptr = '\0';
}
static void parse_html(char *fpath)
{
FILE *fp;
char *ptr1, *ptr2;
char buf[1024];
char city[1024], area[1024];
if (!(fp = fopen(fpath, "r")))
{
printf("%s does not exist.\n", fpath);
return;
}
while (fgets(buf, sizeof(buf), fp))
{
if (ptr1 = strstr(buf, "縣市別:"))
{
ptr1 += 12;
if (ptr2 = strchr(ptr1, '<'))
*ptr2 = '\0';
str_copy(city, ptr1);
}
else if (strstr(buf, "納稅單位") || strstr(buf, "綜合所得總額") ||
strstr(buf, "平均數") || strstr(buf, "中位數") ||
strstr(buf, "第一分位數") || strstr(buf, "第三分位數") ||
strstr(buf, "標準差") || strstr(buf, "變異係數") || strstr(buf, "註:本統計"))
{
continue;
}
else if (ptr1 = strstr(buf, "font-size: 14px;\">"))
{
ptr1 += 18;
if (ptr2 = strchr(ptr1, '<'))
*ptr2 = '\0';
if (!strstr(buf, "border-bottom-style"))
{
strcpy(area, ptr1);
}
else
{
if (*ptr1 >= '0' && *ptr1 <= '9')
printf("\t%s", ptr1);
else
printf("\n%s%s%s", city, area, ptr1);
}
}
}
printf("\n");
fclose(fp);
}
int main()
{
int ch;
char fpath[128];
printf("縣市鄉鎮村里\t納稅單位\t綜合所得總額\t平均數\t中位數"
"\t第一分位數\t第三分位數\t標準差\t變異係數");
for (ch = 'A'; ch <= 'Z'; ch++)
{
if (ch == 'L' || ch == 'R' || ch == 'S' || ch == 'Y') /* 台中縣/台南縣/高雄縣/陽明山 */
continue;
sprintf(fpath, "111_165-%c.html", ch);
parse_html(fpath);
}
return 0;
}