『資料處理過濾增益集』範例12

延續範例11再思考1個問題:如要將分離出來的資料表(一)中各縣市鄉鎮區各年齡的人口統計資料再按照縣市分離出來成為單獨工作表,如工作表(二)應該如何做?
資料表(一)
image

工作表(二)

image

可以利用『正規比對資料過濾增益集』中的『文字檔資料擷取』功能來將資料分割成單一工作表或工作簿,這個功能原始設計的目的,原為處理學校老舊dos版本的電腦讀卡系統所讀出的測驗成績檔,將它依照班級分割出來提供教學分析使用,或轉換至學校新的成績系統。
這個功能可以利用讀取『分析資料樣版』檔案作為參數,進行文字檔資料篩選與分割,也可以『手動輸入分析樣版參數』。
各參數代表的含義:
『資料比對起點』:表示比對資料列所含的資料內容,如果與『資料比對起點』的樣版符合即開始進行篩選比對,如果保留空白代表從檔案開使比對。
『資料比對終點』:表示比對資料列所含的資料內容,如果與『資料比對終點』的樣版符合即結束篩選比對,如果保留空白代表比對至檔案結尾。
『包含比對終點』:若勾選此參數則符合『資料比對終點』樣版的資料列也會進行篩選與分割,如果未勾選,則符合『資料比對終點』樣版的資料列將不進行篩選與分割。
『資料列比對樣版』:此參數是比對出要將進行分割比對的資料列,符合規則才會進行分割比對,保留空白代表全部比對。
『分隔字串樣版』:此參數是比對出要將進行分割比對的資料列中符合分隔規則的字串。
『替代分隔字串』:此參數是將符合『分隔字串樣版』比對的字串用此參數取代,以便進行分割。
『分割後比對樣版』:此參數是比對分割後的資料,符合即寫入工作表。

image

解答:我們要將資料表(一)各縣市鄉鎮區各年齡的人口統計資中臺北縣的資料分離出來至新的工作表,我們先將資料表(一)另存為csv格式的檔案(csv格式是以逗點隔開的文字檔),作為資料檔的來源。我們觀察資料的內容臺北縣的最後1個鄉鎮是烏來鄉,我們可以設定參數為
『資料比對起點』:臺北縣
『資料比對終點』:烏來鄉
『包含比對終點』:勾選此參數
『資料列比對樣版』:保留空白
『分隔字串樣版』: ,
『替代分隔字串』:,
『分割後比對樣版』:保留空白

參考操作影片

問題二:如果要將資料表中直轄市與縣的人口統計資料分離出來,要如何做?

解答:

『資料比對起點』:保留空白
『資料比對終點』:保留空白
『包含比對終點』:不勾選此參數
『資料列比對樣版』:縣|臺北市|高雄市
『分隔字串樣版』: ,
『替代分隔字串』:,
『分割後比對樣版』:保留空白

參考操作影片

問題三:如果要批次將資料表中,各個直轄市、縣、省轄市等大行政區域所管轄之鄉、鎮、市、區的人口統計資料,單獨分離成工作表,要如何做?解答:『文字檔資料擷取』功能提供批次處理的功能,先建立『分析資料樣版』檔案,再選取匯入『分析資料樣版』檔案,批次進行分割。
如何建立『分析資料樣版』檔案?
1.可以將手動輸入的參數儲存為『分析資料樣版』檔案,再選取此檔做為『分析資料樣版』檔案進行分割,請參考操作影片
2.可以使用『批次產生樣版資料檔』功能建立『分析資料樣版』檔案,再選取所建立的檔案(可以多重選取),做為『分析資料樣版』檔案進行分割,請參考操作影片

『資料處理過濾增益集』範例11

這個範例是要將以下資料表(一)中各縣市鄉鎮區各年齡人口資料的統計分離出來成為資料表(二)。

資料表(一)

區域別

性別

合計

0

1

2

3

4

 

1092942

192887

207968

218499

227319

246269

 

571699

100859

108383

114629

119049

128779

 

521243

92028

99585

103870

108270

117490

臺閩地區

1088533

192019

207073

217590

226452

245399

 

569382

100407

107922

114151

118588

128314

 

519151

91612

99151

103439

107864

117085

臺灣地區

908589

160736

172697

181816

188850

204490

 

475494

84172

89865

95361

99101

106995

 

433095

76564

82832

86455

89749

97495

臺灣省 

169308

30315

31976

33813

35163

38041

 

88739

15869

16581

17797

18562

19930

 

80569

14446

15395

16016

16601

18111

臺北縣 

23561

4321

4490

4669

4884

5197

 

12268

2220

2318

2452

2574

2704

 

11293

2101

2172

2217

2310

2493

板橋市 

16289

2882

3009

3286

3389

3723

 

8562

1536

1540

1736

1770

1980

 

7727

1346

1469

1550

1619

1743

三重市 

8423

1480

1566

1672

1722

1983

 

資料表(二)

區域別

性別

合計

0

1

2

3

4

臺閩地區

1088533

192019

207073

217590

226452

245399

臺灣地區

908589

160736

172697

181816

188850

204490

臺灣省 

169308

30315

31976

33813

35163

38041

臺北縣 

23561

4321

4490

4669

4884

5197

板橋市 

16289

2882

3009

3286

3389

3723

三重市 

8423

1480

1566

1672

1722

1983

永和市 

17550

3143

3387

3602

3584

3834

中和市 

18579

3311

3537

3677

3850

4204

新莊市 

11594

2147

2193

2311

2356

2587

新店市 

10547

1882

1996

2100

2168

2401

土城市 

9314

1678

1741

1800

1980

2115

蘆洲市 

7816

1395

1536

1523

1638

1724

汐止市 

8018

1372

1513

1627

1685

1821

樹林市 

4384

813

830

849

894

998

鶯歌鎮 

4857

830

894

1004

1009

1120

三峽鎮 

6136

1119

1090

1254

1255

1418

此無法用EXCEL排序功能取得,因為"『區域別』欄位的資料是依照同縣市區域排列,例如臺北縣以下接著是臺北縣內的各個鄉鎮市資料,如果用排序方式將破壞鄉鎮市區在各縣市的順序。我們可以利用『資料處理過濾增益集』中『工作表資料篩選』的功能進行篩選,再複製至新資料表。請考操步驟作影片。 讀者可以嘗試將資料表中男性資料分離出來。

『資料處理過濾增益集』範例10

這個範例我用以前為某部會所做的一個專案,其中某一部分資料的處理作業拿來演示。當時手邊有的資料是全國各戶政事務所的地址資料。資料部分內容如下所示:

臺北縣永和市戶政事務所

234

台北縣永和市竹林路二○○之一號

臺北縣新莊市戶政事務所

242

台北縣新莊市中正路一五○號二樓

臺北縣新店市戶政事務所

231

台北縣新店市行政街二號二樓

臺北縣三峽鎮戶政事務所

237

台北縣三峽鎮中正路一段五○號

臺北縣鶯歌鎮戶政事務所

239

台北縣鶯歌鎮中正一路一九五之一號

臺北縣五股鄉戶政事務所

248

台北縣五股鄉中興路四段七○號

臺北縣泰山鄉戶政事務所

243

台北縣泰山鄉泰林路二段二一二號

臺北縣八里鄉戶政事務所

249

台北縣八里鄉訊塘埔四十二號

臺北縣瑞芳鎮戶政事務所

224

台北縣瑞芳鎮中正路三○號

臺北縣淡水鎮戶政事務所

251

台北縣淡水鎮中正路二二七號

我們要從其中取得『縣市名稱』資料與『鄉鎮市區名稱』資料。我們示範二個作法:
第一個方法我們可以利用EXCEL中『資料剖析』的功能將資料依固定長度分割,再將幾個例外的資料個別處理,如操作步驟影所示,影片中的EXCEL版本為2003,2007的操作大同小異。
第二個方法我們可以利用『正規比對資料過濾增益集』的『工作表資料內容處理』的取代功能將資料中所要的部分保留,不要的部分用空白取代,這裏我們介紹1個取代的規則,在取代原則前加入-,代表將取代不符合取代規則的資料,把符合規則的部分保留。例如我們要把 "臺北縣永和市戶政事務所”這個字串中的“臺北縣”保留其他部分去除,取代規則我們可以寫成以下規則:-^(W{2}縣)        

^(W{2}縣)這個比對規則是代表比對開頭是某某縣的字串,例如"臺北縣永和市戶政事務所”這個字串就符合,若作為取代規則會取代“臺北縣”這三個字,若是我們希望保留“臺北縣”將其他字串取代掉,則要在取代規則前加入-,這樣會將不符合開頭是“臺北縣”的其他字串內容取代掉,包括空字串。如操作步驟影片所示,影片中的EXCEL版本為2003,2007的操作大同小異,取代規則為-(^W{2}縣)|(^W{2}市) 因為縣市名稱包括市所以要加入|(^W{2}市)

讀者可試試看若要取得"臺北縣永和市戶政事務所”中"永和市”這個字串取代規則應該如何寫?

Ans:-(W{2}鄉|W{2}市|W{2}鎮|W{2}區)

『資料處理過濾增益集』範例7

利用『資料處理過濾增益集』來進行既有資料的加工非常方便,可以把已經建立好的資料反覆加工應用在其他工作上,例如我們要辦理一場老師間私下的聚會,發出要請函時在稱謂上,私下老師通常以名字稱呼彼此,以表示親切而非連名帶姓一起稱呼,我們示範一個建立稱謂資料的範例,請參考步驟影片

『資料處理過濾增益集』範例4

承範例3再舉一例,隨著新學年度到來,我們要把導師班升級,例如211班導師要改成311班導師,我們可以這樣做;利用『正規比對資料過濾增益集』中『工作表資料內容處理』的功能,將名單中的人員的資料擷取出來進行部分變更,如何擷取資料進行部分變更請參考步驟影片

『資料處理過濾增益集』應用範例3

新年度職務異動,如果人事已經給予我們電子資料當然依照"範例1"直接將資料表進行比對擷取,萬一人事給的是書面資料,我們可以做的是將大部分會變動的職務用『資料處理過濾增益集』來處理,例如去年畢業班導師今年大部分會轉為專任老師,如何快速處理變更?我們學校有高中部與國中部,所以會有兩個畢業年級,我們可以這樣做;利用『資料處理過濾增益集』中『工作表資料內容處理』的功能,將名單中的人員的資料擷取出來進行變更,如何擷取資料變更請參考步驟影片