+ All Categories
Home > Documents > ทฤษฎีที่เกี่ยวข้องกับการด...

ทฤษฎีที่เกี่ยวข้องกับการด...

Date post: 23-Sep-2020
Category:
Upload: others
View: 5 times
Download: 0 times
Share this document with a friend
22
บทที 2 ทฤษฎีที ่เกี ่ยวข้องกับการดาเนินงาน โครงงานนี ้จะเน ้นเรื่องการประมวลผลภาพดิจิตอลสาหรับใช้ในการตรวจจับโมเดล ส่วนท้ายรถยนต์ที่นิยมใช้ในประเทศไทยโดยการนาอัลกอริทึม Scale Invariant Feature Transform ( SIFT) ทฤษฎีและหลักการต่าง ๆที่จะกล่าวต่อไปนี ้มาประยุกต์ใช ้ และทฤษฎีของการ ประมวลผลภาพดิจิตอลที่เกี่ยวข้องรวมถึงทฤษฎีที่นามาใช้กับระบบตรวจจับโมเดลส่วนท้าย รถยนต์แบบอัตโนมัติที่จะพัฒนาขึ ้นในโครงงานนี ้และสามารถนาไปพัฒนาต่อในอนาคต 2.1 ภาพและความหมายของพิกเซล 2.1.1 พิกเซล (Pixel) คือ ความเข้มแสงที่รวมกันทาให้เกิดเป็นภาพ ภาพหนึ่ง ๆจะ ประกอบด้วยพิกเซลมากมาย ซึ่งภาพแต่ละภาพที่สร้างขึ ้นจะมีความความหนาแน่นของพิกเซล เหล่านี ้แตกต่างออกไป ความหนาแน่นนี ้เป็นตัวบอกถึงความละเอียด (Resolution) ของภาพซึ่งมี หน่อวเป็น ppi (Pixel Per Inch) คือจานวนพิกเซลต่อนิ ้ว ซึ่งโดยทั่วไปถือว่าภาพที่มีความละเอียด สูงหรือคุณภาพดีจะมีความละเอียด 300 x 300 ppi ขึ้นไป ค่า ppi ยิ่งสูงขึ้น ภาพก็จะมีความ ละเอียดและคมชัดมากขึ ้น รูปที2.1 ตาแหน่งของพิกเซล
Transcript
Page 1: ทฤษฎีที่เกี่ยวข้องกับการด าเนินงานresearch-system.siam.edu/images/thesistee/AUTOMATIC... · ทฤษฎีที่เกี่ยวข้องกับการด

บทท 2

ทฤษฎทเกยวของกบการด าเนนงาน โครงงานนจะเนนเรองการประมวลผลภาพดจตอลส าหรบใชในการตรวจจบโมเดลสวนทายรถยนตท นยมใชในประเทศไทยโดยการน าอลกอรทม Scale Invariant Feature Transform (SIFT) ทฤษฎและหลกการตาง ๆทจะกลาวตอไปนมาประยกตใช และทฤษฎของการประมวลผลภาพดจตอลทเกยวของรวมถงทฤษฎทน ามาใชกบระบบต รวจจบโมเดลสวนทายรถยนตแบบอตโนมตทจะพฒนาขนในโครงงานนและสามารถน าไปพฒนาตอในอนาคต

2.1 ภาพและความหมายของพกเซล

2.1.1 พกเซล (Pixel) คอ ความเขมแสงทรวมกนท าใหเกดเปนภาพ ภาพหนง ๆจะประกอบดวยพกเซลมากมาย ซงภาพแตละภาพทสรางขนจะมความความหนาแนนของพกเซลเหลานแตกตางออกไป ความหนาแนนนเปนตวบอกถงความละเอยด (Resolution) ของภาพซง มหนอวเปน ppi (Pixel Per Inch) คอจ านวนพกเซลตอนว ซงโดยทวไปถอวาภาพทมความละเอยดสงหรอคณภาพดจะมความละเอยด 300 x 300 ppi ขนไป คา ppi ยง สงขน ภาพกจะมความละเอยดและคมชดมากขน

รปท 2.1 ต าแหนงของพกเซล

Page 2: ทฤษฎีที่เกี่ยวข้องกับการด าเนินงานresearch-system.siam.edu/images/thesistee/AUTOMATIC... · ทฤษฎีที่เกี่ยวข้องกับการด

5

N = จ านวนพกเซลทมากทสดในแกน Y

M = จ านวนพกเซลทมากทสดในแกน X

2.2 การประมาณผลภาพเชงตวเลข (Digital Image Processing)

2.2.1 การแทนภาพดวยภาพแบบดจตอลภาพแบบดจตอล (Digital Image) เปนภาพทถกแปลงมาจากอนาลอก ใหอยในรปของตวเลขโดยภาพอนาลอกถกบางเปนพนท ส เหล ยมเลก ๆ ทเรยกวาพกเซล ในแตละพกเซลจะถกระบต าแหนงดวยคโคออตเนต x,y และคาระด บความเขมของแสงของพกเซลนน ๆ โดยเราสามารถแปลงภาพเปนแบบดจตอลโดยมข นตอนและวธการดงน

เมอเราน าสญญาณอนาลอกทตอง การป ระมวลผลผานสวนท เรยกวาดจไทเซอ ร (Digitizer) ซงจะท าหนาทในการแปลงสญญาณอนาลอกใหเปนสญญาณดจตอล จากนนท าการควอนไตซ (Quantizing) เพอแปลงคาความเขมของแสงใหเปนตวเลข ฟงกชนของภาพ f(x,y) จะถกท าใหเ ปนสญญาณไมตอเน องทง ระนาบของภาพซง เรยกวา การสมภาพ (Image Sampling) ของฟงกชนท ได เรยกวา การควอนไตซ ระด บความเขมของแสง ( Greasy Level Quantization ) กจะไดขอมลทเปนดจตอลดงภาพท 2.2

รปท 2.2 การท า Sampling และ Quantization

Page 3: ทฤษฎีที่เกี่ยวข้องกับการด าเนินงานresearch-system.siam.edu/images/thesistee/AUTOMATIC... · ทฤษฎีที่เกี่ยวข้องกับการด

6

2.2.2 ลกษณะการจดเกบมลภาพแบบดจตอล

โดยทวไปแลวภาพจะมความเขมต งแต 2 ระดบขนไป แตทนยมใชกนมาก คอ คาระด บความเขมของพกเซลทเทากบ 256 ระดบ ซงจะท าใหคาของพกเซลอยในชวง (0-255) โดยใชเนอทในการเกบขอมลขนาด 1 ไบตหรอ 8 บต ส าหรบขอมล 1 พกเซล (256) ในกรณทตองการภาพทมความเขมสงอาจจะตองการจ านวนบตส าหรบการเกบขอมลมากกวา 8 บต คออาจจะเปน 16หรอ 24 บตโดยจะแยกความแตกตางของภาพแตละประเภทใหเหนอยางชดเจนไดดงน

2.2.2.1 ภาพ 2 ระดบ คอ มพกเซลสขาวกบสด าเทานน โดยแตละพกเซลจะมขนาดของขอมลเทากบ 1 บต

2.2.2.2 ภาพ 16 ระดบ คอ ในแตละพกเซลจะมขนาดของขอมล 8 บต ซงสามารถแสดงภาพไดความเขมถง 256 ระดบ

2.2.2.3 ภาพ 256 ระดบ คอ ในแตละพกเซลจะมขนาดของขอมล 8 บต ซงท าใหสามารถแสดงภาพไดความเขมถง 256 ระดบ

2.2.2.4 ภาพทรคลเลอร (True Color) คอในแตละพกเซลจะมขนาดของขอมล 24 บตท าใหสามารถแสดงภาพออกมาไดเฉพาะภาพสเทานน ไมสามารถแสงดเปนภาพขาวด าได

โดยทงไปวธการประมวลผลภาพเชงตวเลขทท าใหคอมพวเตอรสามารถรวตถในภาพไดนนแบงออกไดเปนสองระดบดวยกนคอ การประมาณผลภาพในระดบต า (Low-Level Image) และการประมวลผลภาพในระดบสง (High-Level Image Processing) การประมาณผลภาพในระดบต าจะเปนการประมวลผลเชงตวเลขเกอบทงหมด เพอหาตวแปรตาง ๆ มาอธบายขอมลภาพ โดยมจดประสงคทจะน าตวแปรเหลานนไปใชในการประมวลผลภาพระดบสงตอไปโดยทวไปแลวการประมวลผลภาพระดบต าจะประกอบดวย การประมวลผลภาพกอน (Preprocessing) เชน การก าจดสญญาณรบกวน หรอการท าใหภาพคอมชดการหาของภาพเปนตน

การประมวลผลระดบสงเปนการน าผลลพธ หรอสญลกษณทไดจากการประมวลผลภาพระดบต ามาตความหรอประมวลเพอใหคอมพวเตอรสามารถรจกและเขาใจภาพได ส าหรบความแตกตางของการประมวลผลภาพ ทง 2 ประเภทนนคอ การประมวลผลภาพระดบต าจะใชคาความสวางของจดภาพ (พกเซล) สวนการประมาภาพระดบสงนนขอมลภาพทน ามาประมวลผลจะถกแสดงในรปสญลกษณ ซงสญลกษณเหลานจะแสดถงสงตาง ๆ ทอยในภาพเชน ขนาดของวตถรปราง และความสมพนธกนระหวางวตถภาพ

Page 4: ทฤษฎีที่เกี่ยวข้องกับการด าเนินงานresearch-system.siam.edu/images/thesistee/AUTOMATIC... · ทฤษฎีที่เกี่ยวข้องกับการด

7

2.3 การสรางภาพไบนาร

การส ราง ภาพ ไบนาร ส ามารถได โดยใ ชเทคน คการท าเทรช โฮล (Thresholding Technique) โดยพจารณาวาพกเซลสขาวหรอสด า จะกระท าโดยการเปรยบเทยบระหวางพกเซลของภาพเรมตนกบคาคงทหนงเรยกกวา คาเทรชโฮล (Threshold Value ) เทคนคนใ ชกนมากในกรณทขอมลภาพมลกษณะทตางกนระหวางวตถ (Object) และพนหลง (Background) โดยคาของพกเซลของภาพใด ๆ ทมคามากกวาหรอเทากบคาเทรชโฮลจะถกเปลยนเปน 0 (จดด า) และ พกเซลของภาพทมนอยมากกวาหรอเทากบคาเทรชโฮลจะถกเปลยนเปน 1 (จดขาว) เปนตน

ในการสรางภาพไบนารโดยใชเทคนคเทรชโฮลเพอใหไดผลลพธทเหมาะสมและคมชด สงทส าคญทสดคอ คาเทรชโอล เนองจากถาเลอกคาเทรชโฮลทไมเหมาะสม (คาเทรชโฮลทมคานอยเกนไปหรอมากเกนไป) ภาพทไดอาจจะสวางนอยเกดไป หรอสวางมากเกนไป หรอภาพทไดมสงรบกวน(Noise) เกดขน อนเปนผลท าใหภาพทไดไมสวยงามเทาทควรด งนนปญหาของการสรางภาพไบนาร ซง ม วธ ค านวณหาคา เทรชโฮลโดยก าหนดคาล วงห นา (Pre-assigned Threshold Value) การหาคาเทรชโฮลจากคากลาง (Mid-Range Threshold Value) ซงแตละวธอธบายไดดงน

2.3.1 การหาคาเทรชโฮลโดยก าหนดคาลวงหนาเปนการก าหนดคาเทรชโฮลโดยการก าหนดเองจากผใช ซงการก าหนดนจะขนอยกบประสบการณของผใชคนนน ๆ โดยการเลอกคาคงทคาหนง ซงเรยกวา คาเทรชโฮล โดยคาท เลอกมานจะเปนคาทอยระหวางคาต าและคาสงสดของระดบความเขมแสงของภาพ เชนภาพอนพทมระดบความเขมแสง 256 ระด บ จะมคาไดต งแต 0-255 เมอเลอกคาเทรชโฮลไดแลวสามารถสรางภาพไบนารได

2.3.2 การหาคาเทรชโฮลจากคากลาง เปนการหาเทรชโฮลทแตกตางจาการหาคาเทรชโฮลวธแรก ส าหรบวธนจะเปนการค านวณหาคาเทรชโฮลโดยอตโนมตโดยไมตองใหผใชเปนผก าหนดโดยการหาคาเทรชโฮลนใชวธทางสถตในเรองการหาคากลางหรอคาเฉ ลย (Mean) คาเทรชโฮลทค านวณไดจากคากงกลางทอยระหวางคาระด บความเขมสงสด (Maximum Level) และระดบความเขมต าสด (Minimum Level) ของภาพ เมอการค านวณคาเทรชโฮลไดแลวกสามารถสรางภาพไบนารไดโดยน าคาเทรชโฮลทไดมาใช

Page 5: ทฤษฎีที่เกี่ยวข้องกับการด าเนินงานresearch-system.siam.edu/images/thesistee/AUTOMATIC... · ทฤษฎีที่เกี่ยวข้องกับการด

8

2.4 แบบจ าลองส (Color Model)

แบบจ าลองส (Color Model) เปนสงทใชอางองถงสตาง ๆ ส าหรบคอมพวเตอรแลวเราจะไมใชแบบจ าลองทเปน Analytical Model เหมอนกบทใชในทางวทยาศาสตร ซงใชวธการวดซงอยในรปของพลงงานชวงของสเปคตรม (Spectrum) แตจะเปน Empirical Model ทไดรบสมพนธของคาทใชอางองกบสใด ๆ จากการทดลองทเปนการศกษาแบบ Psychophysical ทมการรบรของมนษยเขามาเกยวของ

แบบจ าล อง สมหลายแบบด วยกน เชน แบบจ าลองส RGB แบบจ าลอง ส CMY แบบจ าลองส CMYK แบบจ าลองส HSV แบบจ าลองส HIS แบบจ าลองส HLS แบบจ าลองส YIQ และแบบจ าลองส YUV แบบจ าลอง YcbCR เปนตน

2.4.1 แบบจ าลองส RGB (RGB Color Model) เปนแบบจ าลองท เฉพาะเจาะจงกบจอภาพคอมพวเตอร เนองจาก RGB Model ไดท าการสรางสตาง ๆ ขนโดยการใชแหลงก าเนดแสดงจ านวนสามส ไดแก สแดง (Red) สเขยว (Green) และสน าเงน (Blue) ท เกดจากการเรองแสงทมคณสมบตทแตกตางกนตามล าดบ ซงแสงทงสามสจะไมเทากนในแตและอปกรณ นอกเสยจากวามคณสมบตของสารเรองแสงและการต งคาจอภาพ และสภาพแวดลอมทจอภาพคอมพวเตอรเหมอนกนทกประการ ซงโดยปกตแลวจะมคาทแตกตางกนออกไปตามภาพท 2.3

รปท 2.3 แบบจ าลองส RGB

Page 6: ทฤษฎีที่เกี่ยวข้องกับการด าเนินงานresearch-system.siam.edu/images/thesistee/AUTOMATIC... · ทฤษฎีที่เกี่ยวข้องกับการด

9

จ าลองส RGB ประกอบดวยขอมลจ านวนสามสวนคอ คา Intensity ของสทงสามซงไดแกสแดง สเขยว และสน าเงน

2.4.2 แบบจ าลองส HSV (HSV Color Model) เปนแบบจ าลองสท ถกสรางขนเพอเปนทางเลอกโดยแบบจ าลองส HSV แสดงในภาพท 2.4 จะใหความหมายทดกวาเมอกลาวถง สตาง ๆ ในเชงศลปะ เชน เมอพดถงสเหลองในทางศลปะจะมความแตกตางกน เมอพจารณาสเหลองออน สเหลองแก หรอสน าตาลวามความแตกตางกนอยางไร จะพบวาทกส คอส เหลองนนเอง ทมระดบความเขมหรอมความอมตวทแตกตางกน ดงนนสในแบบจ าลอง ส HSV จงใหความรสกทเขาใจไดมากกวาส าหรบมนษยซงจ าลองส HSV ประกอบดวยสามสวนคอ

H หมายถง Hue หรอสทมคาทแตกตางออกไปตามความถของแสง เชน แดง เหลอง เขยว น าเงน หรอ มวง เปนตน

S หมายถง Saturation หรอความอมตวของ Hue นน ๆ เชน สแดง และสชมพคอ สแดงเพยงแตสชมพมความอมตวนอยกวาภาพท 2.5 แบบจ าลองส HSVV หมายถง Value หรอคาความสวางของส โดยทคา Value ต าสดหมายถง สด า ไมวาจะม Hue หรอ Saturation เทาใด และคา Value สงสดหมายถง สขาว ซงเปนสทสวางทสดของ Hue และ Saturation นน ๆ เชน Hue ใด ๆ มคา Saturation มคาเทากบ 0 เมอ Value สงทสดคอสเหลองและ Value ต าสดคอสด า

รปท 2.4 แบบจ าลองส HSV

Page 7: ทฤษฎีที่เกี่ยวข้องกับการด าเนินงานresearch-system.siam.edu/images/thesistee/AUTOMATIC... · ทฤษฎีที่เกี่ยวข้องกับการด

10

2.5 การแยกลกษณะเฉพาะของภาพ (Image Feature Extraction)

การแยกลกษณะเฉพาะของภาพเปนการแยกหรอสกดเอาขอมลทส าค ญของภาพออกมาซงลกษณะเฉพาะของภาพเปนคณสมบตทสามารถหาไดโดยใชข นตอนวธการประมวลผลภาพ(Image Processing) โดยทลกษณะเฉพาะพนฐานของภาพประกอบดวย 3 สวนคอส รปรางและพนผว

- ส (Color) เปนลกษณะเฉพาะของภาพทมบทบาทส าคญในระบบคนคนภาพเชนฮสโตแกรมสซงเปนลกษณะเฉพาะของสทถกน ามาใชบอยๆเนองจากสเปนสงทสามารถมองเหนไดงายและเปนสงแรกทสามารถสงเกตเหนไดจากการมองภาพนอกจากนสยงสามารถใชในการแยกแยะกลมของภาพออกตามเนอหาไดเปนอยางดเชนสฟาของน าทะเลสแดงของดอกไมส เขยวของตนไมเปนตน

- รปราง (Shape) เปนลกษณะเฉพาะของภาพทใชอธบายถงรปรางและลกษณะรวมถงขนาดของวตถภายในภาพซงท าใหสามารถแยกวตถออกจากพนหลงหรอแยกแยะระหวางวตถทมรปรางแตกตางกนออกจากกนได

- พนผว (Texture) เปนลกษณะเฉพาะทใชอธบายความหยาบความละเอยดหรอความซบซอนของวตถภายในภาพซงแตละภาพอาจจะประกอบดวยวตถทมลกษณะพนผวทแตกตางกนออกไปการวเคราะหพนผวจะชวยใหสามารถแยกแยะความแตกตางของวตถไดด ยงขนการคนคนภาพทใชพนผวเปนลกษณะเฉพาะของภาพสวนใหญจะถกน าไปใชในการคนหาภาพจากกลมภาพพนผวเชนชดภาพพนผวของหนชดภาพพนผวของใบไมเปนตน

2.6 การสรางดชนภาพ (Image Indexing)

การสรางดชนภาพมดวยกนหลากหลายวธซงในทนขอยกตวอยางวธการนยมและไดการยอมรบมา 4 วธ คอ

2.6.1 ฮสโตแกรมส

ฮสโตแกรมสเปนกราฟแสดงความถหรอจ านวนจดภาพทระด บคาสแตละคาโดยแกนนอนแทนระดบคาสตางๆ สวนแกนตงแทนจ านวนจดภาพทระดบคาสนนๆเปนลกษณะเฉพาะของ

Page 8: ทฤษฎีที่เกี่ยวข้องกับการด าเนินงานresearch-system.siam.edu/images/thesistee/AUTOMATIC... · ทฤษฎีที่เกี่ยวข้องกับการด

11

ภาพในลกษณะของการวดการแจกแจงของสในภาพซงสามารถพจารณาไดจากภาพตวอยางท 2-6 และ 2-7

ส าหรบภาพส RGB ขนาด 24 บตตอจดภาพแตละ Channel คอ แดง เขยวและน าเงน นนจะมคาความสวาง 8 บตหรอ 256 ระด บโดยมคาต งแต 0-255 ดงนนจดภาพแตละจดจงสามารถแสดงสไดมากถง 16.7 ลานส

รปท 2.5 ตวอยางภาพและฮสโตแกรมของภาพทม 256 กลมส

รปท 2.6 ตวอยางภาพและฮสโตแกรมของภาพทม 32 กลมส

Page 9: ทฤษฎีที่เกี่ยวข้องกับการด าเนินงานresearch-system.siam.edu/images/thesistee/AUTOMATIC... · ทฤษฎีที่เกี่ยวข้องกับการด

12

ในการค านวณคาฮสโตแกรมสภาพแตละภาพจะถกควอนไทซสภายในภาพเพอลดมตของเวกเตอรและลดความซบซอนในการค านวณลงโดยการแบงกลมสออกเปน m ถงส (Bins) ซงสวนใหญนยมใช 32, 64 หรอ 256 ถงสเนองจากการแยกแยะความแตกตางของระด บคาสของสายตามนษยมความละเอยดไมมากนกก าหนดใหภาพ I มขนาดn1× n2จดภาพและ HCiแทนจ านวนจดภาพทมส ci ของภาพ I ดงนนสามารถค านวณฮสโตแกรมสไดดงสมการท 2-1

โดยท hci(I )คอฮสโตแกรมของส ci ของภาพ I M คอจ านวนสภายในภาพหลงการควอนไทซส n1 คอความกวางของภาพ n2 คอความยาวของภาพ

การหารดวย n1× n2 หรอจ านวนจดภาพทงหมดภายในภาพมวตถประสงคเพอท าใหคาฮสโตแกรมสเปนบรรทดฐานและเพอใหสามารถน าฮสโตแกรมสของภาพซงมขนาดแตกตางกนมาเปรยบเทยบกนได

ดงนนจะไดเวกเตอรแทนฮสโตแกรมสของภาพ I ดงสมการท 2-2

ฮสโตแกรมสเปนลกษณะเฉพาะทางสของภาพทนยมน ามาใชในระบบการคนคนภาพสวนใหญเนองจากสามารถค านวณไดงายและรวดเรวแตมขอเสยคอมเฉพาะขอมลเกยวกบการกระจายของสภายในภาพเทานนไมมขอมลเชงต าแหนง (Spatial Information)

2.6.2 Color Coherence Vector (CCV)

การก าหนดการเชอมตดกนของส (Color Coherence) ในลกษณะทเปนระด บซงจดภาพของสนนๆ เปนสมาชกของบรเวณขนาดใหญทมสเหมอนกนเรยกบรเวณส าคญน วาบรเวณทเชอมตดกน (Coherent Regions) มความส าคญในการแสดงลกษณะเฉพาะของภาพตวอยางเชน ภาพ 2 ภาพดงแสดงในรปท 2.7 มคาฮสโตแกรมของสเหมอนกนทงๆ ทภาพทงสองมลกษณะท

(2-1)

(2-2)

Page 10: ทฤษฎีที่เกี่ยวข้องกับการด าเนินงานresearch-system.siam.edu/images/thesistee/AUTOMATIC... · ทฤษฎีที่เกี่ยวข้องกับการด

13

แตกตางกนจะเหนวามสแดงปรากฏอยทง 2 ภาพในปรมาณทใกล เคยงกนภาพทางดานซายมจดภาพทเปนสแดง (จากดอกไม) กระจายอยอยางกวางๆ แตในขณะทภาพทางดานขวามจดภาพทเปนสแดง (จากเสอของนกกอลฟ) รวมกลมอยดวยกนจากปญหาดงกลาว Pass และ Zabih จงไดคดคนลกษณะเฉพาะของภาพรปแบบใหมขนมาคอ Color Coherence Vector หรอ CCV

รปท 2.7 ตวอยางภาพทมฮสโตแกรมเหมอนกน

CCV คอฮสโตแกรมสทมการปรบปรงโดยการเพมเตมขอมลเชงต าแหนงเขามาหลกการของ CCV กคอการแยกกลมจดภาพออกเปน 2 กลมคอจดภาพทเชอมตดกน (Coherent Pixel)และจดภาพทไมเชอมตดกน (Incoherent Pixel) โดยจดภาพใดๆ จะเปนจดภาพทเชอมตดกนกตอเมอองคประกอบทเชอมตดกน(Connected Component) ของจดภาพนนมคามากกวาคาคงท

คาหนง ( ) ทไดก าหนดไวซงในงานวจยของ Pass และ Zabih ก าหนดใหมคาโดยประมาณเทากบ 1% ของจ านวนจดภาพทงหมดภายในภาพสวนจดภาพทเหล อกจะเปนจดภาพทไมเชอมตดกน CCV เปนการน าเสนอการแยกกลมส าหรบแตละสในภาพเพอก าจดจดภาพทไมไดเปนองคประกอบส าคญของภาพทงไปโดยท CCV สามารถแยกจดภาพทเชอมตดกนออกจากจดภาพทไมเชอมตดกนและปองกนการจบคทผดพลาดซงสงนเปนลกษณะเดนทฮสโตแกรมสไมสามารถท าได

CCV ของภาพใดๆคอฮสโตแกรมสของจดภาพในกลมจดภาพทเชอมตดกนของภาพนนก าหนดให H ccv (I) คอเวกเตอรขนาด m มตแทน CCV ของภาพ I ซงค านวณไดจากสมการท 2-3

(2-3)

Page 11: ทฤษฎีที่เกี่ยวข้องกับการด าเนินงานresearch-system.siam.edu/images/thesistee/AUTOMATIC... · ทฤษฎีที่เกี่ยวข้องกับการด

14

ขอดของ CCV เมอเปรยบเทยบกบฮสโตแกรมสคอมประสทธภาพในการคนคนภาพมากกวาเนองจากมการก าจดจดภาพทไมไดเปนองคประกอบส าค ญของภาพทงไปแตจะใชเวลาในการประมวลผลมากกวาฮสโตแกรมส

2.7 การจบค (Matching)

กระบวนการจบคภาพทเหมอนกน (Matching) เปนเหมอนการสอสารกนระหวางภาพ และขนตอนการพฒนาการจบครปภาพนนขนอยกบการตอบสนองหลงจากการท า Localization ถาหากผใชแสดงใหเหนวาการท า localization นนไมถกตอง การเรยนรจะเกดขนโดยการใชคณสมบตหรอลกษณะเดนของภาพทงหมดทมอยส าหรบท า localization และก าหนดต าแหนงโดยผใช การเรยนรการจบคภาพเปนกระบวนการเรยนรทมการสบทอด คอ การสรางคลงค าศ พทหรอ dictionary และการรวบรวมขอมลส าหรบการจ าแนกจะเพมมากขน คอ จ านวนของค าทไดจากการเรยนรจะมเพมมากขนเพยงเวลาแคไมนาน

การสราง Dictionary จะขนอยกบการเพมของ nearest neighbor classifier ส าหรบค าหรอคณสมบตใหมทไมมอยใน dictionary ถาถกน าเขามาในระบบ แลวมการจ าคภาพและพบวามสวนทคลายกบขอมลอนทอยใน dictionary ในขนตอนนหากระยะหางระหวางค ากบลกษณะเดนของภาพอยต ากวา คาเกณฑทก าหนด จะท าใหมการรจ าค านนเกดขน คอระบบสามารถระบไดวาภาพรถทมการจบคเปนภาพรถยหอหรอรนไหน แตถาคาระยะหางสงกวาเกณฑทก าหนด(ภาพทจบคกนมสวนทเหมอนกนนอยอาจไมใชภาพเดยวกน) ค าหรอชนสวนของภาพนน จะถกเพมเขาไปเปนคณสมบตและก าหนดเปนคาเรมตนใหมของขอมลหรอ dictionary และน าไปใชในการ match ภาพในครงตอไปทม ภาพแบบนเขามา

การหาจ ดเดนแล ะการ Matching ภาพนนจะต องใชเวลานานข นมาก และอาจ มประสทธภาพทไมด ด งนนภาพทจะน ามาหาจดเดนจงตองมการ ปรบขนาดซงอาจผานการแยกแยะรปรางมากอนแลว จะถกน ามาแปลงขนาดใหเทากบขนาดของ template ทเกบไวในdatabase หลงจากนนจงท าหมนภาพใหม orientation ทสอดคลองกบภาพใน template โดยอางองจากรปรางของรถยนตเปนหลก

Page 12: ทฤษฎีที่เกี่ยวข้องกับการด าเนินงานresearch-system.siam.edu/images/thesistee/AUTOMATIC... · ทฤษฎีที่เกี่ยวข้องกับการด

15

2.8 SIFT (Scale Invariant Feature Transform)

Scale invariant feature transform หรอ SIFT เปนอลกอรทมหนงในคอมพวเตอรวช น

ส าหรบค านวณหาจดสนใจ (Key point) ในรปภาพหนง ๆ และค านวณหาคณลกษณะของ Key

point หนงๆ ทหาได SIFT คอการเอาจดเดนในรปทไมขนอยกบสเกล การก าหนดทศทาง ต าแหนง

มมการมอง แสงสวาง เงา ซงจะท าใหสามารถน ามาใชในการเปรยบเทยบจดเดนในรปอน ๆ ได

งายและถกตองแมนย ามากยงขนอลกอรทมนถกคดคนโดย ศร .เดวด โวลว (David Lowe) แหง

University British Columbia ในป 1999 กาประยกตใชงาน SIFT มหลากหลาย ด งเชน การรจก

วตถ (Object recognition) การสรางแผนทส าหรบน าทางหนยนต (Robotic mapping and

navigation, image stitching), การสรางโมเดล 3 มตของวตถหรอทศนยภาพ (3D modeling of

object and scenes ) โดยทวไปแลว Key point จะหมายถงจดพกเซลในภาพท มการ

เปลยนแปลงเชงสองมต (Two -Dimensional) ของระดบความสวาง (Pixel Intensity) รอบๆ Key

point นนๆ

2.9 สวนประกอบของอลกอรทมในการหา SIFT Key point ในภาพหนง

สวนของการตรวจหา Key point ออกมาจากภาพอนพต (Key point Detection) ซงใน

สวนนเราจะไดชดของพกด x, y ของจดทจะเปน Key point ซงจะใชในการใหค าอธบายของ Key

point นนๆในขนตอนถดไป

สวนของการใหค าอธบายแก Key point หนงๆ (Key point Description) ในสวนน

อลกอรทมจะค านวณหาเวกเตอรอธยาย (Descriptor Vector) ซงค านวณมาจากคาความสวาง

ของพกเซลในอาณาบรเวณรอบๆ Keypoint เวกเตอรอธบายเหลานจะใชในการเปรยบเทยบเพอ

วตถประสงคของการรจ าสญลกษณ (Identity) เมอมนไปปรากฏอยในภาพอน

2.10 การน า SIFT ไปประยกตใชในการรจ าวตถ

ท าการหา SIFT Key point และ Descr iptor Vector จากภาพตนแบบของวต ถ

(Template Image) ขนตอนนโดยทวไปนยมเรยกวา ข นตอนการเรยนร (Learning Phase) จาก

Page 13: ทฤษฎีที่เกี่ยวข้องกับการด าเนินงานresearch-system.siam.edu/images/thesistee/AUTOMATIC... · ทฤษฎีที่เกี่ยวข้องกับการด

16

ขนตอนการท า SIFT Key point เมอเราตองการจะรจ าวตถทปรากฏอยในภาพอนพตหนง ๆ ทไม

ใชตนแบบ เราสามารถท าไดโดยหา Key point ในภาพอนพตนนๆ ไปเปรยบเทยบ Key point

หนง ๆ ใน โมเดลของวตถ โดยการเปรยบเทยบจะใชการค านวณหา Euclidean Distance

ระหวางเวกเตอรอธบายทประกอบกบ Key point โดยทถาคาระยะทางยงนอยแสดงวา Key point

ทงสองทน ามาเปรยบเทยบกนยงเหมอนกน

จากชดของการจบค (Matches) ระหวาง Key point ในภาพอนพตกบ Key point ของ

โมเดลของวตถ เราสามารถประยกตใชอลกอรทมทใชในการพสจนวาเปนวตถนนจรงได

2.11 Classification

Classifications เปนขนตอนในการจ าแนกและตดสนใจวาอนพตทเขามานนเปนภาพรถ

ชนดใด โดยในขนตอนนมหลายวธการดวยกน เชน การเปรยบเทยบอนพตกบโครงสรางของภาพ

รถยนตในฐานขอมล การเปรยบเทยบอนพตกบกฎเพอการต ดสนใจ การใชโครงขายประสาท

เทยม การเรยนรของเครองจกร การค านวณเชงววฒนาการ ในสวนของเน อหาท เกยวของกบการ

ท าโปรเจคจะเปนสวนของการเรยนรของเครองจกร

การเรยนรของเครองจกร (Machine Learning) เปนเทคนคหรอกระบวนการทใชส าหรบ

ปรบแตงเครองจกรหรอคอมพวเตอรใหมพฤตกรรมเฉพาะตวทสนบสนน การเรยนร โดยจะม

เทคนคตางๆ หลายวธ แตทเทคนคทสนใจคอ เทคนค Nearest Neighbor Classification

Nearest Neighbor Classification เปนการเรยนรประเภท Unsupervised Learning ซง

เปนการจ าแนกหรอจดกลมทมวธการไมซบซอน โดยพจารณาจากชดขอมลทใกล เคยงกน

กลาวคอ ขอมลทใกล เคยงกบคาของขอมลทพจารณามากทสด ในทนคาความใกลเคยงจะ

หมายถง ระยะทาง ทมคานอยทสดระหวางชดขอมลกบขอมลทพจารณา

Page 14: ทฤษฎีที่เกี่ยวข้องกับการด าเนินงานresearch-system.siam.edu/images/thesistee/AUTOMATIC... · ทฤษฎีที่เกี่ยวข้องกับการด

17

รปท 2.8 แสดงตวอยางระยะทางระหวางชดขอมล

จากรปท 2.8 จะเหนไดวา ขอมลทมระยะทางใกลกบจดศนยกลางมากทสด คอ A ซง ม

ระยะเปน 1 ในทฤษฏของ Nearest Neighbor การจ าแนกชดขอมลทมระยะหาง 1 จะเรยกวา

1NN (One Nearest Neighbor) โดยระยะหางของขอมลนนสามารถก าหนดไดวาตองการมาก

นอยเพยงใดดวยเหตนจงมการจ าแนกทเรยกวา k NN ซง k แทนดวยคาระยะทางระหวางขอมลท

ตองการ ส าหรบการหาคาระยะทางจะใชสมการทางทฤษฏการวดคาของ Euclidean คอ

√∑ ( )

สมการทางทฤษฎการวดคาของ Euclidean

2.12 OpenCV (Open Source Computer Vision Library)

OpenCV หรอ Open Source Computer Vision Library ใชในการประมวลผลภาพ

และงานทางดาน การมองเหนของคอมพวเตอร (Computer Vision) Library นถกพฒนาขนดวย

ภาษา C และ C++ และยงม interface ทไวเชอมตอกบ tool อนดวยเชน Python, Ruby,

Matlab เปนตน นอกจาน OpenCV เปน library ทสรางขนเพอใหผใชหรอนกพ ฒนาสามารถใช

ฟงกชนใน librar y มาพฒนาชนงานทมความซบซอนโดยใชเวลาเพยงไมนาน OpenCV

ประกอบดวย Data Structure และ Algorithm

- Data Structure ใชเกบขอมลตาง ๆ อาท เชน รปภาพ เมทรกซ พกด

0

0

A

D

C

B

Page 15: ทฤษฎีที่เกี่ยวข้องกับการด าเนินงานresearch-system.siam.edu/images/thesistee/AUTOMATIC... · ทฤษฎีที่เกี่ยวข้องกับการด

18

- Algorithm เพอการประมวลผลตาง โดยเฉพาะการประมวลผลทางรปภาพ

ขอจ ากดของ OpenCV คอ สามารถใชงานไดเฉพาะเครองคอมพวเตอรทใชหนวย

ประมวลผล (CPU) จาก Intel Corporation แตขอจ ากดนท าใหเกดจดเดนเชนกน กลาวคอ การ

ประมวลผลตาง ๆ จะใชความสามารถของหนวยประมวลผลอยางเตมท ท าใหโปรแกรมทพ ฒนา

โดยการใช OpenCV นมประสทธภาพในการประมวลผลทสงมาก

2.13 หลกการท างานโครงสรางแบบถงค า (bag of words)

รปท 2.9 สวนของโครงสรางแบบถงค า

สวนทหนง Image representation หลกการท างานในรป (ดานซาย) แสดงใหเหนวา

เมอเรารบภาพเขามา ภาพทเรารบเขามานนกจะถกน าไปตรวจสอบในฐานขอมล วาเปนภาพทม

สวนของภาพ คลายกบภาพทเรารบเขามาหรอไมถามกจะแสดงออกมาวา ภาพทเรารบเขามานน

เปนภาพอะไร

สวนทสอง สวนของการรจ า (Recognition) จะเปนสวนทท าการคนหาวา input ท

รบเขามา มอยในฐานขอมลหรอไม โดยสามารถอธบายดวยรปภาพไดด ง รป (ดานขวา) สวนของ

Page 16: ทฤษฎีที่เกี่ยวข้องกับการด าเนินงานresearch-system.siam.edu/images/thesistee/AUTOMATIC... · ทฤษฎีที่เกี่ยวข้องกับการด

19

ระบบรจ าจะเปนสวนทน าขอมลมาท าการ segmentation แลวน าไป เลอกเฉพาะสวนทเปน

จดเดนของภาพน าไปเกบลงในฐานขอมลโดยจะถกเรยกใชกตอเมอ มการรบ input เขามา

2.14 การเปลยนแปลงลกษณะรปรางหรอโครงรางของภาพ (Morphological processing) การเปลยนแปลงลกษณะรปรางหรอโครงรางของภาพ คอการประมวลผลของภาพ

ทางดานโครงสราง โดยเกยวกบการแยกสวนประกอบของภาพออกเพอใชในการแสดงรปราง ใน

เมทรกซจะประกอบไปดวยคาระดบขาว-ด า 2 คา คอ 0 และ 1

2.14.1 การขยาย (Dilation) การขยาย (Dilation) จะพจารณาขอมลภาพซง เปนภาพขาว-ด า เปนการขยายภาพให

ใหญขน เพอเพมสใหกบวตถทแสดงผลในขนตอนสดทาย ซงการขยายวตถจะท าไดโดยการ

ก าหนดสวนประกอบโครงสราง (Structuring element) และน าสวนประกอบโครงสรางไปกราด

บนขอมลภาพตามล าดบตลอดทงภาพ โดยเมอจดเรมตนของสวนประกอบโครงสรางหรอจด

ก าเนดตรงกบต าแหนงขอมลภาพทเทากบ 1 จะท าการยเนยนสวนประกอบโครงสราง เขากบ

ขอมลภาพดงรป

รปท 2.10 สวนของการขยาย

2.14.2 การกรอนขนาด (Erosion)

การกรอนขนาด (Erosion) เปนการกรอนขนาดบรเวณขอบของวตถ ซงการกรอนมวธ

คลายกบการขยายคอ สรางสวนประกอบโครงรางขนมาแลวน าไปกราดตามขอมลภาพ โดยจะ

เลอนไปทกต าแหนงเปรยบเทยบกบขอมลภาพ ถาขอมลมคาเหมอนกบสวนประกอบโครงรางจะ

Page 17: ทฤษฎีที่เกี่ยวข้องกับการด าเนินงานresearch-system.siam.edu/images/thesistee/AUTOMATIC... · ทฤษฎีที่เกี่ยวข้องกับการด

20

ท าการก าหนดคาขอมลภาพทตรงกบต าแหนงทตรงกบจดเรมตนหรอ จดก าเนดของสวนประกอบ

โครงรางใหเทากบ 1

รปท 2.11 สวนของการกรอนขนาด

2.15 สเหลยมในการปดลอมวตถ (Bounding Box)

คอกลองสเหลยมส าหรบปดลอมรอบบรเวณนนๆ หรอบรเวณทถกก าหนดหมายเลข ซง

กลองสเหลยมนจะชวยในการค านวณจดศนยกลาง พนท ความยาวแกนเอก-แกนโท จดพกด ฯ

ของบรเวณหรอวตถในภาพทสนใจ โดยจากรปท 2.12 จะแสดงแนวความคดการสรางกรอบภาพ

โดยรป 2.12(a) คอภาพวตถสขาว-ดา สวนในรปท 2.12(b) คอขอบและจดศนยกลาง (Centroid)

ของวตถ ตอจากนนจะมการหาแกนเอกและแกนโทของวตถด ง รปท 2.12(c) จากนนจะมการหา

จดทมระยะหางจากจดศนยกลางวตถถงขอบวตถทยาวท สดโดยพจารณาจากสวนดานบนของ

แกนเอกและสวนลางของแกนเอก (A และ B) รวมทงการหาจดทมระยะหางจากจดศนยกลางวตถ

ถงขอบวตถทยาวทสดโดยพจารณาจากบรเวณสวนซายของแกนโทและสวนขวาของแกนโท(C

และ D) ส ดทายกจะไดจดพกดในการสรางกลองส เหลยมในการปด ลอมวตถ ( Minimum

bounding box) นน

Page 18: ทฤษฎีที่เกี่ยวข้องกับการด าเนินงานresearch-system.siam.edu/images/thesistee/AUTOMATIC... · ทฤษฎีที่เกี่ยวข้องกับการด

21

รปท 2.12 แนวความคดการสรางสเหลยมในการปดลอมวตถ

2.16 การก าหนดหมายเลขใหสวนทเชอมกน (Connected-component labeling) ใชในการวเคราะหสวนประกอบหรอบรเวณทมการเชอมตดกนและใชในการแยกบรเวณ

ตางๆออกจากกนซงไมเหมอนกบวธต ดแยกโดยวธการก าหนดหมายเลขใหสวนทเชอมกน (Connected-component labeling) เปนวธทใชในคอมพวเตอรวทศน (Computer vision) เพอตรวจจบบรเวณทเชอมตดกนของภาพขาวด า ภาพส แตโดยทวไปใชในภาพขาวด าท ผานการประมวลผลมาแลว อาจใชในการนบจ านวน การกรองและการตดตาม

รปท 2.13 แบบจด 4 จด เชอมกนและแบบจด 8 จด เชอมกน

Page 19: ทฤษฎีที่เกี่ยวข้องกับการด าเนินงานresearch-system.siam.edu/images/thesistee/AUTOMATIC... · ทฤษฎีที่เกี่ยวข้องกับการด

22

จากรปท 2.14 จดทอยรอบๆ จดทอยต าแหนงตรงกลางคอ เพอนบานมทงแบบจด 4 จด เชอมกนและแบบจด 8 จด เชอมกนโดยเพอนบานทเชอมกนกคอขอบนนเอง การก าหนดหมายเลขม 2 แบบคอแบบจด 4 จด เชอมกนและแบบจด 8 จด เชอมกน มขอแตกตางกนคอ ถาเปนแบบจด 4 จด เชอมกนจะเลอกจดทเชอมกนเฉพาะบน ลาง ซาย ขวา แตหากเปน แบบจด 8 จด เชอมกนจะเลอกรวมจดทอยมมทแยงจากต าแหนงกลางอก 4 จดดวย

รปท 2.14 อกษรต าแหนงจดภาพ

ดงรปท 2.14 ก าหนดให p (pixel) แทนจดภาพทกาลงพจารณา u แทนจดภาพทอย

ต าแหนงเหนอจด p l แทนจดภาพทอยต าแหนงซายของจด p จะเรมทาจากซายไปขวาและบนลง

ลาง จากนนท าการก าหนดเลขหมายตามขนตอนดงน

ขนท 1. จากรปท 2.14 ถาจด p ไมใชจดภาพใหเลอนจดในต าแหนงถดไป ถา p เปน

จดภาพ ใหตรวจสอบสถานะของ u และ l ถาไมมจดใดเปนจดภาพให ก าหนดหมายเลขใหม

ใหกบจด p ถาม 1 จดเปนจดภาพใหนาหมายเลขของ จดนนมาก าหนดใหจด p แตถามมากกวา

1 จดเปนจดภาพสามารถนาหมายเลขของจดใดกไดมาก าหนดใหจด p โดยถอวาทกหมายเลข

เทยบเทากน

ขนท 2. เมอสนสดการสแกนในขนท 1 จดภาพทก ๆ จดจะมหมายเลขก าหนดดง รปท

2.16 แตบางหมายเลขจะเทยบเทากน ใหรวมกลมหมายเลขทเทยบเทากนด ง รปท 2.17 จากนน

ก าหนดหมายเลขใหแตละกลม

ขนท 3. น าหมายเลขของแตละกลมจากขนท 2 ไปแทนหมายเลขของจดภาพทอยในกลม

เดยวกน

Page 20: ทฤษฎีที่เกี่ยวข้องกับการด าเนินงานresearch-system.siam.edu/images/thesistee/AUTOMATIC... · ทฤษฎีที่เกี่ยวข้องกับการด

23

จากผลลพธทไดจากรปท 2.15 จะเหนวาในแตละบรเวณจะมหมายเลขก ากบไมซ ากน

ดงนนหมายเลขสงสดกคอจานวนบรเวณทงหมดทเชอมกนนนเอง

รปท 2.15 ตวอยางจดภาพและต าแหนง

รปท 2.16 หมายเลขของแตละจดภาพตามขนตอนท 1

รปท 2.17 กลมรวมทหมายเลขเทยบเทากน

Page 21: ทฤษฎีที่เกี่ยวข้องกับการด าเนินงานresearch-system.siam.edu/images/thesistee/AUTOMATIC... · ทฤษฎีที่เกี่ยวข้องกับการด

24

รปท 2.18 หมายเลขของแตละจดภาพตามขนท 3

2.17 Opening and Closing

2.17.1 Opening ใชเพอก าจดรายละเอยดขนาดเลกของภาพ และการท า Opening จะ

ท าใหพกเซลของภาพจะถกเปดกวางมากขนดงภาพและวธการของ Opening คอการท า Erosion

กอน จากนนจงท า Dilation ดงสมการ AοB = (A⊕B)ΘB เรยก B วาเปน Structuring

element

(ก) (ข)

รปท 2.19 ภาพการท า Opening (ก) ภาพตนฉบบ (ข) ผลลพธจากการท า Opening

Page 22: ทฤษฎีที่เกี่ยวข้องกับการด าเนินงานresearch-system.siam.edu/images/thesistee/AUTOMATIC... · ทฤษฎีที่เกี่ยวข้องกับการด

25

2.17.2 Closing ท าในวธตรงขามกบ Opening จะเปนการท าใหภาพมการเชอมตอกน

มากขนและการท า Closing จะท าใหพกเซลของภาพจะถกปดเชอมตอกนมากขนดงภาพท 2-15

วธการท า Closing คอการท า Dilation กอนจงท า Erosion ดงสมการ A•B = (A⊕B)ΘB เรยก

B วาเปน Structuring element

(ก) (ข)

รปท 2.20 ภาพการท า Closing (ก) ภาพตนฉบบ (ข) ผลลพธจากการท า Closing


Recommended