วันจันทร์ที่ 11 มกราคม พ.ศ. 2553

เรียนรู้การประมวลผลสัญญาณดิจิตอล (Digital Signal Processing)

ตอนที่ 3


เรียนรู้การประมวลผลสัญญาณดิจิตอล (Digital Signal Processing)
ตอน การประยุกต์ใช้งาน DSP

โดย
พีระพล ยุวภูษิตานนท์
ภาควิชาวิศวกรรมอิเล็กทรอนิกส์ มหาวิทยาลัยเทคโนโลยีมหานคร



ด้านการประมวลผลทางเสียง (Speech Processing) : “ET phones home !”

ในปี 1978 บริษัท Texas Instruments (TI) ซึ่งขณะนั้นเป็นบริษัทผู้ผลิตเครื่องคิดเลขที่โด่งดัง ได้ออกผลิตภัณท์ชนิดหนึ่งเป็นของเล่นที่อาศัยเทคโนโลยี DSP ที่ก้าวหน้ามากในสมัยนั้น ของเล่นเพื่อการศึกษานี้มีชื่อว่า Speak & SpellTM ของเล่นชนิดนี้ เป็นเกมฝึกการสะกดศัพท์ภาษาอังกฤษสำหรับเด็ก เครื่องจะเปล่งเสียงศัพท์ตัวหนึ่งออกมา แล้วก็จะรอให้เด็กๆ สะกดคำศัพท์นั้นโดย คีย์เข้าไป ผ่านทางคีย์บอร์ด โดยในแต่ละคีย์ที่กด ก็จะมีเสียงเปล่งออกมาด้วย หลักการของเครื่อง Speak & SpellTM นี้ ก็คือการสร้าง เสียงพูดสังเคราะห์ทางดิจิตอล (Digital Speech synthesizer) โดยใช้การสร้างสัญญาณผ่านโมเดลของกล่องเสียง (vocal tract model) ของมนุษย์ เครื่อง Speak & SpellTM นี้ นับว่าเป็นของเล่นเครื่องแรกของโลกที่ใช้เทคโนโลยีของ DSP ในด้านการสังเคราะห์เสียง ความน่าทึ่งของเทคโนโลยีการสังเคราะห์เสียงที่ใกล้เคียงกับเสียงพูดจริงๆ ทำให้ เด็กๆ สนุกสนานไม่เบื่อหน่ายกับการเรียนภาษา เครื่อง Speak & SpellTM นี้ยังสามารถพัฒนาตามวัยการเจริญเติบโตของเด็กๆได้อีก ก็คือ สามารถเพิ่มเติมคำศัพท์ได้ตามวัยของเด็ก โดยอาศัยการเปลี่ยน คาร์ทริดจ์ (cartridge) ที่บรรจุคำศัพท์ใหม่ๆ ได้

ในปี 1982 ภาพยนตร์ เรื่อง E.T :the extraterestrial ที่เป็นหนังในดวงใจของหลายๆ คนจนถึงปัจจุบัน ได้ลงโรงเป็นครั้งแรก ในฉากหนึ่งของภาพยนตร์ “อีที” พยายามส่งสัญญาณ วิทยุ ไปหาบ้านที่อยู่ณ กาแลคซี่ที่ห่างไกลออกไป โดยที่เครื่องส่งวิทยุนั้นดัดแปลงมาจากเครื่อง Speak & SpellTM แม้ความนิยมของเครื่องนี้จะมีมากอยู่แล้วในขณะนั้นก็ตาม แต่ยอดขายเครื่อง Speak & SpellTM ก็ยิ่งถล่มทะลายขึ้นไปอีกจนกระทั่ง TI ผลิตไม่ทันขาย เพราะด้วยประโยคอมตะ “…E.T phones home” ที่สร้างขึ้นด้วย Speak & SpellTM นี่เอง และสิ่งที่ TI ไม่พลาดแน่ๆ ก็คือ การออกวางจำหน่ายส่วนหน่วยความจำเสียงรุ่นพิเศษ ที่ให้เสียงแบบ ET ในรูปแบบคาร์ทริดจ์ดังแสดงในรูปที่ 4
ในเครื่อง Speak & Spell นี้ ใช้ชิพ TMS5110 ของ TI ซึ่งเป็น Speech/ Voice synthesizer ซึ่งเป็นตัวเก็บข้อมูลเสียงในรูปแบบที่ถูกบีบอัดแล้ว (compressed format) เหตุผลที่ต้องทำการบีบอัดก็เพราะต้องการลดขนาดหน่วยความจำแบบ ROM ซึ่งในสมัยนั้นมีราคาแพงมาก ส่วนในการสังเคราะห์เสียงพูดจะใช้หลักการที่เรียกว่า linear predictive coding (LPC) โดยอัลกอริธึม LPC มีความสามารถจะทำนายค่าเสียงได้จากข้อมูลที่รับเข้ามาก่อนหน้า เพื่อสร้างเสียงในสัญญาณเวลาถัดไป
จริงๆแล้ว การประยุกต์ใช้ ทฤษฎีการประมวลผลสัญญาณเสียงพูดด้านการรู้จำเสียง (speech recognition) กับของเล่น ไม่ได้หยุดอยู่เพียงเท่านี้ หากแต่ยิ่งมีการพัฒนามากขึ้นเรื่อยๆ ของเล่นอีกชิ้นหนึ่งที่ใช้ เทคโนโลยีการประมวลผลด้านการรู้จำเสียงก็คือ Aibo หรือ สุนัขคอมพิวเตอร์ ที่สามารถรู้จำเสียงได้ประมาณ 50 คำสั่ง แถมสอนให้รู้จักชื่อตัวเองได้ ตอบคำถามประเภท “ใช่” หรือ “ไม่” ก็ได้ด้วย




(โปรดติดตามตอนต่อไป)

ไม่มีความคิดเห็น:

แสดงความคิดเห็น