THANUTCHAYA SONIA WONGSIRIPACH: เรียนรู้การประมวลผลสัญญาณดิจิตอล (Digital Signal Processing)

วันจันทร์ที่ 11 มกราคม พ.ศ. 2553

เรียนรู้การประมวลผลสัญญาณดิจิตอล (Digital Signal Processing)

ตอนที่ 3

เรียนรู้การประมวลผลสัญญาณดิจิตอล (Digital Signal Processing)
ตอน การประยุกต์ใช้งาน DSP
โดย
พีระพล ยุวภูษิตานนท์
ภาควิชาวิศวกรรมอิเล็กทรอนิกส์ มหาวิทยาลัยเทคโนโลยีมหานคร

ด้านการประมวลผลทางเสียง (Speech Processing) : “ET phones home !”

ในปี 1978 บริษัท Texas Instruments (TI) ซึ่งขณะนั้นเป็นบริษัทผู้ผลิตเครื่องคิดเลขที่โด่งดัง ได้ออกผลิตภัณท์ชนิดหนึ่งเป็นของเล่นที่อาศัยเทคโนโลยี DSP ที่ก้าวหน้ามากในสมัยนั้น ของเล่นเพื่อการศึกษานี้มีชื่อว่า Speak & SpellTM ของเล่นชนิดนี้ เป็นเกมฝึกการสะกดศัพท์ภาษาอังกฤษสำหรับเด็ก เครื่องจะเปล่งเสียงศัพท์ตัวหนึ่งออกมา แล้วก็จะรอให้เด็กๆ สะกดคำศัพท์นั้นโดย คีย์เข้าไป ผ่านทางคีย์บอร์ด โดยในแต่ละคีย์ที่กด ก็จะมีเสียงเปล่งออกมาด้วย หลักการของเครื่อง Speak & SpellTM นี้ ก็คือการสร้าง เสียงพูดสังเคราะห์ทางดิจิตอล (Digital Speech synthesizer) โดยใช้การสร้างสัญญาณผ่านโมเดลของกล่องเสียง (vocal tract model) ของมนุษย์ เครื่อง Speak & SpellTM นี้ นับว่าเป็นของเล่นเครื่องแรกของโลกที่ใช้เทคโนโลยีของ DSP ในด้านการสังเคราะห์เสียง ความน่าทึ่งของเทคโนโลยีการสังเคราะห์เสียงที่ใกล้เคียงกับเสียงพูดจริงๆ ทำให้ เด็กๆ สนุกสนานไม่เบื่อหน่ายกับการเรียนภาษา เครื่อง Speak & SpellTM นี้ยังสามารถพัฒนาตามวัยการเจริญเติบโตของเด็กๆได้อีก ก็คือ สามารถเพิ่มเติมคำศัพท์ได้ตามวัยของเด็ก โดยอาศัยการเปลี่ยน คาร์ทริดจ์ (cartridge) ที่บรรจุคำศัพท์ใหม่ๆ ได้

ในปี 1982 ภาพยนตร์ เรื่อง E.T :the extraterestrial ที่เป็นหนังในดวงใจของหลายๆ คนจนถึงปัจจุบัน ได้ลงโรงเป็นครั้งแรก ในฉากหนึ่งของภาพยนตร์ “อีที” พยายามส่งสัญญาณ วิทยุ ไปหาบ้านที่อยู่ณ กาแลคซี่ที่ห่างไกลออกไป โดยที่เครื่องส่งวิทยุนั้นดัดแปลงมาจากเครื่อง Speak & SpellTM แม้ความนิยมของเครื่องนี้จะมีมากอยู่แล้วในขณะนั้นก็ตาม แต่ยอดขายเครื่อง Speak & SpellTM ก็ยิ่งถล่มทะลายขึ้นไปอีกจนกระทั่ง TI ผลิตไม่ทันขาย เพราะด้วยประโยคอมตะ “…E.T phones home” ที่สร้างขึ้นด้วย Speak & SpellTM นี่เอง และสิ่งที่ TI ไม่พลาดแน่ๆ ก็คือ การออกวางจำหน่ายส่วนหน่วยความจำเสียงรุ่นพิเศษ ที่ให้เสียงแบบ ET ในรูปแบบคาร์ทริดจ์ดังแสดงในรูปที่ 4

ในเครื่อง Speak & Spell นี้ ใช้ชิพ TMS5110 ของ TI ซึ่งเป็น Speech/ Voice synthesizer ซึ่งเป็นตัวเก็บข้อมูลเสียงในรูปแบบที่ถูกบีบอัดแล้ว (compressed format) เหตุผลที่ต้องทำการบีบอัดก็เพราะต้องการลดขนาดหน่วยความจำแบบ ROM ซึ่งในสมัยนั้นมีราคาแพงมาก ส่วนในการสังเคราะห์เสียงพูดจะใช้หลักการที่เรียกว่า linear predictive coding (LPC) โดยอัลกอริธึม LPC มีความสามารถจะทำนายค่าเสียงได้จากข้อมูลที่รับเข้ามาก่อนหน้า เพื่อสร้างเสียงในสัญญาณเวลาถัดไป

จริงๆแล้ว การประยุกต์ใช้ ทฤษฎีการประมวลผลสัญญาณเสียงพูดด้านการรู้จำเสียง (speech recognition) กับของเล่น ไม่ได้หยุดอยู่เพียงเท่านี้ หากแต่ยิ่งมีการพัฒนามากขึ้นเรื่อยๆ ของเล่นอีกชิ้นหนึ่งที่ใช้ เทคโนโลยีการประมวลผลด้านการรู้จำเสียงก็คือ Aibo หรือ สุนัขคอมพิวเตอร์ ที่สามารถรู้จำเสียงได้ประมาณ 50 คำสั่ง แถมสอนให้รู้จักชื่อตัวเองได้ ตอบคำถามประเภท “ใช่” หรือ “ไม่” ก็ได้ด้วย

(โปรดติดตามตอนต่อไป)

วันจันทร์ที่ 11 มกราคม พ.ศ. 2553

เรียนรู้การประมวลผลสัญญาณดิจิตอล (Digital Signal Processing)

ไม่มีความคิดเห็น:

แสดงความคิดเห็น

THANUTCHAYA SONIA WONGSIRIPACH

IT IS MY LIFE

นักการทูต

คลังบทความของบล็อก

ผู้ติดตาม