ISSN 1513-038X (Print)

ISSN xxxx-xxxx (Online)

RSUJET

วารสารวิศวกรรมและเทคโนโลยี มหาวิทยาลัยรังสิต

https://rsujet.rsu.ac.th

. Vol.16 No.1 , January - June 2013.

การใช้ค่าเฉลี่ยความถี่มูลฐาน / โครงข่ายประสาทเทียมร่วมกับความถี่มูลฐาน ในการจำแนกเพศจากสัญญาณเสียงพูด

รง ภู่พวงไพโรจน์

Abstract

การจำแนกเพศจากเสียงพูดเป็นเรื่องที่น่าสนใจ ซึ่งไม่เพียงแต่ใช้ระบุเพศของผู้พูดจากสัญญาณเสียงพูด แต่ยังสามารถนำไปประยุกต์ใช้กับแอพพลิเคชันต่าง ๆ เช่น การระบุผู้พูด (Speaker identification) การตรวจสอบผู้พูด (Speaker verification) และ การรู้จำเสียงพูด (Speech recognition) ในระบบการระบุผู้พูด และตรวจสอบผู้พูด ผลลัพธ์ของการจำแนกเพศจะใช้เป็นข้อมูลให้แก่ระบบว่าบุคคลผู้ที่กำลังพูดอยู่น่าจะเป็นผู้หญิงหรือผู้ชาย สาหรับการรู้จำเสียงพูด ได้มีความพยายามที่จะจำแนกเพศของผู้พูดก่อนที่จะทำการรู้จำเสียงพูดเนื่องจากเพศเป็นปัจจัยทางกายภาพปัจจัยหนึ่งที่ทำให้เกิดความแปรปรวนในเสียงพูดซึ่งทำให้ผลการรู้จำเสียงพูดลดลง ซึ่งหากระบบทราบเพศของผู้พูดล่วงหน้า ระบบการรู้จำเสียงพูดมักจะให้ความถูกต้องของการรู้จำเสียงพูดที่สูงกว่า สำหรับแอพพลิเคชันด้านหุ่นยนต์ (Robotics applications) การจำแนกเพศจากเสียงพูดยังช่วยให้หุ่นยนต์สามารถให้บริการกับบุคลต่าง ๆ ตามเพศของผู้พูด บทความนี้จะนำเสนอวิธีการจำแนกเพศจากเสียงพูด ซึ่งจะประกอบด้วย 1) การลดส่วนที่ไม่ใช่เสียงพูด 2) การสกัดความถี่มูลฐาน (Fundamental frequency (F0) extraction) และ 3) การจำแนกเพศโดยการใช้ค่าเฉลี่ยของความถี่มูลฐาน และการใช้ความถี่มูลฐานร่วมกับโครงข่ายประสาทเทียม (Artificial Neural Network : ANN) การจำแนกเพศโดยการใช้ค่าเฉลี่ยของความถี่มูลฐานเป็นวิธีการที่มีประสิทธิภาพ และไม่ซับซ้อน ส่วนการใช้ความถี่มูลฐานร่วมกับโครงข่ายประสาทเทียม เป็นวิธีการที่มีความซับซ้อนกว่า แต่มักจะให้ผลความถูกต้องที่สูงกว่าเล็กน้อย และไม่ต้องกำหนดค่าขอบเขตของการจำแนกเพศ วิธีการจำแนกเพศทั้งสองมีประโยชน์ในการพัฒนาแอพพลิเคชันจำแนกเพศจากเสียงพูดโดยที่ท่านผู้อ่านสามารถเลือกใช้วิธีการใดวิธีการหนึ่ง หรือรวมทั้งสองวิธีเข้าด้วยกันเพื่อการจาแนกเพศผู้พูด

Keywords: การจาแนกเพศจากเสียงพูด, ความถี่มูลฐาน, ค่าเฉลี่ยความถี่มูลฐาน, โครงข่ายประสาทเทียม, การประมวลผลเสียงพูด, ค่าความสัมพันธ์ของความถี่มูลฐานกับเวลา

Download Full Paper.