สัมประสิทธิ์เซปสตรัมบนสเกลเมล (Mel frequency cepstrum coefficient, MFCC)

--

การสกัดลักษณะเด่น (feature extraction)

การสกัดลักษณะเด่น เป็นการดึงลักษณะเฉพาะของหน่วยเสียงแต่ละหน่วยเสียง ที่แตกต่างกันออกมา แล้วให้ระบบทำการรู้จำลักษณะเด่นของหน่วยเสียงแต่ละหน่วยเสียงไว้ เมื่อสัญญาณที่เข้ามาภายหลัง มีลักษณะเด่นที่เหมือนหรือใกล้เคียงกบัลกัษณะเด่นของหน่วยเสียงใด ระบบรู้จำจะสามารถบอกได้ว่าเป็นหน่วยเสียงกลุ่มใด หรือใกล้เคียงกับหน่วยเสียงกลุ่มใดมากที่สุด และสามารถลดจำนวนข้อมูล โดยที่ข้อมูลจำนวนมากจะถูกแปลงเป็นชุดข้อมูลที่มีจำนวนน้อยลง และยังคงคุณสมบัติสำคัญของข้อมูลเดิมไว้ได้อย่างถูกต้อง

สัมประสิทธิ์เซปสตรัมบนสเกลเมล (Mel frequency cepstrum coefficient, MFCC)

เซปสตรัม (cepstrum) คือการแปลงโคไซน์แบบไม่ต่อเนื่อง (discrete cosine transform) ของลอการิทึมจากสเปกตรัมสัญญาณในช่วงสั้น ๆ สัมประสิทธิ์เซปสตรัมบนสเกลเมลเป็นเทคนิคที่ปรับปรุงจากเซปสตรัมด้วยการปรับสเกลของสเปกตรัมให้อยู่บนสเกลที่เหมาะสมสำหรับการรับฟังของมนุษย์โดยสังเกตจากลักษณะของสัญญาณเสียง สัญญาณเสียงในช่วง ความถี่ต่ำมีความสำคัญมากกว่าช่วงความถี่สูงจึงได้มีการออกแบบสเกลของสเปกตรัมให้สามารถ เก็บรายละเอียดของสัญญาณเสียงช่วงความถี่ต่ำได้มากกว่า เรียกการออกแบบนี้ว่าสเกลเมล (Mel scale) โดยมีขั้นตอนในการคำนวณหาค่าสัมประสิทธิ์เซปตรัมบนสเกลเมลดังนี้

สเปกตรัม DFT

กรอบหน้าต่างแต่ละกรอบจะถูกแปลงเป็นสเปกตรัมขนาดโดยใช้ DFT

โดยที่ N คือจำนวนจุดที่ใช้ในการคำนวณ DFT

Mel-frequency filter bank

Mel-frequency filter bank การหาค่าสัมประสิทธิ์เซปสตรัมบนสเกลเมล เริ่มต้นจากการนำสัญญาณเสียงมาผ่านการประมวลผลสัญญาณเสียง หลังจากนั้นส่งสัญญาณไปผ่านชุดตัวกรองฟิลเตอร์แบงค์ (filter bank) เพื่อเน้นความสำคัญ ของความถี่ที่อยู่ในช่วงกลางของชุดตัวกรองแต่ละตัวกรอง ชุดตัวกรองฟิลเตอร์แบงค์มีลักษณะ ดังรูป

โดยที่ความถี่กลางของตัวกรองแต่ละชุดนั้นเกิดจากการแปลงค่าความถี่ปรกติ (𝑓) ใหอยู่บนสเกลเมล (𝑓𝑚𝑒𝑙)

การคำนวณหาพลังงานสเปกตรัมที่ผ่านตัวกรองขั้นตอนนี้นำความถี่ที่ได้จากขั้นตอนคำนวณสเปกตรัมมาหาขนาดกำลังสองได้ |𝑥̃(𝑘)|² ส่งผ่านชุดตัวกรองแบบสาม เหลี่ยมในสเกลเมล เพื่อเน้นความสำคัญของความถี่ที่อยู่ในช่วงกลางของชุดตัวกรองแต่ละตัวกรอง ตามสมการ

•โดยที่ M คือจำนวนตัวกรองน้ำหนัก Mel รูปสามเหลี่ยมทั้งหมด คือน้ำหนักที่กำหนดให้กับถังสเปกตรัมพลังงาน kth ที่มีส่วนต่อ mth

การคำนวณสัมประสิทธิ์เซปสตรัมบนสเกลเมล (MFCC) ในขั้นตอนนี้นำลอการิทึมของพลังงานมาผ่านการแปลงโคไซน์แบบไม่ต่อเนื่องทำให้ได้ค่าสัมประสิทธิ์เซปสตรัมบนสเกลเมล 𝑐 ลำดับที่ 𝑚 ตามสมการ

หมายเหตุท้าย:
หากคุณชอบบทความนี้อย่าลืมคลิก❤ด้านล่างเพื่อแนะนำและถ้าคุณมีคำถามใด ๆ แสดงความคิดเห็นและฉันจะพยายามอย่างดีที่สุดที่จะตอบ คุณสามารถติดตามฉันบน facebook page (https://www.facebook.com/nextsoftwarehousethailand/) และสามารถส่งอีเมลถึงฉัน

--

--

Dr. Pathasu Doungmala

Founder of Next Software — I am working on image processing, pattern recognition and AI to help reduce working in an industry.