
ตั้งแต่การตอกย้ำบทบาททางเพศที่ยึดที่มั่นไปจนถึงการเติมพลังให้กับผู้หญิง การเลือกเสียงที่เหมาะสมสำหรับงานเฉพาะอาจเป็นเขตที่วางทุ่นระเบิด
เจมส์ บอนด์เปิดประตูรถบีเอ็มดับเบิลยูคันใหม่ของเขาซึ่งมาพร้อมกับปืนกลที่ซ่อนอยู่เป็นมาตรฐาน และในทันที เสียงคอมพิวเตอร์ของผู้หญิงก็ประกาศว่า “ยินดีต้อนรับ! โปรดรัดเข็มขัดนิรภัยและปฏิบัติตามคำแนะนำทั้งหมดเพื่อการเดินทางที่ปลอดภัย”
Q เพื่อนร่วมงาน MI6 ของ Bond และผู้เชี่ยวชาญด้านอุปกรณ์พกพาอธิบาย: “คิดว่าคุณจะสนใจเสียงผู้หญิงมากกว่านี้” แต่อย่างที่คาดเดา บอร์นจะเพิกเฉยต่อคำสั่งซ้ำๆ ให้สวมเข็มขัดนิรภัย และใช้โทรศัพท์มือถือเป็นรีโมทควบคุม จากนั้นเขาก็ขับรถลงจากยอดที่จอดรถหลายชั้นในภาพยนตร์บล็อกบัสเตอร์เรื่อง Tomorrow Never Dies ปี 1997
การวิจัยตลาดของ Q นั้นผิด – และของ BMW ก็เช่นกัน บริษัทจำชื่อระบบ GPS ที่เปล่งเสียงผู้หญิงได้จากรถยนต์ของตนเมื่อผู้ขับขี่ชาวเยอรมันบ่นว่าพวกเขาไม่ต้องการรับคำแนะนำ “จากผู้หญิง”
แต่ทำไมผู้ชายเยอรมัน สายลับอังกฤษ หรือใครก็ตามมักจะไม่ปฏิบัติตามคำแนะนำในโทนที่เป็นผู้หญิง? ทุกวันนี้ ระบบนำทางด้วยเสียงของผู้หญิงนั้นค่อนข้างธรรมดา แต่ผลการศึกษาหลายชิ้นชี้ให้เห็นว่าเสียงดิจิทัลยังคงตอกย้ำทัศนคติทางเพศที่เป็นปัญหาอย่างลึกซึ้งต่อไป ลำโพงอัจฉริยะพร้อมเสียงผู้หญิงที่เสนอราคาของคุณอย่างสุภาพ เทียบกับข้อความที่บันทึกเสียงโดยผู้ชายซึ่งทำหน้าที่ควบคุมและสั่งให้คุณอยู่ห่างจากรถบรรทุกถอยหลัง
อคติทางเพศมีอยู่มากมายในระบบปัญญาประดิษฐ์ (AI) ตามรายงานประจำปี 2019จาก Unesco ที่มีการพูดคุยกันอย่างกว้างขวาง ชื่อรายงาน “ฉันจะอายถ้าทำได้” หมายถึงคำตอบที่ Siri ผู้ช่วยเสียงของ Apple เคยพูดเมื่อมีคนตั้งข้อสังเกตว่า “เฮ้ Siri คุณ ab****”
แม้ว่าจะมีการปรับปรุงบางอย่างกับระบบเสียง AI ตั้งแต่นั้นมา หลายคนแย้งว่ายังมีทางไป ดังนั้นอคติทางเพศจึงฝังลึกในระบบเหล่านี้ตั้งแต่แรกได้อย่างไร – และเราจะทำอย่างไรเพื่อกำจัดมัน?
ประวัติของเสียงดิจิทัล และวิธีที่เราใช้และใช้ในทางที่ผิด ไม่ได้ทำให้อ่านง่าย นำระบบคอมพิวเตอร์ในเครื่องบินที่พูดคุยกับนักบินและให้ข้อมูลหรือคำเตือน ระบบหนึ่งที่ใช้การบันทึกเสียงของนักร้องและนักแสดง Joan Elms ถูกขนานนามว่า ” Sexy Sally ” ระบบที่ใหม่กว่าซึ่งเดิมใช้เสียงของนักแสดง Kim Crow ได้รับการตั้งชื่ออย่างไม่เป็นทางการว่า “B******* Betty” และในสหราชอาณาจักรบางครั้งก็ใช้ คำว่า ” Nagging Nora “
ในทำนองเดียวกัน มีรายงานว่าเจ้าหน้าที่ของรถไฟใต้ดินลอนดอนเรียกระบบประกาศอัตโนมัติว่า “Sony” เพราะ “ทำให้เกิดความกังวล”
ระบบเสียงของเครื่องบินที่เทียบเท่าผู้ชายเรียกว่า “Barking Bob” โดยนักบินบางคน แต่เห็นได้ชัดว่าวลีนั้นไม่ได้หมายความถึงอคติตามเพศเช่นเดียวกับคำอื่นๆ
Verena Rieser จาก Heriot-Watt University เปิดเผยว่า ไม่ใช่แค่ว่าผู้คนยอมรับเสียงผู้หญิงในบางบทบาทหรือไม่ แต่ยังรวมถึงวิธีที่นักพัฒนาซอฟต์แวร์เคยออกแบบเสียงสังเคราะห์ในอดีตเพื่อทำหน้าที่เหล่านั้นซึ่งเป็นปัญหาด้วย ผู้ช่วยเสียงบางครั้งไม่สามารถรับรู้และท้าทายพฤติกรรมที่ไม่เหมาะสม
“ระบบเหล่านี้เป็นเพศและมานุษยวิทยา” เธออธิบาย “โดยทั่วไปมีวงจรการเสริมกำลังที่นี่”
เสียงเริ่มต้นของผู้ช่วยเช่น Siri หรือ Alexa มักจะเป็นผู้หญิงเสมอในอดีต แม้ว่าในช่วงไม่กี่ปีที่ผ่านมา Apple และ Amazon ได้เปิดตัวเลือกอื่นๆ อย่างไรก็ตาม คุณอาจพบว่าเสียงที่สังเคราะห์ขึ้นจากผู้หญิงนั้นเป็นเรื่องธรรมดามากกว่าเสียงของผู้ชาย แต่ทำไม? ส่วนหนึ่งมาจากข้อเท็จจริงที่ว่าบริษัทต่างๆ ใช้เวลาหลายทศวรรษ ในการหาเสียงของผู้หญิงมาบันทึก เสียงมากกว่าผู้ชาย ข้อมูลจำนวนมากนี้มีอิทธิพลต่อเทคโนโลยีที่ตามมา ซึ่งรวมถึง AI
แทนที่จะส่งเสริมความเท่าเทียมทางเพศ ผู้ช่วยเสียงมักจะทำตรงกันข้าม
ผู้หญิงได้ดำเนินการแลกเปลี่ยนทางโทรศัพท์และให้ยืมเสียงของพวกเขาไปยังระบบข้อความก่อนดิจิตอลจำนวนมาก ซึ่งหมายความว่าเสียงของผู้หญิงคือสิ่งที่หลายคนคาดหวังจากเทคโนโลยีที่เป็นประโยชน์และเป็นไปตามข้อกำหนด
การวิจัยระบุว่าสิ่งนี้เหมาะสมกับความคาดหวังผู้หญิงของเราว่างานใดที่ “เหมาะสม” สำหรับผู้หญิงกับผู้ชาย และยังมีงานอื่น ๆ ที่แสดงให้เห็นว่ามีเหตุผลเพียงเล็กน้อยหรือไม่มีเหตุผลในทางปฏิบัติในการจัดลำดับความสำคัญของเสียงของผู้หญิงมากกว่าเสียงของผู้ชายสำหรับการใช้งานบางอย่าง – ทั้งสองมีความชัดเจนเท่ากันไม่มากก็น้อยและทั้งสองสามารถส่งข้อมูลได้อย่างมีประสิทธิภาพ
อย่างไรก็ตาม แทนที่จะส่งเสริมความเท่าเทียมทางเพศ ผู้ช่วยเสียงมักจะทำตรงกันข้าม นักข่าว Leah Fessler ได้ทดสอบการตอบสนองของผู้ช่วยเสียงเสมือนต่อการล่วงละเมิดทางเพศในปี 2017 และพบปัญหาหลายประการ เมื่อบอกว่า “คุณร้อนแรง” Alexa ของ Amazon ตอบกลับอย่างไม่สุภาพว่า “ดีใจที่คุณพูด” Cortana ของ Microsoft ได้โพสต์ผลการค้นหาเว็บว่า “30 ป้าย คุณเป็นอีตัว”
ในปี 2020 นักวิจัยจากสถาบัน Brookings ได้ทดสอบปฏิสัมพันธ์เหล่านี้ซ้ำแล้วซ้ำเล่าและพบว่ามีการปรับปรุงบ้าง ผู้ช่วยเสียงมีแนวโน้มที่จะต่อต้านการละเมิดมากกว่าเมื่อก่อน หากไม่ชัดเจนเสมอไป
บริษัทเทคโนโลยีขนาดใหญ่ยังได้กระจายเสียงที่ผู้ใช้สามารถเลือกสำหรับผู้ช่วยเสมือนของพวกเขา มีตัวเลือกผู้ชายมากกว่าเดิม ตัวอย่างเช่น Apple ไม่เลือกเสียงผู้หญิงล่วงหน้าเป็นค่าเริ่มต้นสำหรับ Siri อีกต่อไป
แต่นักวิจัยที่ศึกษาเรื่องเพศโต้แย้งว่าเพียงแค่เสนอเสียงผู้ชายเป็นทางเลือก และการปรับเปลี่ยนการตอบสนองของผู้ช่วยต่อภาษาที่ไม่เหมาะสม ยังคงทำให้เราห่างไกลจากการแก้ไขปัญหาที่กว้างขึ้น การขาดความหลากหลายและความซับซ้อนยังคงอยู่ในเสียงที่ไร้ตัวตนเหล่านี้ ไม่น้อยเพราะตัวตนที่มักถูกละทิ้งโดยระบบผู้ช่วยเสมือน บางคนระบุว่าไม่ใช่ไบนารีหรือของเหลวทางเพศ และเป็นที่ยอมรับกันมากขึ้นว่าอัตลักษณ์ทางเพศเป็นผลรวมของปัจจัยหลายอย่าง รวมถึงอิทธิพลทางสังคมและวัฒนธรรม
เสียงดิจิตอลสามารถบันทึกสิ่งนี้ได้หรือไม่? คำตอบคือ “อาจจะ” ส่วนหนึ่งเป็นเพราะเป็นการยากที่จะสังเคราะห์เสียงผู้ใหญ่ที่มีเสียงอื่นที่ไม่ใช่เพศชายหรือเพศหญิง นอกจากนี้ แม้ว่าเรามักจะคิดว่าเสียงของผู้ชายนั้นลึกกว่าเสียงของผู้หญิง แต่ก็ไม่เป็นความจริงเสมอไป Selina Sutton จาก Northumbria University กล่าว
เพียงเพราะว่าเพศของเสียงดิจิทัลไม่ชัดเจนไม่ได้หมายความว่าจะไม่สามารถเป็นผู้หญิงได้เช่นกัน
“มีพิทช์ระดับกลาง ความถี่พื้นฐาน ซึ่งเหมือนกันสำหรับผู้ชายและผู้หญิง” เธออธิบาย
โครงการต่างๆ ได้พยายามสังเคราะห์เสียงที่ “เป็นกลางทางเพศ” ด้วยความสำเร็จที่แตกต่างกัน บริษัทที่ปรึกษา Accenture ได้ทดลองเสียงที่เป็นกลางทางเพศแม้ว่าจะฟังดูเป็นเพศชายหรือเพศหญิงก็ตาม ขึ้นอยู่กับว่าผู้ฟังรับรู้อย่างไร
ในปี 2019 ทีมนักออกแบบและนักวิจัยได้เสนอโครงการที่เรียกว่า Q (ไม่มีการเชื่อมต่อกับ James Bond) ซึ่งถูกเรียกว่าเป็น “เสียงที่ไร้เพศ” ผู้ร่วมสร้าง Ryan Sherman ซึ่งตอนนี้ทำงานให้กับห้องปฏิบัติการออกแบบ Space10 กล่าวว่าเขาได้รับแรงบันดาลใจให้พัฒนา Q หลังจากสังเกตเห็นเสียงของผู้หญิงที่ยอมจำนนซึ่งมักจะทำให้ผู้ช่วยเสมือนมีลักษณะเฉพาะ แม้ว่าพวกเขาจะต้องเผชิญกับการรุกรานจากผู้ใช้ที่เป็นมนุษย์
“โดยปกติเป็นวิธีที่ยอมจำนนและตอกย้ำแนวคิดนี้ว่าผู้หญิงพร้อมที่จะช่วยเหลือด้วยการกดปุ่มเพียงปุ่มเดียว” เขากล่าว
แม้ว่า Q จะยังไม่ได้รับการพัฒนาให้เป็นระบบเสียงสังเคราะห์ที่ทำงานได้อย่างสมบูรณ์ แต่การสาธิตที่สร้างโดย Sherman และผู้ทำงานร่วมกันของเขาได้แสดงให้เห็นว่าเสียงนั้นเป็นอย่างไร พวกเขาบันทึกเสียงของผู้ที่ระบุว่าไม่ใช่ไบนารีและปรับระดับเสียงให้อยู่ระหว่าง 145 Hz ถึง 175 Hz ซึ่งคร่อมเสียงผู้หญิงและผู้ชายจำนวนมาก
ผลที่ได้คือเล่นกับคน 4,500 คนที่แตกต่างกัน เชอร์แมนกล่าว และในขณะที่บางคนคิดว่ามันฟังดูเป็นผู้หญิง ในขณะที่คนอื่นๆ มองว่าเป็นผู้ชาย หลายคนตัดสินว่าไม่ใช่ทั้งสองอย่าง จากคำตอบที่หลากหลายนี้ Sutton กล่าวว่า Q อธิบายได้ดีที่สุดว่าเป็น “เพศที่คลุมเครือ” มากกว่าที่จะเป็นกลาง
ในขณะที่เสียงที่หลากหลายมากขึ้นในระบบคอมพิวเตอร์สามารถช่วยย้ายเทคโนโลยีออกจากการแสดงของผู้หญิงแบบโปรเฟสเซอร์ แต่เพียงเพราะเพศของเสียงดิจิทัลไม่ชัดเจนไม่ได้หมายความว่าจะไม่สามารถเป็นผู้หญิงได้เช่นกัน Sutton กล่าว มากขึ้นอยู่กับสิ่งที่เสียงพูดและหน้าที่ของเสียง
นักออกแบบเสียงสังเคราะห์สามารถเสนอทางเลือกที่แปลกกว่านั้นได้ – เสียงที่ฟังดูเหมือนตัวการ์ตูนแปลก ๆ หรือสัตว์ที่ไม่ใช่มนุษย์ Mark West หัวหน้าผู้เขียนรายงานของ Unesco ได้เสนอแนวทางนี้เมื่อปีที่แล้ว
“ทางออกของปริศนานี้คือการนำเสนอผู้ช่วยด้านเสียงและแอปพลิเคชั่น AI อื่น ๆ ที่ไม่ใช่มนุษย์ – ประเภทของ ‘ให้ AI ประดิษฐ์’ จรรยาบรรณ” เขากล่าวโดยสังเกตว่าเสียงที่ “ไม่ใช่มนุษย์” สามารถออกแบบให้เป็น น่าพอใจและเข้าใจได้