זיהוי קול - האם זה יזרוק חברות תמלול על ערימת הגרוטאות?
נכתב על ידי: Yafator
תאריך: 20/01/22

אם היו לי מאה פאונד על כל פעם שמישהו אמר לי ששירותי התמלול יתיישנו בקרוב ושכולם ישתמשו בתוכנת זיהוי קולי, לא הייתי צריך לנהל עסק! עם זאת, אני משוכנע בתוקף שתוכנת זיהוי קול במתכונתה הנוכחית אינה מהווה תחליף לשירותי תמלול. אבל אז הייתי אומר את זה, לא? להלן כמה מהסיבות לכך שאני לא משוכנע שזה יחליף אותי עדיין תמלול בעברית.

תוכנת זיהוי קול מגיעה כיום בשתי צורות - Dragon Naturally Speaking ו-ViaVoice של יבמ. בנוסף לשימוש למתן פקודות למחשב (למשל לשמירת קובץ), ניתן להשתמש בו גם להמרת דיבור ישר למסמך וורד. עם זאת, החיסרון העיקרי הוא שתוכנת זיהוי קול היא 'כלב לאדון אחד' בלבד. אפשר להשתמש בתוכנה בהצלחה להכתבה אבל היא לא יכולה להתמודד אפילו עם ראיונות אחד על אחד וכנראה הייתה נכנסת להתמוטטות אם תנסה את זה עם פגישות קבוצתיות או קבוצות מיקוד. יש לאמן את התוכנה כדי להתרגל לקול אחד. לבקש ממנו לזהות ולתמלל במדויק את הקול השונה של המרואיין שלך כמו גם את השאלות שלך, או את מספר הקולות של קבוצה, פשוט לא אפשרי כרגע. גם עם הכתבה קולית אחת, עדיין צריך לתקן את התוכנה ולהכשיר אותה לזהות מילים חדשות ולא מוכרות או מונחים או שמות טכניים.

הדרך היחידה להשתמש בתוכנת זיהוי קול בצורה יעילה עבור מצב ראיון תהיה להאזין להקלטה ולומר מחדש את כל מה שאתה שומע - גם שאלות וגם תגובות. ברור שזה ייקח זמן רב, צריך לעצור ולהתחיל את ההקלטה כדי שתוכל 'לדבר' את מה שאתה שומע. בעיקרו של דבר, אתה מנסה לבצע תרגום סימולטני - מתרכז בהאזנה לדיבור של מישהו אחר, תוך כדי אמירת המילים הללו כמה שניות לאחר מכן, אך מבלי לאבד את הנאמר הבא. נסה את זה עם תוכנית טלוויזיה או רדיו מוקלטת ותראה כמה קשה לשלוט בזה. הוסיפו את הזמן שנדרש בסוף להגהה ולסדר את מסמך ה-Word ומתברר שזה ייקח הרבה יותר מאורך הראיון המקורי, ולא שונה מהזמן שלוקח מתמלל מקצועי להשלמת התמלול. האם זה שימוש יקר ופרודוקטיבי של הזמן שלך? הגדל את הזמן והמאמץ הזה פעמים רבות אם ניסית להתמודד עם 'דיבור' בקבוצת מיקוד, במיוחד אם ההקלטה פחות ברורה תמלול דיונים.

גורם מרכזי נוסף כאשר בוחנים תוכנת זיהוי דיבור הוא חוסר היכולת שלה לשפוט באילו מילים הומוניות יש להשתמש. ככל הנראה, הגרסאות האחרונות מסוגלות כעת לזהות את הנפוצות יותר במשפטים פשוטים, כמו להחליט אם היא שם או שלהן. עם זאת, משפטים ארוכים ומסובכים יכולים להביס אותו. כל זה מוסיף לזמן ההגהה שלך בסוף. אתה גם צריך לשקול כיצד התוכנה תתמודד עם פקודות עבור סימני פיסוק או עיצוב מילים מסוימות בהדגשה, למשל. רוב התוכניות דורשות ממך להשאיר הפסקה בין הפקודה לחלק הבא של 'טקסט'. אם ההשהייה אינה ארוכה מספיק, תמצא את הפקודות הללו שהוזנו כחלק מהטקסט עצמו, אשר יהיה צורך לערוך מאוחר יותר. עבור פורמט ראיון, תצטרכו לציין החלפת רמקול עם שורה חדשה וראשי תיבות, ופקודת טאב. גם אם רק תחליטו להזין החלפת רמקול בקו חדש ולסדר אותו לאחר מכן, כל זה מוסיף לזמן הדרוש. לכאורה, אחת הגרסאות העדכניות ביותר (באופן טבעי) גם תנקד עבורך - תחליט לאן הולכים כל הפסקים והנקודות. היו מוכנים לתקן זאת מאוחר יותר - רעיון הפיסוק שלו אינו שלי!

'באופן טבעי', כביכול, אני משוחד! אבל אני משוכנע שתוכנת זיהוי קול היא כלי שימושי המתאים למטרה מסוימת, אך מטרה זו אינה עדיין תמלול של כל ההקלטות בכל הנסיבות.


 
אודות המחבר
המאמר הודפס מאתר portal-asakim.com - אתר מאמרים עסקיים ומקצועיים
http://www.portal-asakim.com/Articles/Article61016.aspx