top of page

מה הבעייה עם אודיו דיגיטלי? על שמיעה, סאונד, ומה שמסביבם - פרק טו

  • Writer: תמיר בראליה
    תמיר בראליה
  • Jan 5
  • 7 min read

אוקיי, אז עד עכשיו דיברנו על טכנולוגיות דיגיטליות ומדוע הם כל כך נפוצות בחיי היום יום שלנו. הבנו גם מה ההבדל העקרוני בין פורמט ה-PCM, שמתאר את גל האודיו כאוסף של מדידות בדידות, ופורמט ה-PDM שמתאר את צורת הגל במקבצים של צפיפות דופק. עכשיו הגיע הזמן שנסתכל לטכנולוגיות הדיגיטליות בלבן של העיניים ונראה איזה חסרונות יש להם.


תעשיית ההפקות באולפנים ותעשיית ההופעות החיות (והלייב סאונד באשר הוא) שונים בתכלית, שוני זה בא לידי ביטוי בצורה הבסיסית הבאה: הפקת אולפן עוסקת בעיקר בהקלטת אודיו אשר ניתן להשמיע מחדש בכל עת בעתיד, וסאונד חי מתמקד בהגברת סאונד בזמן אמת - ההקלטה היא עניין אופציונלי ונפרד.


באולפן הפקה, יש להקליט (ולאחסן) אודיו על מדיה כלשהי. אין בנמצא מדיום מושלם - גם לקלטת אנלוגית וגם לאחסון דיגיטלי יש את היתרונות והחסרונות שלהם, וניתן לקיים דיון באיזה מהם לבחור. לעומת זאת, עבור מהנדס לייב סאונד הציווי הוא ברור: לקבל ולהגביר את אות האודיו ללא פשרות בנאמנות למקור. בהקשר הזה, השאלה הדיגיטלית לעומת האנלוגית מספקת תשובה די קלה - המרה דיגיטלית מסורתית של אות אנלוגי מציגה שגיאות הפוגעות באיכות האות, ויש להימנע מכך ככל שניתן.


תזכורת: מה זה עיוות (דיסטורשן).

למונח עיוות (דיסטורשן) יכולות להיות משמעויות רבות בעולם האודיו. החל מהעידון והחום שמוסיפים שפופרות הריק של מגבר גיטרה ועד העיוות ההרסני שמתלווה להמרה דיגיטלית (צללנו לנושא העיוות בפרק ט: עיוות במערכות אלקטרוניות, למי שרוצה להזכר לעומק). לצורך הדיון שלנו, נגדיר עיוות כ”כל שינוי לא רצוי מהאות המקורי”.

המרה דיגיטלית מביאה עיוות במספר של דרכים, ובראשם:

מידע חסר”, “עיוות מסנן” ו“ריצוד”.


איזה “מידע חסר” בדיוק?

אחד החסרונות הגדולים בפורמט האודיו PCM, בא לידי ביטוי במימד הזמן (הסברנו על חשיבותו של הזמן בפרק ח). בהתחשב בכך שיש לנו רזולוציה טמפורלית מדויקת עד 5 מיקרו-שניות (זה חמש מיליוניות השנייה), קצבי דגימה נפוצים כגון 44.1 קילו-הרץ או אפילו 96 קילו-הרץ לוכדים רק חלק קטן מהפירוט הקולי שאנו יכולים לתפוס. התוצאה היא לא רק היעדר פירוט קולי חשוב, אלא גם תמונת סטריאו (Stereo Image) לא מדויקת בהשוואה לביצוע הקולי המקורי.


לעולם___ ___ את ___ ___ אם ___ רק ___ ___סיפור.

נסו לדמיין שאתם צריכים לתקשר כאשר ניתן לכם להשתמש רק באחת מכל שלוש מילים שרציתם לומר (קצת כמו במשפט למעלה). כמובן, שאף אחד לא יבין על מה אתם מדברים - מוחינו זקוק למידע נוסף לעבוד איתו. אותו הדבר לגבי סאונד, ועם קצבי דגימה פופולריים ב-PCM (במיוחד 44.1 קילו-הרץ ו-48 קילו-הרץ) חסר לנו, למעשה, הרבה יותר מידע מאשר הוסר מהמשפט למעלה! חוסר זה בפירוט מתורגם לחוסר בהירות וחוסר ”מובנות” (מלשון “מובן”. באנגלית ”Intelligibility”).


קצבי דגימה גבוהים יותר (שהם הרבה פחות בשימוש) כמו 176.4 קילו-הרץ ו-192 קילו-הרץ משפרים את העניינים במידה מסוימת, כמו גם ה-Direct Stream Digital PDM של סוני, אבל גם עם אלה, מידע חשוב הולך לאיבוד. לעולם לא תדע את כל האמת אם תשמע רק חלק מהסיפור.

עוד משהו פחות מורגש אבל ראוי לתזכורת, הוא מידע שאבד בגלל שגיאת קוונטיזציה - עיגול רמות המשרעת המתרחשת במהלך המרת מידע אנלוגי לדיגיטלי (או A/D). שגיאת עיגול זו גורמת לצורת גל מעוותת בעדינות, התורמת עוד יותר לחוסר בהירות ודיוק קולי.


אז מה הסיפור של “עיוות מסנן”?

כפי שהסברנו בשיעור יג (PCM למי שזוכר), כאשר צליל מוקלט לאודיו דיגיטלי בפורמט PCM, קיים מסנן מעבר נמוך (Low-Pass Filter) שמוחל לפני תהליך ההמרה (A/D Conversion). המטרה של מסנן זה - הנקרא מסנן החלקת עקומות (Anti-Aliasing Filter) - הוא להסיר כל תדר שמעל לתדר ה-Nyquist (כלומר התדר שהוא ½ מקצב הדגימה, והתדירות הגבוהה ביותר שניתן להקליט). מסנן זה יוצר כמות משמעותית של עיוות בתדרים הקרובים מאוד לתדר ה-Nyquist. במקרים מסוימים, במיוחד כאשר משתמשים בקצבי דגימה נמוכים, העיוות הזה יכול להשמע - במיוחד בצלילים שיש להם הרבה תוכן בתדר גבוה, כמו מצילתיים.


מאותה הסיבה, הפלט של כל DAC (באנגלית: Digital to Analog Conversion) דורש מסנן אנלוגי למעבר נמוך, הנקרא מסנן שחזור (באנגלית: Reconstruction Filter) - כי אות המוצא חייב להיות מוגבל ברוחב הפס, על מנת למנוע הדמייה (כלומר, מקדמי פורייה (באנגלית: Fourier Coefficients) משוחזרים מלאכותית כ"מראות" בתדרים הגבוהים).

הערה: סדרת פורייה היא הרחבה של פונקציה מחזורית לסכום של פונקציות טריגונומטריות. סדרות מספרי פורייה הן נושא מרתק, שהמעוניינות יכולות ללמוד עליו בוויקיפדיה.


ומה זה “רִיצּוּד”?

בואו נחשוב רגע על הפורמט הדיגיטלי הסטנדרטי ביותר, הנקרא אודיו "ספר אדום": אודיו PCM עם קצב דגימה של 44.1 קילו-הרץ ועומק דגימה של 16 ביט. בפורמט הספר האדום, יש 44,100 דגימות בשנייה, וכל מדגם מייצג 1/44,100 שניה. אפילו בקצב דגימה נמוך יחסית זה, זמן נחתך לפרוסות קטנות מאוד. חיתוך זמן זה נעשה על ידי רכיב אלקטרוני קטן אך חשוב הנקרא שעון דיגיטלי (נקרא לפעמים גם שעון-דגימה), המצוי בכל מכשיר אודיו דיגיטלי.


בעולם מושלם, כל אחת מפרוסות השניה הללו תהיה מרווחת בדיוק באופן שווה. במציאות עם זאת, אין שעון מושלם, מה שגורם לאי-סדירות בתזמון הדגימות. אי סדירות זאת נקראת “ריצוד” והיא תמיד קיימת במידה מסוימת - למרות שהמטרה היא לקבל ריצוד נמוך ככל האפשר, לא ניתן לייצר שעון ללא ריצוד כלל.


אי הדיוקים של ריצוד באים לידי ביטוי בשני חלקים של התהליך: כאשר האודיו האנלוגי עובר דיגיטציה (A/D) וכאשר האות הדיגיטלי מומר מחדש לאות חשמלי אנלוגי הנשלח לרמקול (D/A). כאשר אודיו מוקלט דיגיטלית, אות האודיו הנכנס נדגם בזמן הלא נכון בעקבות ריצוד, ונתונים שגויים אלה מאוחסנים באופן קבוע ובלתי הפיך במדיום האחסנה (בד”כ כונן קשיח). כדי למזער את השגיאות הללו, אולפני הקלטות משקיעים כסף רב בשעוני הדגימה המדויקים ביותר והריצוד הנמוך ביותר האפשרי, על מנת למזער את ההשפעות המזיקות הללו.


מכיוון שאות אודיו העובר דיגיטציה לא מדויק עקב ריצוד, גם אם תזמון ההשמעה יהיה מושלם, עדיין ייגרם נזק משמעותי - אבל כמובן, גם אין שעון מושלם להשמעה. זה אומר שגם בהשמעה הריצוד שוב יציג שגיאות, עם תזמון לא מדויק של אות האודיו הדיגיטלי. היקף הנזק הנוסף הזה תלוי באיכות השעון במכשיר ההשמעה - בד”כ, ככל שהחומרה זולה יותר, כך גדלה מידת ההשפעה של ריצוד.


ההשפעות של ריצוד נתפסות (בהכרה) במספר דרכים. העיוות של צורת הגל המקורית (במהלך דיגיטציה ובהשמעה) מפחיתה את בהירות האודיו, במיוחד בצלילים עם תדר גבוה, ומוסיפה איכות דמויית רעש לאות המקורי. כמו כן, כיוון שריצוד הוא זמני (טמפורלי) מטבעו ומתייחס לרזולוציה הטמפורלית שלנו כבני אדם (כפי שהסברנו בפרק ח), הוא יכול גם להשפיע על הרוחב והשקיפות של תמונת הסטריאו.


מתעללים בנו דיגיטלית

טוב, אז עכשיו כבר ברור שאודיו דיגיטלי מביא איתו ירידה באיכות הסאונד בעקבות הפגמים המובנים בתהליך הדיגיטציה וההשמעה. כאמור, בהקלטת סטודיו זה עשוי להיחשב כפשרה הכרחית ומוצדקת. עם זאת, בהופעות חיות ולייב-סאונד ברור שאם ניתן להימנע משעתוק אודיו בצורה נחותה זו, עדיף. אם זה עדיף, מדוע חלק מיצרני הרמקולים המקצועיים משתמשים בפורמטי PCM דיגיטליים מסורתיים?


בואו נדבר על מעבדי אותות דיגיטליים (DSP)

לכל המחשבים יש יחידת עיבוד מרכזית, הנקראת “המעבד המרכזי” (CPU). מנקודת מבט דִיגִיטָלית, מעבדי אותות דיגיטלים - או DSP (באנגלית: Digital Signal Processors) - דומים למעבדים מרכזיים במובנים רבים, עם הבדל אחד ברור: מעבד מרכזי (CPU) נועד לבצע מגוון רחב של משימות אריתמטיות וגם לנהל את החומרה במכשיר, אבל לשבב עיבוד האותות הדיגיטלי (DSP) יש עבודה הרבה יותר פשוטה, והיא לשנות את המספרים בזֶרֶם נתונים דיגיטליים. במילים אחרות, שבב ה-DSP הוא סוס העבודה של עולם האודיו הדיגיטלי.



חשוב לזכור שלמרות שהם בשימוש נפוץ בעיבוד אודיו, שבבי ה-DSP לא תוכננו באופן ייחודי למשימות אודיו. שבבי DSP מוקדמים פותחו בשנות ה-70 וה-80 של המאה הקודמת עבור תעשיית הטלקומוניקציה, כאשר שבב ה-DSP-1 של Bell Labs שימש להפרדת מידע מרעשי רקע. אפילו עכשיו, שבבי DSP משמשים למגוון רחב של יישומים, כולל עיבוד וידאו, סינתזה קולית, מכ"ם ועוד.


כאשר משתמשים בו לעיבוד אודיו דיגיטלי, המטרה של ה-DSP היא לשנות אות אודיו דיגיטלי ב”זמן אמת" ככל שניתן. עם זאת, תמיד תידרש מידה מסוימת של זמן לעיבוד, וכתוצאה מכך עיכוב של האות המופק, הנקראת הַשְׁהָיָיה (באנגלית: Latency). באולפן הקלטות, הַשְׁהָיָיה זו ניתנת לניהול, אבל בהופעה חיה או במצב השמעה אחר, הַשְׁהָיָיה יכולה לגרום לבעיות רציניות. במקרה של עיקוב זמן ליישור פאזה ברמקולים, בדרך כלל ניתן לעקוף את ההשהייה, אבל בשימוש בתהליכים אחרים (כמו אקווליזציה, למשל), ההַשְׁהָיָיה המושרת על ידי ה-DSP תתבטא באי התאמה בתזמון בין האות המקורי לבין הפלט המעובד.


בנוסף, בשל העיצוב הגנרי שלו, עיבוד DSP יציג לעתים קרובות שגיאות קוונטיזציה נוספות עקב קיטום (באנגלית: Truncation) - פונקציה שלוקחת מספר ממשי ו"מקצצת" את החלק השברי שלו ומשאירה רק את החלק השלם. זה מסתכם בכמויות קטנות של שגיאות עיגול בעקבות כל תהליך. בנפרד, שגיאות אלה הן די קטנות, אך כאשר מספר תהליכים נעשים בסדרה, השגיאות הללו מצטברות ויכולות להחמיר במהירות, וכך להפוך לנשמעות.


הכלי הלא נכון לתפקיד: מעבד לרמקול

בתעשיית ההופעות החיות והלייב סאונד, נעשה שימוש נרחב בעיבוד DSP. רוב העיבוד הזה משמש לפיצוי על חולשות בעיצוב הרמקולים ופגמים אחרים במוצר. יצרנים רבים מסתמכים על עיבוד DSP כדי להחיל פילטרים, אקווליזציה, השהייה, דינמיקה (כמו מדחסים ומגבילים), ועוד, במאמץ לפתור בעיות קוליות במערכות שלהם. עם זאת, כשמביאים בחשבון שעיבוד DSP המבוסס על PCM מביא איתו את הדברים הבאים:


1. בהמרה אנלוגית לדיגיטלית

• עיוות בתדר גבוה עקב מסנן החלקת עקומות

• חוסר במידע עקב שיעורי דגימה לא מספקים

• שגיאות במדידת משרעת עקב שגיאת קוונטיזציה

• שגיאות בתזמון עקב ריצוד

• השהייה עקב דיגיטציה


2. בעיבוד אותות דיגיטלי (DSP)

• השהייה עקב זמן העיבוד הנדרש

• שגיאות נתונים שנוצרו על ידי קוונטיזציה וחיתוך

3. בהמרה דיגיטלית לאנלוגית

• שגיאות בתזמון עקב ריצוד

• השהייה עקב מסנן שחזור


ברור שכל ניסיון לפתור בעיות קוליות באמצעות עיבוד DSP תמיד יגרום לבעיות אחרות, שכן עצם תהליך ההמרה ל-PCM פוגע באיכות הצליל. עם כל תהליך DSP נוסף, עוד בהירות קולית אובדת באופן בלתי הפיך, וכל ניסיון לתיקון בסופו של דבר מביא להתרחקות מהמטרה הבסיסית של שקיפות קולית.


האם יש מקום מקום לאודיו דיגיטלי?

באולפן הקלטות, אודיו דיגיטלי הוא כלי שלא יסולא בפז. בעולם ה"אמיתי", מדיה דיגיטלית מכל הסוגים ממלאת תפקיד מרכזי בהפצה וצריכה המונית של אודיו וווידאו. אוּלָם, ככל שזה מגיע למימוש המטרה של איכות שמע טהורה, הפורמטים הדיגיטליים המסורתיים פשוט אינם מספיקים. מה שמחמיר את המצב עוד, הוא עיבוד DSP מוגזם על ידי יצרנים לטיפול ספציפי בבעיות, שפוגע עוד יותר באיכות הכללית של חווית ההאזנה.


עם זאת, נכונה הטענה שלא כל תהליכי ה-DSP הרסניים באותה המידה.

לדוגמה, שימוש בעיבוד אודיו דיגיטלי לעיקוב רמקולים (שלא משנה את איכות האודיו של הצליל, אלא רק מעביר את האות מאוחר יותר בזמן) אינו גורם נזק לאיכות הקולית בפני עצמו, אלא שאפילו במקרה הזה, הירידה ההרסנית באיכות המלווה המרה דיגיטלית מסורתית עדיין מתרחשת.


נכון, לא כל הפורמטים הדיגיטליים הרסניים באותה מידה. בתרחיש של הופעה חיה ולייב סאונד, איפנון צפיפות דופק (PDM), משמר הרבה יותר פרטים מאשר מקבילו איפנון קוד פעימה (PCM), למרות שקשה יותר להשתמש בו. אם המטרה העליונה היא שמירה על נאמנות למקור, הבחירה ברורה - שימוש ב-PDM ככל שזה אפשרי. עם זאת, שוב, ירידה מסוימת באיכות הקולית היא בלתי נמנעת בפורמטים המסורתיים של PDM.


נשאלת השאלה: ”האם אין מצב שבו ניתן לנצל את העוצמה של האודיו הדיגיטלי מבלי לרשת את החסרונות הקוליים שלו?” התשובה היא כן, אבל את ההסבר נשמור לאחד הפוסטים הבאים.







Comments


bottom of page