top of page

על שמיעה, סאונד, ומה שמסביבם - פרק יג: PCM

  • Writer: תמיר בראליה
    תמיר בראליה
  • Dec 21, 2025
  • 4 min read

בפעם שעברה הצגתי מבוא קצר לאודיו דיגיטלי, ודיברנו על איך כל האודיו הדיגטלי שאנחנו שומעים מקודד באפנון קוד פעימה (Pulse Code Modulation)- הידוע כ-PCM, או אפנון צפיפות דופק (Pulse Density Modulation) - הידוע כ-PDM, והבטחתי להסביר עליהם, אז הנה, מתחילים ב-PCM.


אפנון קוד פעימה (Pulse Code Modulation)

רוב האודיו שאנחנו שומעים בחיי היומיום שלנו' וכנראה כל האודיו ברוב הימים, נופל לתוך הקטגוריה של אפנון קוד פעימה (Pulse Code Modulation), או בקיצור PCM. אפשר לחשוב על הפורמט הזה כעל מחרוזת ספציפית של מדידות המושמעות יחד ברצף מהיר, כדי לייצר אות אודיו. כיוון שכל אות בדיד במדידה נקרא דגימה, בואו נסתכל רגע על דגימות.


על דגימות וקצב דגימה

המונח דגימה משמש במספר דרכים בעולם האודיו. כאשר משתמשים במונח בהקשר של אודיו דיגיטלי PCM, ניתן להגדיר דגימה כמדידה מיידית/יחידנית של אות אודיו. דגימה מודדת דבר אחד בלבד, והוא המשרעת (האמפליטודה) של אות האודיו ברגע מסוים בזמן. דגימה בודדת לבדה אינה מספקת מספיק מידע כדי שנוכל להקליט או לשחזר צליל. מה שדרוש לנו הוא מספר דגימות מסודרות באופן שווה בזמן, על מנת לשחזר מחדש צליל כראוי.


בתמונה מטה, אפשר לראות גל סינוס עם כל דגימה מסומנת. בנפרד, כל דגימה מייצגת רק ערך משרעת, אבל ביחד הן יכולות לייצג צורת גל שלמה.



מספר הדגימות בשנייה נקרא קצב דגימה. קצב הדגימה נמדד בהרץ (Hz) ובקילוהרץ (kHz). כמה משיעורי הדגימה השונים שנמצאים בשימוש פופולרי הם:

• 44.1 קילו-הרץ (44,100 דגימות בשנייה)

• 48 קילו-הרץ (48,000 דגימות בשנייה)

• 88.2 קילו-הרץ (88,200 דגימות בשנייה)

• 96 קילו-הרץ (96,000 דגימות בשנייה)

• 176.4 קילו-הרץ (176,400 דגימות בשנייה)

• 192 קילו-הרץ (192,000 דגימות בשנייה)

אבל מהו קצב הדגימה הטוב ביותר לשימוש? אם נכנס לאינטרנט ונחפש, נמצא מגוון רחב של דעות. בואו נעיף מבט קצר על המתמטיקה מאחורי שיעורי הדגימה כדי למצוא את התשובה.


תאוריית קצב הדגימה מוצאת את שורשיה אצל מתמטיקאי בשם הארי ניקוויסט, אחד האבות של האודיו הדיגיטלי וממציא עיקרון שנקרא משפט ניקוויסט. במילים פשוטות, משפט ניקוויסט קובע שכדי להשתמש באודיו דיגיטלי להקלטה או שחזור צליל, קצב הדגימה חייב להיות לפחות פי שניים מהתדר הגבוה ביותר של הצליל הזה. במילים אחרות, צריך לפחות דגימה אחת בכל שלב דחיסה, ודגימה אחת בכל שלב קלישה.


אם נעשה את החשבון, בהתחשב בכך שהתדר הגבוה ביותר שאדם יכול לשמוע הוא 20 קילו-הרץ, ואנחנו צריכים לפחות שתי דגימות בכל מחזור, אז קצב דגימה של 44.1 קילו-הרץ צריך להיות די והותר, נכון?


ובכן, יש עוד חלק בפאזל הזה: כשצליל מוקלט בצורה דיגיטלית, יש כמות קטנה של עיוות בתדרים הקרובים מאוד לתדר הניקוויסט (התדר שהוא ½ של קצב הדגימה, והתדירות הגבוהה ביותר שניתן לרשום במדויק: סף הדגימה). במקרים מסוימים, העיוות הזה בתדרים הגבוהים נוכח ונשמע - במיוחד עם צלילים שיש להם הרבה מאוד תוכן בתדר גבוה, כמו מצילתיים. מסיבה זו, רבים מאיתנו יבחרו בשיעורי דגימה גבוהים יותר כדי לשמר את הבהירות של התדרים גבוהים.


על עומק סיביות (Bit Depth)

כל דגימה מורכבת ממספר סיביות (הידועים כ”ביטים”)- מונח זה ידוע בתור עומק הסיביות (Bit Depth) של האודיו הדיגיטלי. הקטעים האלה הן הספרות בפועל שכל דגימה משתמשת בהן כדי לאחסן את מדידת המשרעת שלה. יש מספר של עומקי סיביות שונים המשמשים באודיו דיגיטלי מודרני, כשהשימוש הנפוץ ביותר הוא 16-bit ו-24-bit.


בדיוק כפי שקצב הדגימה מתייחס לתדירות ולזמן, עומק הסיביות (Bit Depth) מתייחס למשרעת (אמפליטודה) ולטווח הדינמי. אם תביטו על התמונה מטה, תראו איך זה עובד:


בתמונה אפשר לראות כיצד מדידת המשרעת של כל דגימה מעוגלת לצעד האנכי הקרוב ביותר. עיגול זה יציג מדידה שגויה (הנקראת שגיאת קוונטיזציה), אשר בתורה תציג אי דיוקים כאשר הצליל מוקלט ותגרום לצליל משוחזר בעיוות.



לשם הפשטות, הדוגמה שבתמונה מציגה רק 16 מרווחי מדידה דיסקרטיים, מה שתואם לאודיו דיגיטלי של 4-Bit (שהם 2 בחזקת 4). מספר ה”ביטים” בעומק-ביט, מייצג את מספר החזקה של שתיים). לכן ב-16-Bit יש 65,536 ערכים נפרדים אפשריים (2 בחזקת 16), ול-24-Bit יש 16,777,216 ערכים בדידים (2 בחזקת 24).


בגלל האופי של מתמטיקה בינארית, כל ביט שמתווסף לעומק הדגימה מכפיל את הערכים המקסימליים האפשריים, ומצמצם את שגיאת הקוונטיזציה בחצי ביחס לאות האודיו הכולל. עם זאת, בלי קשר לעומק הביט שנשתמש בו, תמיד ישנה מידה מסוימת של שגיאת קוונטיזציה, ולכן תמיד ישנה מידת מה של עיוות מאות השמע המקורי.


יש מתמטיקה שימושית ביותר - ולמרבה המזל גם פשוטה - הקשורה לעומק הדגימה (Bit Depth):

כל עומק דגימה (המבוטא כחזקה של 2) מניב בערך 6dB של טווח דינמי.

אז אם נחשב אודיו של 16 ביט, זה יוצא טווח דינמי של 96dB (שהם 16x6=96).

זה ללא ספק טווח דינמי הגון, ועולה באופן משמעותי על הקלטת מדיה אנלוגית כמו קלטת (קסטה של פעם), אבל הוא ממש לא מכסה את כל טווח השמיעה האנושי (טווח דינמי אנושי הוא 120 dB). אודיו של 24 ביט מכסה את הטווח הדינמי הנשמע ועוד, עם טווח דינמי של 144dB (שהם 24x6=144).


היתרונות העיקריים של אפנון קוד פעימה (Pulse Code Modulation) כפורמט שמע דיגיטלי הם עלות וקלות השימוש בחישובים לעיבוד האותות (עצם השימוש בדגימות נפרדות על מנת לייצר אות אודיו, מקל את עבודת העריכה של האודיו, שכן אין בעייה לקטוע את רצף הדגימות בכל מקום נתון). מסיבות אלה, PCM אומץ באופן נרחב למרות שהוא עושה הנחות משמעותיות לאיכות האודיו המוקלט והמשוכפל.


על החסרונות הטבועים בפורמט ה-PCM וכיצד הם משפיעים לרעה על חווית המאזין, נדבר בפוסטים הבאים, בהם גם נסקור את פורמט ה-PDM ונראה מה ההבדל בין השניים





Comments


bottom of page