PDFSub
תמחורMergeSplitCompressEditE-Signדפי חשבון
חזרה לבלוג
מדריךאקסלטבלאותכלי PDF

כיצד לחלץ טבלאות מ-PDF לאקסל: 5 שיטות בהשוואה

28 בפברואר 2026
PDFSub Team

קבצי PDF מאחסנים טבלאות כפרגמנטים של טקסט מפוזרים במיקומי x,y — ללא שורות, ללא עמודות, ללא תאים. כך תוכלו להכניס את הנתונים הללו לגיליון אלקטרוני, החל מכלי דפדפן חינמיים ועד סקריפטים של Python.


PDFתאריךתיאורסכום01/15Payment Recv$1,250.0001/16Office Supply-$85.0001/18Wire Transfer$3,400.0001/20Utility Bill-$142.5001/22Client Inv$2,100.00חלץאקסלABCD1234567תאריךתיאורסכוםBalance01/15/2026Payment Recv$1,250.00$5,25001/16/2026Office Supply-$85.00$5,16501/18/2026Wire Transfer$3,400.00$8,56501/20/2026Utility Bill-$142.50$8,42301/22/2026Client Inv$2,100.00$10,523חלץ טבלאות מ-PDF לאקסלזהה וחלץ נתוני טבלה מובנים באופן אוטומטי

יש לכם קובץ PDF עם טבלה שאתם צריכים באקסל. אולי זהו דוח פיננסי, דפי חשבון בנק, חשבונית או מאמר מחקר. הנתונים שם — מאורגנים בצורה מסודרת בשורות ובעמודות על המסך. אבל כשאתם מנסים להוציא אותם, הכל מתפרק.

זה קורה מכיוון ש-PDF אינו פורמט נתונים. זהו פורמט תצוגה. אין מושג של "טבלה", "שורה" או "עמודה" במפרט ה-PDF. מה שנראה כמו טבלה מובנית הוא למעשה עשרות פרגמנטים של טקסט המוצבים במיקומי x,y ספציפיים על קנבס. חילוץ המבנה הזה בחזרה לגיליון אלקטרוני הוא בעיית הנדסה הפוכה — וכלים שונים מטפלים בכך בהצלחות משתנות.

מדריך זה מכסה 5 שיטות לחילוץ טבלאות מקבצי PDF, מתי כל אחת מהן עובדת הכי טוב, ומה לעשות כשדברים משתבשים.

למה חילוץ טבלאות מ-PDF הוא קשה

5 Methods for Extracting PDF Tables to ExcelAccuracy comparison across table types — choose the right tool for your PDFMethodBordered TablesBorderless TablesScanned PDFsCostPDFSub (Free+AI)★90–99%75–95%85–95%FreePower Query85–95%40–60%N/A$0 (built-in)Adobe Acrobat90–95%70–80%80–90%$240/yrTabula/Camelot68–73%55–75%N/AFreeCopy-Paste30–50%10–30%0%FreeHigh (80%+)Medium (50–79%)Low (<50%)Not supported★ Recommended for sensitive financial data

לפורמט PDF אין טבלאות

מפרט ה-PDF (ISO 32000-2:2020) מגדיר זרם תוכן — רצף של פקודות הממקמות תווים בודדים במיקומים מדויקים. שורת טבלה פשוטה כמו "תאריך | תיאור | סכום" עשויה להיות מאוחסנת כך:

BT /F1 10 Tf 72 650 Td (01/15/2026) Tj 200 0 Td (Office Supplies) Tj 180 0 Td (125.00) Tj ET

אין תגיות <table>, <tr> או <td>. אין מזהי שורות. אין גבולות עמודות. הקווים הוויזואליים שאתם רואים סביב תאים הם פעולות ציור נפרדות המנותקות לחלוטין מהטקסט. כלי חילוץ חייב להסיק את המבנה כולו מיחסים מרחביים.

שלוש סוגי גבולות טבלה

טבלאות עם גבולות (Lattice) כוללות קווים נראים סביב כל תא. אלו הן הקלות ביותר לחילוץ מכיוון שהקווים מגדירים במפורש את גבולות התאים. נפוץ בדוחות פיננסיים רשמיים, טפסים ממשלתיים ודוחות סטנדרטיים.

טבלאות ללא גבולות (Stream) אינן כוללות קווים כלל. המבנה מוגדר כולו על ידי יישור רווחים — פריטי טקסט החולקים קואורדינטות x עקביות בין שורות יוצרים עמודות משתמעות. נפוץ במאמרי מחקר, חשבוניות וקטלוגי מוצרים.

טבלאות חצי-גבולות כוללות רק גבולות חלקיים — בדרך כלל קווים אופקיים בין מקטעים אך ללא מפרידים אנכיים. נפוץ ביותר בדפי חשבון בנק, דוחות ברוקרים וחשבונות שירות. אלו הן הקשות ביותר לחילוץ מכיוון שגבולות חלקיים מטעים מנתחי מצב Lattice ומחסור בגבולות מפחית את הביטחון של מצב Stream.

PDF מתויגים לעומת לא מתויגים

PDFs מתויגים כוללים מטא-דאטה מבני המזהה כותרות, פסקאות ותאי טבלה. ל-PDFs לא מתויגים אין דבר מזה — כלי החילוץ מקבל רק קואורדינטות גולמיות. הרוב המכריע של קבצי PDF אינם מתויגים, כולל כמעט כל דפי חשבון בנק, חשבוניות ודוחות פיננסיים.


שיטה 1: PDFSub חילוץ טבלאות (חינם + גיבוי AI)

כלי חילוץ טבלאות של PDFSub משתמש בגישה תלת-שכבתית הממקסמת דיוק תוך מזעור עלות:

שכבה 1: זיהוי מבוסס קואורדינטות (דפדפן, חינם)

הכלי מנסה תחילה חילוץ כולו בדפדפן שלכם:

  • מנתח את זרם התוכן של ה-PDF כדי לחלץ כל פריט טקסט עם קואורדינטות x,y שלו
  • מקבץ פריטי טקסט לשורות על בסיס קרבת קואורדינטות y
  • מנתח דפוסי יישור קואורדינטות x בין שורות כדי לזהות גבולות עמודות
  • דורש מינימום 3 שורות, 2 עמודות ו-70%+ ביטחון

אם נמצאות טבלאות טובות, אתם מקבלים נתונים מובנים באופן מיידי — אין העלאת שרת, אין צריכת קרדיטים של AI, והקובץ שלכם לעולם לא עוזב את המכשיר שלכם.

שכבה 2: חילוץ בצד השרת (pdfplumber, חינם)

אם זיהוי מבוסס קואורדינטות לא מוצא טבלאות, הכלי משתמש ב-pdfplumber (רישיון MIT) בשרת. זה מזהה גם קווים מפורשים (גבולות מצוירים) וגם קווים משתמעים (דפוסי יישור מילים), מוצא הצטלבויות, מזהה מלבנים וממפה טקסט לתאים.

שכבה 3: חילוץ AI (משתמש בקרדיטים)

עבור PDF סרוקים, פריסות מורכבות, או טבלאות שכלי מבוסס-כללים אינם יכולים לנתח, הכלי חוזר לשימוש בראייה מבוססת AI. אתם יכולים גם להפעיל "כוח חילוץ AI" כדי לדלג ישירות לשכבה זו כאשר אתם יודעים שהטבלה מורכבת.

פורמטי פלט: אקסל (.xlsx), CSV, JSON.

הכי טוב עבור: חילוץ מהיר ללא צורך בהתקנת תוכנה. קבצי PDF דיגיטליים מעובדים במלואם בדפדפן שלכם לפרטיות מקסימלית.


שיטה 2: Power Query באקסל (Windows בלבד)

זמין באקסל 2019+ ו-Microsoft 365 ב-Windows: נתונים → קבל נתונים → מקובץ → מ-PDF.

איך זה עובד

  1. לחצו על נתונים → קבל נתונים → מקובץ → מ-PDF
  2. בחרו את קובץ ה-PDF שלכם
  3. Power Query מציג חלונית Navigator המפרטת טבלאות מזוהות בכל עמוד
  4. בחרו את הטבלאות שאתם רוצים, לחצו על המר נתונים כדי לנקות, ואז טען

יתרונות

  • מובנה באקסל — אין עלות נוספת למנויי Microsoft 365
  • מנוע הטרנספורמציה של Power Query מטפל בעיבוד-לאחר מכן היטב (מילוי למטה, ציר, מיזוג עמודות)
  • יכול לרענן נתונים אם ה-PDF המקור מתעדכן
  • תומך בחיבור מספר טבלאות מאותו PDF

מגבלות

  • Windows בלבד — לא זמין באקסל עבור Mac, אקסל Online, או מובייל
  • מתקשה עם טבלאות ללא גבולות — עובד הכי טוב עם טבלאות עם גבולות ברורים
  • אין OCR — לא יכול לחלץ מקבצי PDF סרוקים/תמונה
  • טבלאות מרובות עמודים בעייתיות — כל עמוד מיובא לעיתים קרובות כטבלה נפרדת, הדורשת חיבור ידני
  • שורות מרובות שורות — טקסט עטוף בתוך תאים לעיתים קרובות מתפצל למספר שורות, הדורש ניקוי

הכי טוב עבור: משתמשי Windows עם Microsoft 365 שיש להם טבלאות פשוטות עם גבולות.


שיטה 3: Adobe Acrobat (בתשלום)

קובץ → ייצא PDF → גיליון אלקטרוני → Microsoft Excel Workbook

תמחור (2026)

  • Acrobat Standard: $12.99 לחודש (תוכנית שנתית)
  • Acrobat Pro: $19.99 לחודש (תוכנית שנתית)
  • Export PDF (עצמאי): תוכנית זולה יותר להמרה בלבד

יתרונות

  • OCR מובנה למסמכים סרוקים
  • בדרך כלל שומר על עיצוב עבור טבלאות פשוטות עם גבולות
  • עיבוד אצווה זמין ב-Pro

מגבלות

  • יקר עבור חילוץ טבלאות בלבד — $156–$240 לשנה
  • טבלאות מורכבות עם תאים ממוזגים וטווחים מרובי עמודים עדיין מייצרות פלט לא מסודר
  • קבצים עשויים להיות מועלים לענן של Adobe לעיבוד — בעייתי עבור נתונים פיננסיים רגישים
  • דורש התקנה על שולחן העבודה

הכי טוב עבור: משתמשים שכבר משלמים עבור Acrobat Pro וזקוקים לייצוא טבלאות מדי פעם עם OCR.


שיטה 4: העתק-הדבק (ידני)

הגישה האינטואיטיבית ביותר — והזו שנכשלת הכי הרבה פעמים עבור טבלאות.

בעיות נפוצות

  • כל הנתונים בעמודה אחת — הטבלה כולה מודבקת ללא חלוקות עמודות
  • מספרים הופכים לטקסט — סמלי מטבע, סוגריים ומפרידים שוברים עיצוב מספרי
  • תוכן תא מרובה שורות יוצר שורות רפאים — תיאור שעוטף בשתי שורות בתא הופך לשתי שורות נפרדות
  • כותרות מופרדות מנתונים — שורת הכותרת מתנתקת
  • עמודות לא מסודרות — נתונים זזים מכיוון שרווח התווים אינו מתורגם לטאבים

פתרון חלקי

הדביקו לאקסל, ואז השתמשו בנתונים → טקסט לעמודות עם מפרידי רווח או רוחב קבוע. הפעילו "התייחס למפרידים עוקבים כאחד". זה עובד עבור טבלאות פשוטות מאוד ומרווחות היטב אך נכשל עבור כל דבר עם תוכן תא מרובה מילים.

הכי טוב עבור: חילוץ טבלה קטנה ופשוטה אחת כמוצא אחרון.


שיטה 5: ספריות Python (למפתחים)

שלוש ספריות ברישיון MIT מטפלות בחילוץ טבלאות PDF באופן פרוגרמטי:

Tabula-py

עטיפת Python סביב Tabula (Java). דורש סביבת Java.

  • מצב Lattice עבור טבלאות עם גבולות (מוצא קווים והצטלבויות)
  • מצב Stream עבור טבלאות ללא גבולות (משתמש ביישור טקסט)
  • טוב לעיבוד אצווה בסקריפטים
  • אין תמיכה ב-OCR

Camelot

מציע גם מצבי Lattice ו-Stream.

  • בדרך כלל עולה בביצועיו על Tabula עבור טבלאות עם גבולות
  • מצב Stream כולל יותר פרמטרים להגדרה עדינה
  • מספק דוחות דיוק עם כל חילוץ
  • דורש תלות ב-Ghostscript. אין תמיכה ב-OCR

pdfplumber

גישה מבוססת קואורדינטות: מחלץ כל תו עם מיקומו המדויק, ואז מסיק מבנה.

  • מטפל במגוון הרחב ביותר של סוגי טבלאות
  • נותן את השליטה הגדולה ביותר אך דורש יותר הגדרה
  • זוהי הספרייה ש-PDFSub משתמש בה בצד השרת
  • אין תמיכה ב-OCR

הכי טוב עבור: מפתחים המבצעים אוטומציה של זרימות עבודה של חילוץ טבלאות חוזרות, מעבדים אצוות גדולות של מסמכים דומים.


בעיות נפוצות וכיצד לפתור אותן

תאים ממוזגים

כאשר תאים משתרעים על פני מספר שורות או עמודות, רוב הכלים או מציבים את התוכן בתא השמאלי העליון ומשאירים את האחרים ריקים, או שאינם מסדרים את כל העמודות הבאות. אין פתרון אוניברסלי — פורמט CSV אינו מכיל מושג של מיזוג, כך שמידע מיזוג תמיד אובד.

תיקון: חלצו את הטבלה, ואז תקנו ידנית ארטיפקטים של מיזוג באקסל. עבור טבלאות חוזרות עם אותו דפוס מיזוג, שקלו סקריפט עיבוד-לאחר מכן.

תוכן מרובה שורות בתוך תאים

תיאורים ארוכים שעוטפים בתוך תא הופכים לשורות מרובות בפלט, ודוחפים את כל הנתונים הבאים מחוץ לסדר. זוהי שגיאת החילוץ הנפוצה ביותר עבור מסמכים פיננסיים.

תיקון: לאחר החילוץ, חפשו שורות שחסרות להן תאריכים וסכומים — אלו הן כנראה שורות המשך השייכות לשורה שמעליהן. באקסל, מזגו אותן ידנית או השתמשו בנוסחת עזר.

טבלאות המשתרעות על פני מספר עמודים

כלים חייבים לקבוע היכן הטבלה ממשיכה, האם להסיר כותרות חוזרות, וכיצד לסנן כותרות תחתונות של עמוד. כלים רבים מתייחסים לכל עמוד באופן עצמאי.

תיקון: אם הכלי שלכם מספק תוצאות לפי עמוד, חברו את הגיליונות והסירו שורות כותרת חוזרות. בדקו שהשורה האחרונה בעמוד N מתחברת כראוי לשורה הראשונה בעמוד N+1.

בעיות עיצוב מספרים

מספרים שליליים בסוגריים ((1,234.56)) מודבקים כטקסט, לא כמספרים. סמלי מטבע ומפרידי אלפים גם שוברים עיצוב מספרי.

תיקון: לאחר החילוץ, בחרו את עמודת הסכום והשתמשו ב"חפש והחלף" כדי להסיר תווים של $, (, ). ואז עצבו את העמודה כמספר. עבור שליליים בסוגריים, החליפו ( ב-- והסירו ), ואז המירו לפורמט מספר.

עמימות תאריכים

01/02/2026 — האם זה ה-2 בינואר או ה-1 בפברואר? כלי החילוץ שומר על המחרוזת כפי שהיא, אך אקסל עשוי לפרש אותה מחדש בהתאם לאזור שלכם.

תיקון: בדקו את קובץ ה-PDF המקורי לרמזים לגבי פורמט התאריך (חפשו תאריכים עם ערכי יום > 12). הגדירו את פורמט התאריך של אקסל כך שיתאים למקור לפני הייבוא.


השוואת דיוק

שיטה עם גבולות פשוט ללא גבולות חצי-גבולות PDF סרוקים
PDFSub (קואורדינטות + AI) 90–99% 75–95% 70–95% 85–95% (AI)
Power Query 85–95% 40–60% 50–70% לא נתמך
Adobe Acrobat 90–95% 70–80% 70–85% 80–90%
Tabula ~68% 55–70% 50–65% לא נתמך
Camelot ~73% 65–75% 60–70% לא נתמך
העתק-הדבק 30–50% 10–30% 10–30% לא אפשרי

טווחים משקפים שונות בין מורכבות המסמכים. נתוני בנצ'מרק מתוך מחקרי Procyons 2025 PDF Extraction Benchmark ו-Camelot.


באיזו שיטה כדאי להשתמש?

תרחיש השיטה הטובה ביותר למה
חילוץ מהיר חד-פעמי PDFSub אין התקנה, מבוסס דפדפן, חילוץ קואורדינטות חינם
טבלה פשוטה עם גבולות, Windows Power Query מובנה באקסל, ללא עלות נוספת
PDF סרוק PDFSub (AI) או Adobe Acrobat דורש יכולת OCR
נתונים פיננסיים רגישים PDFSub עיבוד מבוסס דפדפן, הקובץ לעולם לא מועלה
עיבוד אצווה חוזר Python (pdfplumber) ניתן לסקריפטים, אוטומטי
כבר יש Acrobat Pro Adobe Acrobat כבר משלמים, טבלאות פשוטות עובדות היטב
טבלה קטנה בודדת, ללא כלים העתק-הדבק מוצא אחרון, יש לוודא הכל

טיפים לתוצאות מיטביות

השתמשו ב-PDFs מקוריים. הורידו מסמכים ממקורם במקום לסרוק נייר. קבצי PDF מקוריים מכילים טקסט מושלם, מה שהופך את החילוץ למדויק יותר באופן דרמטי.

זהו תחילה את סוג הטבלה. טבלאות עם גבולות עובדות עם כמעט כל כלי. טבלאות ללא גבולות דורשות מצב Stream או חילוץ AI. ידיעת הסוג עוזרת לכם לבחור את השיטה הנכונה מראש.

התחילו עם שיטות חינמיות מבוססות-כללים. נסו קודם חילוץ מבוסס קואורדינטות. רק אז הסלימו ל-AI כאשר שיטות מבוססות-כללים מפיקות תוצאות גרועות — זה חוסך זמן וקרדיטים.

תמיד ודאו את הפלט. בדקו את ספירת השורות, יישור העמודות, ערכים מספריים וסכומים. לעולם אל תסמכו על פלט חילוץ באופן עיוור.

שימו לב לעיצוב מספרים. לאחר החילוץ, ודאו שמספרים הם אכן מספרים באקסל (מיושרים לימין), לא מחרוזות טקסט (מיושרים לשמאל). סמלי מטבע ושליליים בסוגריים הם אשמים נפוצים.

עבור נתונים רגישים, העדיפו כלים מבוססי דפדפן. דוחות פיננסיים, דפי חשבון בנק ומסמכי מס מכילים מידע רגיש. כלים המעבדים קבצי PDF בדפדפן שלכם לעולם אינם מעלים את הקובץ שלכם, מה שמבטל את הסיכון לחשיפת נתונים.


נסו בחינם

מוכנים לחלץ טבלאות מה-PDF שלכם? העלו קובץ עכשיו — PDFSub מנסה תחילה חילוץ מבוסס קואורדינטות חינם, עם גיבוי AI לטבלאות מורכבות. קבצי PDF דיגיטליים מעובדים במלואם בדפדפן שלכם. התחילו תקופת ניסיון בחינם של 7 ימים.

חזרה לבלוג

יש לכם שאלות? צרו קשר

PDFSub

כל כלי ה-PDF והמסמכים שאתם צריכים במקום אחד. מהיר, מאובטח ופרטי.

תואם GDPRתואם CCPASOC 2 Ready
Powered by PDFSub Engine

כלי PDF

  • מיזוג PDF
  • פיצול PDF
  • שינוי סדר עמודים
  • סיבוב PDF
  • מחיקת עמודים
  • חילוץ עמודים
  • הוספת סימן מים
  • עריכת PDF
  • הוספת חותמת
  • מילוי טפסי PDF
  • חיתוך עמודים
  • שינוי גודל עמוד
  • הוספת מספרי עמודים
  • כותרות עליונות ותחתונות
  • דחיסת PDF
  • הפיכה לניתן לחיפוש
  • Clean Scanned PDF
  • Photo to Document
  • Auto-Crop PDF
  • תיקון PDF
  • עריכת מטא-דאטה
  • הסרת מטא-דאטה
  • PDF ל-Word
  • Word ל-PDF
  • Excel ל-PDF
  • PDF ל-PowerPoint
  • PDF לתמונה
  • תמונה ל-PDF
  • HTML ל-PDF
  • HEIC לתמונה
  • WEBP ל-JPG
  • WEBP ל-PNG
  • PowerPoint ל-PDF
  • PDF ל-HTML
  • EPUB ל-PDF
  • TIFF ל-PDF
  • PNG ל-PDF
  • PDF ל-PNG
  • טקסט ל-PDF
  • SVG ל-PDF
  • WEBP ל-PDF
  • PDF ל-EPUB
  • RTF ל-PDF
  • ODT ל-PDF
  • ODS ל-PDF
  • PDF ל-ODT
  • PDF ל-ODS
  • PDF ל-SVG
  • PDF ל-RTF
  • PDF לטקסט
  • ODP ל-PDF
  • PDF ל-ODP
  • ODG ל-PDF
  • צופה PDF
  • המרת PDF/A
  • יצירת PDF
  • המרת קבצים בקבוצה
  • מספר עמודים בדף
  • הגנה בסיסמה
  • שחרור נעילת PDF
  • הסתרת מידע רגיש
  • חתימה אלקטרונית
  • השוואת קבצי PDF
  • חילוץ טבלאות
  • PDF to Excel
  • ממיר דפי חשבון בנק
  • מחלץ נתונים מחשבוניות
  • סורק קבלות
  • ניתוח דוחות כספיים
  • OCR - חילוץ טקסט
  • המרת כתב יד
  • סיכום PDF
  • תרגום PDF
  • צ'אט עם PDF
  • חילוץ נתונים
  • סטודיו לעיצוב

מוצר

  • Privacy & Security
  • כל הכלים
  • תכונות
  • דפי חשבון
  • תמחור
  • שאלות ותשובות
  • בלוג

תמיכה

  • מרכז עזרה
  • צור קשר
  • שאלות ותשובות

משפטי

  • מדיניות פרטיות
  • תנאי שימוש
  • מדיניות קבצי Cookie

© 2026 PDFSub. כל הזכויות שמורות.

נוצר באמריקה עם עבור אנשים בכל מקום