PDFSub
الأسعارAPIMergeCompressEditE-Signكشوفات الحساب البنكيةالمدونة
العودة إلى المدونة
دليلذكاء اصطناعيتقارير سنويةاستخراج البياناتتحليل مالي

استخراج المقاييس الرئيسية من التقارير السنوية تلقائيًا

2 مارس 2026
T
Todd Lahman
Founder, PDFSub

تُخفي التقارير السنوية البيانات المالية الهامة داخل ملفات PDF مكونة من 100-300 صفحة. إليك كيفية استخراج الإيرادات وصافي الدخل ونصيب السهم من الأرباح والتدفق النقدي والمقاييس الرئيسية الأخرى دون نسخ الأرقام يدويًا من الجداول إلى جداول البيانات.


لقد قمت للتو بتنزيل تقرير سنوي مكون من 247 صفحة. في مكان ما بداخله توجد الأرقام الاثني عشر التي تحتاجها بالفعل: الإيرادات، صافي الدخل، نصيب السهم من الأرباح، إجمالي الأصول، إجمالي الالتزامات، التدفق النقدي التشغيلي، الأرباح قبل خصم الفوائد والضرائب والإهلاك والاستهلاك (EBITDA)، ومجموعة من الهوامش. الباقي هو نص قياسي، وإفصاحات قانونية، وصور مخزون لموظفين مبتسمين.

العثور على هذه الأرقام ليس هو الجزء الصعب. إنها موجودة في قسم البيانات المالية، وعادة ما تبدأ حوالي الصفحة 80. الجزء الصعب هو استخراجها من ملف PDF ووضعها في نموذجك بتنسيق يمكنك العمل به بالفعل. ثم القيام بذلك مرة أخرى للشركات العشرين التالية في نطاق تغطيتك. ثم القيام بذلك مرة أخرى لآخر خمس سنوات لكل شركة لبناء سلسلة زمنية.

هذه هي مشكلة استخراج التقارير السنوية، وتكلف فرق أبحاث الأسهم، ومحللي الائتمان، ومديري المحافظ آلاف الساعات كل عام. من المتوقع أن تصل سوق برامج استخراج البيانات العالمية إلى 3.64 مليار دولار بحلول عام 2029، بمعدل نمو سنوي 15.9%، مدفوعة إلى حد كبير بالمهنيين الماليين الذين سئموا من نسخ الأرقام من جداول PDF إلى Excel.

يغطي هذا الدليل ما يجعل استخراج التقارير السنوية صعبًا بشكل فريد، وما هي المقاييس التي يجب استهدافها، وكيفية أتمتة العملية حتى تتمكن من قضاء وقتك في التحليل بدلاً من إدخال البيانات.

Extract key metrics from annual reports automatically - revenue, net income, EPS, cash flow, and more

تحدي استخراج التقارير السنوية

التقارير السنوية ليست مثل مستندات PDF الأخرى. كشف حساب بنكي له هيكل يمكن التنبؤ به: التاريخ، الوصف، المبلغ، الرصيد، مكرر لكل معاملة. الفاتورة لها رأس، بنود، وإجمالي. تتبع هذه المستندات أنماطًا يمكن لأدوات الاستخراج تعلمها بسرعة.

التقارير السنوية مختلفة. إنها مستندات طويلة ومعقدة وغير متسقة هيكليًا تجمع بين:

  • نص سردي متدفق في رسالة الرئيس التنفيذي، ومناقشة الإدارة وتحليلها (MD&A)، وأقسام عوامل الخطر
  • جداول مالية كثيفة في قائمة الدخل، والميزانية العمومية، وبيان التدفق النقدي
  • ملاحظات وتعليقات توضيحية تؤهل أو تعدل أو تعيد بيان الأرقام في تلك الجداول
  • رسوم بيانية تصور الاتجاهات ولكنها لا تحتوي على بيانات قابلة للقراءة آليًا
  • جداول تقارير الأقسام مع تفصيلات حسب المنطقة الجغرافية أو وحدة الأعمال أو خط الإنتاج
  • مقارنات متعددة السنوات تقدم بيانات لسنتين أو ثلاث سنوات جنبًا إلى جنب

يحتوي نموذج 10-K النموذجي على 100 إلى 300 صفحة. قد تشغل البيانات المالية نفسها 30 إلى 40 صفحة، ولكن ملاحظات البيانات المالية - حيث تكمن التفاصيل الحقيقية - يمكن أن تمتد إلى 50 أو 60 صفحة أخرى. الباقي هو لغة قانونية، وعوامل خطر، وجداول تعويضات تنفيذية، وإفصاحات حوكمة.

لماذا يفشل النسخ واللصق القياسي

إذا سبق لك أن حاولت تحديد جدول في تقرير سنوي بتنسيق PDF ولصقه في Excel، فأنت تعرف النتيجة: تندمج الأعمدة، وتلتف الأرقام في صفوف خاطئة، وتتضمن علامات الحواشي السفلية في بياناتك.

لا تحتوي ملفات PDF على جداول. إنها تحتوي على أحرف فردية موضوعة في إحداثيات x,y دقيقة على لوحة. ما يبدو كجدول نظيف هو في الواقع مئات من أوامر تحديد المواقع النصية المنفصلة بدون فواصل صفوف أو حدود أعمدة أو مراجع خلايا. يتجاهل النسخ واللصق هذه العلاقات المكانية تمامًا.

التقارير السنوية تجعل هذا أسوأ لأن رؤوس الصفوف متعددة الأسطر مثل "صافي الدخل العائد للمساهمين العاديين" تحتاج إلى أن تكون صفًا واحدًا. الأرقام السالبة بين قوسين مثل (1,234) هي ثلاثة عناصر موضوعة منفصلة تنقسم إلى خلايا منفصلة. الأرقام العلوية للحواشي السفلية تفسد الأرقام. وغالبًا ما تندمج أعمدة المقارنة.

كابوس الاستخراج اليدوي

النهج التقليدي هو القوة الغاشمة. يفتح المحلل التقرير السنوي، ويتنقل إلى قائمة الدخل، ويكتب يدويًا كل رقم في جدول بيانات. ثم الميزانية العمومية. ثم بيان التدفق النقدي. ثم بيانات الأقسام. ثم الحواشي السفلية.

لشركة واحدة، يستغرق هذا 30 إلى 60 دقيقة. ولكن التحليل المالي نادرًا ما يتضمن شركة واحدة. يغطي محللو أبحاث الأسهم عادةً 10 إلى 25 شركة. قد يحتاج محللو الائتمان إلى بيانات من 50 مقترضًا أو أكثر. عشرون شركة مقابل 45 دقيقة لكل منها تعني 15 ساعة من إدخال البيانات لكل فترة تقرير - 60 ساعة في السنة لمجرد نسخ الأرقام من ملفات PDF.

معدل الخطأ يجعله أسوأ. إدخال البيانات اليدوي لديه معدل خطأ موثق يتراوح بين 1 إلى 4 بالمائة. رقم إيرادات بقيمة 4,521 مليون دولار تم إدخاله كـ 4,512 مليون دولار يفسد معدل نموك، وحسابات الهامش، ونسبة القيمة السوقية إلى الإيرادات، وكل توقع لاحق يعتمد عليه.

ما يستخرجه المحللون فعليًا

ليس كل رقم في التقرير السنوي له نفس الأهمية. يستهدف المهنيون الماليون عادةً مجموعة محددة من المقاييس اعتمادًا على حالة الاستخدام الخاصة بهم. إليك ما تركز عليه معظم عمليات الاستخراج.

مقاييس قائمة الدخل

المقياس سبب الأهمية مكان العثور عليه
الإيرادات / صافي المبيعات نمو الخط العلوي، نقطة البداية لمعظم نماذج التقييم قائمة الدخل، السطر الأول
تكلفة البضائع المباعة (COGS) حساب هامش الربح الإجمالي، كفاءة سلسلة التوريد قائمة الدخل، أسفل الإيرادات
إجمالي الربح الإيرادات مطروحًا منها تكلفة البضائع المباعة، يقيس ربحية الإنتاج قائمة الدخل، محسوب
الدخل التشغيلي (EBIT) ربحية الأعمال الأساسية قبل الفوائد والضرائب قائمة الدخل، القسم الأوسط
الأرباح قبل خصم الفوائد والضرائب والإهلاك والاستهلاك (EBITDA) الربحية الموجهة نحو النقد، تستخدم في مضاعفات القيمة السوقية إلى EBITDA غالبًا في MD&A أو محسوبة من قائمة الدخل + الإهلاك والاستهلاك من التدفق النقدي
صافي الدخل الربح النهائي بعد جميع المصروفات والضرائب والفوائد قائمة الدخل، بالقرب من الأسفل
نصيب السهم من الأرباح (أساسي ومخفف) الربحية لكل سهم، تدفع نسب السعر إلى الأرباح (P/E) قائمة الدخل، الأسطر الأخيرة

مقاييس الميزانية العمومية

المقياس سبب الأهمية مكان العثور عليه
إجمالي الأصول حجم الشركة، حسابات الرافعة المالية الميزانية العمومية، إجمالي قسم الأصول
إجمالي الالتزامات عبء الديون، تقييم الملاءة المالية الميزانية العمومية، إجمالي قسم الالتزامات
إجمالي حقوق الملكية / حقوق المساهمين صافي القيمة، حسابات القيمة الدفترية الميزانية العمومية، إجمالي قسم حقوق الملكية
إجمالي الديون (قصير الأجل + طويل الأجل) نسب الرافعة المالية، تغطية الفائدة الميزانية العمومية + الملاحظات
النقد وما يعادله السيولة، حسابات صافي الدين الميزانية العمومية، أول أصل متداول
الأصول المتداولة / الالتزامات المتداولة رأس المال العامل، النسبة الحالية إجمالي أقسام الميزانية العمومية

مقاييس بيان التدفق النقدي

المقياس سبب الأهمية مكان العثور عليه
التدفق النقدي التشغيلي النقد الناتج عن الأعمال الأساسية بيان التدفق النقدي، القسم الأول
النفقات الرأسمالية الاستثمار في النمو، حساب التدفق النقدي الحر التدفق النقدي من أنشطة الاستثمار
التدفق النقدي الحر النقد المتاح بعد الحفاظ على العمليات التدفق النقدي التشغيلي مطروحًا منه النفقات الرأسمالية
الأرباح الموزعة عوائد المساهمين، نسبة التوزيع التدفق النقدي من أنشطة التمويل

النسب والهوامش المشتقة

بمجرد استخراج المقاييس الأولية، يقوم المحللون بحساب:

  • هامش الربح الإجمالي: إجمالي الربح / الإيرادات
  • هامش التشغيل: الدخل التشغيلي / الإيرادات
  • صافي الهامش: صافي الدخل / الإيرادات
  • العائد على حقوق الملكية (ROE): صافي الدخل / حقوق المساهمين
  • العائد على الأصول (ROA): صافي الدخل / إجمالي الأصول
  • الدين إلى حقوق الملكية: إجمالي الديون / إجمالي حقوق الملكية
  • النسبة الحالية: الأصول المتداولة / الالتزامات المتداولة
  • تغطية الفائدة: الدخل التشغيلي / مصروف الفائدة

تتطلب هذه النسب استخراجًا دقيقًا ونظيفًا للمكونات الأساسية. رقم واحد خاطئ يفسد النسبة بأكملها.

بيانات منظمة مدفونة في مستندات غير منظمة

التحدي التقني الأساسي هو أن البيانات المنظمة - الأرقام ذات المعاني والعلاقات الدقيقة - مضمنة في مستندات غير منظمة. البيان المالي هو جدول، ولكنه موجود داخل ملف PDF يحتوي أيضًا على فقرات سردية، وإخلاء مسؤولية قانونية، وصور، ورؤوس صفحات.

هذا يخلق العديد من مشاكل الاستخراج بخلاف التعرف البسيط على الجدول:

  • أرقام تعتمد على السياق. الرقم "12,345" يعني أشياء مختلفة اعتمادًا على مكان ظهوره. في سطر الإيرادات، يعني 12,345 مليون دولار (أو آلاف، اعتمادًا على وحدة التقارير المذكورة في أعلى البيانات المالية). في تعويضات المسؤولين التنفيذيين، قد يعني 12,345 دولارًا فعليًا. يتطلب الاستخراج الفعال فهم القسم الذي ينتمي إليه الرقم وما تقوله رؤوس الأعمدة ودلالة الوحدة.
  • جداول متداخلة وممتدة. تستخدم جداول التقارير السنوية خلايا مدمجة لرؤوس الأقسام، وعناصر فرعية متداخلة تحت فئات رئيسية، وإجماليات فرعية تتخللها بنود، وأعمدة مقارنة لسنوات متعددة، وصفوف فاصلة فارغة. يعامل أداة الاستخراج الساذجة كل عنصر مرئي كنقطة بيانات، مما ينتج عنه جداول بيانات غير متطابقة مليئة بالصفوف الوهمية والقيم المدمجة.
  • مراجع الحواشي السفلية. الإيرادات "12,345^(1)" تصبح "12345 1" عند استخراجها بدون فهم دلالي. الرقم العلوي هو حرف منفصل موضوع في ملف PDF. أدوات الاستخراج إما تزيله (مما يؤدي إلى فقدان المرجع) أو تتضمنه (مما يفسد الرقم).

كيف يتعامل استخراج الذكاء الاصطناعي مع التقارير السنوية

يتبع الاستخراج المدعوم بالذكاء الاصطناعي نهجًا مختلفًا جوهريًا. بدلاً من الاعتماد فقط على التحليل المكاني - اكتشاف الصفوف والأعمدة بناءً على مواضع الأحرف - فإنه يجمع بين الوعي المكاني والفهم الدلالي.

الكشف عن الجداول المدركة للتخطيط يتجاوز مجرد البحث عن خطوط الشبكة (العديد من الجداول المالية ليس لها حدود مرئية). يحلل النظام أنماط تباعد الأحرف، ومحاذاة النقاط العشرية، وتكرار التنسيق، ورؤوس الصفوف لاكتشاف حدود الجدول. يمكنه التمييز بين فقرة سردية تحتوي بالصدفة على أرقام وجدول بيانات مالية بأعمدة محاذية.

التعرف على الحقول الدلالية يحدد ما يمثله كل عمود وصف. يتعرف على أن "Revenue" و "Net sales" و "Total revenue" و "Net revenues" تشير جميعها إلى نفس المفهوم. ويفهم أن "(1,234)" في سياق مالي يعني سالب 1,234، وليس مرجعًا لحاشية سفلية. هذا مهم لأن اصطلاحات التسمية تختلف على نطاق واسع بين الشركات - أحدهما يبلغ عن "Stockholders' equity" بينما يستخدم آخر "Shareholders' equity" أو "Total equity".

استمرارية الجداول متعددة الصفحات يتم التعامل معها عن طريق التعرف على أنماط الرأس المتكررة والمحاذاة المتسقة للأعمدة عبر فواصل الصفحات. قد تبدأ قائمة الدخل في الصفحة 84 وتستمر في الصفحة 85، ويقوم استخراج الذكاء الاصطناعي بدمج البيانات في جدول واحد متماسك.

الأقسام الرئيسية التي يجب استهدافها في التقارير السنوية

ليس كل قسم في التقرير السنوي يحتوي على بيانات مالية قابلة للاستخراج. معرفة مكان التركيز يوفر الوقت ويحسن الدقة.

البيانات المالية هي هدف الاستخراج الأساسي: البيانات الموحدة للدخل، والميزانيات العمومية، والتدفقات النقدية، وحقوق المساهمين. تحتوي هذه البيانات الأربعة على الأرقام الأولية التي تدفع النماذج المالية.

مناقشة الإدارة وتحليلها (MD&A) هي المكان الذي تشرح فيه الإدارة الأرقام. غالبًا ما تحتوي على مقاييس غير متوافقة مع مبادئ المحاسبة المقبولة عمومًا (GAAP) مثل الأرباح المعدلة قبل خصم الفوائد والضرائب والإهلاك والاستهلاك والتدفق النقدي الحر، وتفصيلات على مستوى الأقسام، وتوجيهات مستقبلية - كلها مضمنة في فقرات سردية بدلاً من الجداول. يمكن لاستخراج الذكاء الاصطناعي تحديد وسحب هذه الأرقام، ولكنها تتطلب فهمًا سياقيًا أكثر من بيانات الجدول.

تقارير الأقسام تفصل النتائج حسب وحدة الأعمال أو المنطقة الجغرافية أو خط الإنتاج. هذه البيانات ضرورية لتقييم مجموع الأجزاء. غالبًا ما تحتوي جداول الأقسام على هياكل غير قياسية مع أسماء الأقسام كرؤوس أعمدة وإلغاءات بين الأقسام التي تضيف صفوفًا سالبة.

الملاحظات على البيانات المالية تحتوي على التفاصيل الأكثر دقة: جداول الديون مع تواريخ الاستحقاق، وتجزئة الإيرادات حسب المنتج أو الجغرافيا، والتزامات الإيجار، وتفاصيل المعاشات التقاعدية، ومصالحات معدل الضريبة، وتفاصيل الشهرة حسب القسم. هذه هي الأصعب في الاستخراج لأنها تخلط بين النص السردي والجداول الصغيرة المضمنة.

عوامل الخطر هي في الغالب نوعية، ولكنها تحتوي أحيانًا على إفصاحات كمية: نسب مخاطر التركيز، احتياطيات التقاضي، أو متطلبات رأس المال التنظيمية المدفونة في فقرات من اللغة القانونية.

استخراج بيانات التقارير السنوية باستخدام PDFSub

Annual report data extraction process: Upload → AI Extract → Review → Export, with key metrics and time savings

يوفر PDFSub أداتين مناسبتين بشكل خاص لاستخراج التقارير السنوية: أداة استخراج الجداول و محلل التقارير المالية.

استخراج الجداول: سحب البيانات المالية إلى جداول البيانات

تقوم أداة استخراج الجداول باكتشاف واستخراج البيانات الجدولية من مستندات PDF. بالنسبة للتقارير السنوية، يعني هذا:

  1. تحميل ملف PDF للتقرير السنوي - اسحب الملف وأفلته. بالنسبة لملفات PDF الرقمية التي تم تنزيلها من SEC EDGAR أو صفحات علاقات المستثمرين بالشركة، تتم المعالجة الأولية في متصفحك. لا يغادر الملف جهازك إلا إذا كانت معالجة الذكاء الاصطناعي من جانب الخادم مطلوبة.
  2. الكشف التلقائي عن الجداول - تحدد الأداة جميع مناطق الجداول في المستند، بما في ذلك الجداول متعددة الصفحات التي تمتد عبر فواصل الصفحات.
  3. مراجعة الجداول المستخرجة - يتم عرض كل جدول تم اكتشافه مع بياناته المستخرجة. يمكنك التحقق من أن الأعمدة محاذية بشكل صحيح وأن القيم دقيقة.
  4. التصدير إلى Excel أو CSV - قم بتنزيل الجداول المستخرجة بتنسيقات جاهزة للنمذجة المالية.

يعمل هذا النهج بشكل جيد مع البيانات المالية الأساسية (قائمة الدخل، الميزانية العمومية، التدفق النقدي) حيث يتم تقديم البيانات بتنسيق جدولي واضح.

محلل التقارير المالية: استخراج المقاييس المدعوم بالذكاء الاصطناعي

يتجاوز محلل التقارير المالية استخراج الجداول. يستخدم الذكاء الاصطناعي لقراءة المستند بأكمله، وفهم هيكله، واستخراج مقاييس مالية محددة - بما في ذلك تلك المضمنة في النص السردي أو الملاحظات.

بالنسبة للتقارير السنوية، يمكن للمحلل:

  • تحديد واستخراج المقاييس المالية الرئيسية عبر جميع أقسام المستند
  • سحب المقاييس غير المتوافقة مع مبادئ المحاسبة المقبولة عمومًا (GAAP) من قسم MD&A
  • استخراج بيانات على مستوى الأقسام من جداول التقارير
  • التعرف على اتفاقيات التسمية المختلفة لنفس المقياس والتعامل معها
  • توفير سياق للأرقام المستخرجة، بما في ذلك فترة التقرير ووحدة القياس

الجمع بين الأداتين

يجمع سير العمل الأكثر فعالية للتقارير السنوية بين النهجين:

  1. استخدم استخراج الجداول لسحب البيانات المالية المنظمة (قائمة الدخل، الميزانية العمومية، التدفق النقدي) إلى Excel بدقة جدولية كاملة
  2. استخدم محلل التقارير المالية لاستخراج مقاييس محددة من الأقسام السردية والملاحظات والجداول غير القياسية
  3. قم بمقارنة النتائج للتحقق من الدقة

كلا الأداتين متاحتان مع التجربة المجانية لمدة 7 أيام من PDFSub، لذلك يمكنك اختبارهما على تقاريرك السنوية الفعلية قبل الالتزام.

التصدير إلى Excel و CSV للنمذجة المالية

الاستخراج مفيد فقط إذا كان الناتج يناسب سير عملك. يتم تصدير الجداول المستخرجة كملفات .xlsx بخلايا رقمية مكتوبة بشكل صحيح، ومحاذاة أعمدة محفوظة، وأوراق منفصلة لكل جدول، ورؤوس نظيفة. للمحللين الذين يفضلون CSV (شائع لقواعد البيانات وأدوات البرمجة النصية)، تحصل على مخرجات مفصولة بفواصل مع ترميز UTF-8 وملف واحد لكل جدول مستخرج.

سير عمل نموذجي بعد الاستخراج: استخراج قائمة الدخل والميزانية العمومية وبيان التدفق النقدي؛ استيراد الجداول الثلاثة إلى قالب النموذج الخاص بك؛ تعيين أسماء الحقول إلى تسميات الصفوف الموحدة الخاصة بك؛ التحقق من تطابق الإجماليات؛ حساب النسب المشتقة؛ وبناء سلاسل زمنية عن طريق التكرار للتقارير السابقة. هذا يحل محل الكتابة اليدوية ويقلل الوقت من البداية إلى النهاية من 45 دقيقة إلى أقل من 5 دقائق لكل شركة.

حالات الاستخدام: من يستخرج بيانات التقارير السنوية

أبحاث الأسهم. يبني المحللون نماذج مالية ببيانات تاريخية لمدة 5 إلى 10 سنوات وتوقعات لمدة 3 إلى 5 سنوات. تعني تغطية 15 شركة استخراج بيانات من 15 تقريرًا سنويًا و 60 تقريرًا ربع سنويًا سنويًا. يحول الاستخراج الآلي هذا من تمرين إدخال بيانات يستغرق عدة أيام إلى مهمة في نفس اليوم.

التحليل الائتماني. يقوم محللو الائتمان بتقييم الجدارة الائتمانية للمقترضين باستخدام نسبة الدين إلى الأرباح قبل خصم الفوائد والضرائب والإهلاك والاستهلاك (الرافعة المالية)، ونسبة الأرباح قبل خصم الفوائد والضرائب والإهلاك والاستهلاك إلى مصروف الفائدة (التغطية)، والنسبة الحالية (السيولة)، ونسبة الدين إلى إجمالي رأس المال (الهيكل الرأسمالي). قد تحتوي محفظة القروض المصرفية التجارية على مئات المقترضين، يقدم كل منهم بيانات مالية سنوية تحتاج إلى استخراج هذه المقاييس.

المقارنة المرجعية وتحليل المنافسين. تتطلب مقارنة شركة بنظرائها استخراج نفس المقاييس من 5 إلى 15 تقريرًا سنويًا، وتطبيعها لاختلاف نهايات السنة المالية ووحدات التقارير ومعايير المحاسبة (US GAAP مقابل IFRS).

مراقبة المحفظة. يقوم مديرو الاستثمار الذين يتتبعون 30 إلى 100 حيازة باستخراج مجموعة قياسية من مقاييس المراقبة بشكل ربع سنوي: نمو الإيرادات، اتجاه هامش الأرباح قبل خصم الفوائد والضرائب والإهلاك والاستهلاك، صافي الدين / الأرباح قبل خصم الفوائد والضرائب والإهلاك والاستهلاك، عائد التدفق النقدي الحر، والعائد على رأس المال المستثمر. يجعل الاستخراج الآلي هذا ممكنًا على نطاق واسع.

استخراج متعدد السنوات: بناء بيانات السلاسل الزمنية

التحليل المالي يدور أساسًا حول الاتجاهات: هل تتسارع الإيرادات؟ هل تتوسع الهوامش؟ هل الشركة تقلل من ديونها؟ تتطلب الإجابة على هذه الأسئلة بيانات سلاسل زمنية تمتد لثلاث إلى خمس سنوات على الأقل.

النهج 1: الاستخراج من كل تقرير سنوي

عادةً ما تقدم التقارير السنوية بيانات قائمة الدخل لسنتين (السنة الحالية والسنة السابقة) وبيانات الميزانية العمومية لسنتين. يشتمل البعض على بيانات دخل مقارنة لثلاث سنوات.

لبناء سلسلة زمنية مدتها خمس سنوات، تحتاج إلى الاستخراج من ثلاثة تقارير سنوية:

  • التقرير السنوي لعام 2025: يحتوي على بيانات 2025 و 2024
  • التقرير السنوي لعام 2023: يحتوي على بيانات 2023 و 2022
  • التقرير السنوي لعام 2021: يحتوي على بيانات 2021 و 2020

هذا يمنحك سنوات متداخلة (يظهر عام 2024 في تقريري 2025 و 2024) تعمل كفحص متقاطع.

النهج 2: استخدام بيانات مالية مختارة من 10-K

تتضمن بعض الشركات جدول "بيانات مالية مختارة" يقدم خمس إلى عشر سنوات من المقاييس الرئيسية في جدول واحد. عند توفرها، يكون هذا هو المسار الأسرع لسلسلة زمنية متعددة السنوات. ومع ذلك، ألغت هيئة الأوراق المالية والبورصات (SEC) متطلبات هذا الجدول في عام 2021، وقد أسقطته العديد من الشركات منذ ذلك الحين.

النهج 3: الاستخراج من بيانات SEC EDGAR XBRL

بالنسبة للشركات العامة الأمريكية، تتضمن إيداعات هيئة الأوراق المالية والبورصات بيانات موسومة بـ XBRL قابلة للقراءة آليًا دون الحاجة إلى استخراج PDF. يوفر نظام EDGAR الخاص بهيئة الأوراق المالية والبورصات واجهات برمجة تطبيقات RESTful تقدم بيانات بتنسيق JSON للعناصر القياسية. ومع ذلك، فإن XBRL له قيود: قد لا يتم تمييز العناصر المخصصة بشكل متسق، ونادرًا ما تتوفر المقاييس غير المتوافقة مع مبادئ المحاسبة المقبولة عمومًا، وقد تكون بيانات الأقسام مفقودة، وقد لا يتطابق ترتيب العرض مع الإيداع الأصلي. يظل استخراج PDF المصدر الأكثر موثوقية للبيانات المالية الكاملة والمتسقة في العرض.

بناء جدول السلاسل الزمنية

بمجرد حصولك على بيانات مستخرجة لسنوات متعددة، قم بإنشاء جدول بيانات رئيسي مع السنوات كأعمدة والمقاييس كصفوف. قم باستيراد بيانات كل عام، وتحقق من تطابق السنوات المتداخلة عبر التقارير، وأضف صفوفًا محسوبة لمعدلات النمو والنسب، وقم بتمييز أي إعادة بيان تكسر القابلية للمقارنة.

فحوصات الجودة: التحقق من صحة البيانات المستخرجة

الاستخراج الآلي سريع، ولكن يجب عليك دائمًا التحقق من المخرجات. تحتوي التقارير السنوية على فحوصات مدمجة تجعل التحقق مباشرًا.

معادلة الميزانية العمومية

الفحص الأساسي: إجمالي الأصول = إجمالي الالتزامات + إجمالي حقوق المساهمين.

إذا لم تتحقق هذه المعادلة في بياناتك المستخرجة، فقد حدث خطأ ما. إما أن رقمًا قد تمت قراءته بشكل خاطئ، أو تم تخطي صف، أو تم محاذاة الأعمدة بشكل خاطئ. هذا الفحص الوحيد يلتقط نسبة كبيرة من أخطاء الاستخراج.

تدفق قائمة الدخل

يجب أن يساوي الإيرادات مطروحًا منها جميع المصروفات صافي الدخل. تحقق من الحساب:

الإيرادات
- تكلفة البضائع المباعة
= إجمالي الربح
- المصروفات التشغيلية
= الدخل التشغيلي
- مصروف الفائدة
+ دخل الفائدة
- مخصص الضرائب
= صافي الدخل

إذا لم تتطابق الإجماليات الفرعية، فافحص أي بنود تم تفويتها أو استخراجها بشكل خاطئ.

تسوية التدفق النقدي

يبدأ بيان التدفق النقدي بصافي الدخل وينتهي بتغير النقد. يجب أن تتطابق هذه التغييرات النهائية مع الفرق بين النقد في بداية الفترة ونهايتها في الميزانية العمومية.

الرصيد النقدي في بداية الفترة (من الميزانية العمومية)
+ التغير الصافي في النقد (من بيان التدفق النقدي)
= الرصيد النقدي في نهاية الفترة (من الميزانية العمومية)

الفحص المعقول والفحص العشوائي

قم بمسح البيانات المستخرجة بحثًا عن قيم غير معقولة: تغير الإيرادات بأكثر من 50% سنة بسنة، أصول إجمالية سالبة، نصيب سهم من الأرباح لا يتوافق مع صافي الدخل مقسومًا على عدد الأسهم القائمة، أو هوامش خارج معايير الصناعة (هامش صافي بنسبة 90% في التصنيع يشير إلى خطأ في الفاصلة العشرية). ثم اختر ثلاثة إلى خمسة أرقام عشوائيًا، وعد إلى ملف PDF الأصلي، وتحقق من تطابقها. يستغرق هذا 30 ثانية ويلتقط الأخطاء المنهجية مثل استخراج البيانات من العمود الخاطئ.

نصائح للحصول على نتائج استخراج أفضل

استخدم التقارير السنوية الرقمية، وليس النسخ الممسوحة ضوئيًا. تستخرج ملفات PDF الرقمية بدقة أكبر بكثير من المستندات الممسوحة ضوئيًا. بالنسبة للشركات العامة الأمريكية، قم دائمًا بالتنزيل من SEC EDGAR (الإيداعات رقمية بحكم تعريفها) أو صفحات علاقات المستثمرين بالشركة. تجنب التقارير المطبوعة التي تم مسحها ضوئيًا مرة أخرى إلى PDF والتقارير السنوية "اللامعة" الغنية بالصور المصممة للتسويق.

استخدم 10-K، وليس التقرير السنوي للمساهمين. غالبًا ما تنتج الشركات العامة كلاً من إيداع 10-K (بيانات مالية موحدة) وتقرير سنوي للمساهمين (مستند تسويقي بصور لامعة). يحتوي 10-K على عرض GAAP موحد، وتنسيق جدول متسق، وملاحظات كاملة، وهو متاح دائمًا كملف PDF رقمي من EDGAR.

حدد وحدة التقارير قبل الاستخراج. في أعلى كل بيان مالي توجد ملاحظة مثل "بالملايين، باستثناء المبالغ لكل سهم" أو "بالآلاف". إذا فاتتك هذه، فإن رقم إيرادات "45,231" يمكن أن يكون 45.2 مليار دولار أو 45.2 مليون دولار. تحقق دائمًا وطبق المضاعف الصحيح.

تعامل مع اختلافات السنة المالية. لا تستخدم جميع الشركات السنة المالية التقويمية. تنتهي شركة Apple في سبتمبر، وول مارت في يناير، ومايكروسوفت في يونيو. يتم تحديد تاريخ نهاية السنة المالية في أعلى كل بيان مالي.

انتبه لإعادة البيانات. عندما تعيد الشركة صياغة البيانات المالية للسنوات السابقة، تظهر الأرقام المعاد صياغتها في التقرير السنوي الحالي. قد تختلف بيانات عام 2024 في تقرير عام 2025 عن بيانات عام 2024 في تقرير عام 2024. استخدم دائمًا أحدث الأرقام المعاد صياغتها عند بناء سلاسل زمنية.

البدء

لا يحتاج استخراج التقارير السنوية إلى أن يكون عملية يدوية وعرضة للأخطاء. سير العمل العملي: قم بتنزيل 10-K من SEC EDGAR، وقم بتحميله إلى أداة استخراج الجداول أو محلل التقارير المالية الخاصة بـ PDFSub، وراجع المخرجات، وقم بالتصدير إلى Excel أو CSV، وقم بتشغيل فحوصات الجودة الموضحة أعلاه، وقم باستيراد البيانات التي تم التحقق منها إلى نموذجك المالي.

تقدم PDFSub تجربة مجانية لمدة 7 أيام حتى تتمكن من اختبار أدوات الاستخراج على تقاريرك السنوية الفعلية. جربها مع 10-K قمت باستخراجه يدويًا سابقًا وقارن النتائج - كل من الدقة وتوفير الوقت.

بالنسبة للمهنيين الماليين الذين يعالجون التقارير السنوية بانتظام، يعد الاستخراج الآلي ميزة تنافسية. المحلل الذي يقضي 5 دقائق في استخراج البيانات و 55 دقيقة في تحليلها سيتفوق باستمرار على المحلل الذي يقضي 55 دقيقة في الاستخراج و 5 دقائق في التحليل.

العودة إلى المدونة

أسئلة؟ اتصل بنا

PDFSub

كل أدوات PDF والمستندات التي تحتاجها في مكان واحد. سريعة وآمنة وخاصة.

متوافق مع GDPRمتوافق مع CCPAجاهز لـ SOC 2
مدعوم بمحرك PDFSub

المنتج

  • كل الأدوات
  • الميزات
  • كشوفات الحساب البنكية
  • API
  • الأسعار
  • الأسئلة الشائعة
  • المدونة

الدعم

  • عن
  • مركز المساعدة
  • اتصل بنا
  • الأسئلة الشائعة

قانوني

  • سياسة الخصوصية
  • شروط الخدمة
  • سياسة ملفات تعريف الارتباط

© 2026 PDFSub. جميع الحقوق محفوظة.

صُنع في أمريكا بـ لأشخاص في كل مكان