বার্ষিক প্রতিবেদন থেকে স্বয়ংক্রিয়ভাবে মূল মেট্রিকগুলি বের করুন
বার্ষিক প্রতিবেদনে ১০০-৩০০ পৃষ্ঠার PDF-এর মধ্যে গুরুত্বপূর্ণ আর্থিক ডেটা লুকানো থাকে। ম্যানুয়ালি টেবিল থেকে সংখ্যা স্প্রেডশীটে কপি না করে কীভাবে আয়, নীট আয়, শেয়ার প্রতি আয় (EPS), নগদ প্রবাহ এবং অন্যান্য মূল মেট্রিকগুলি বের করবেন তা এখানে আলোচনা করা হলো।
আপনি সবেমাত্র একটি ২৪৭ পৃষ্ঠার বার্ষিক প্রতিবেদন ডাউনলোড করেছেন। এর মধ্যেই আপনার প্রয়োজনীয় বারোটি সংখ্যা লুকানো আছে: আয়, নীট আয়, শেয়ার প্রতি আয়, মোট সম্পদ, মোট দায়, পরিচালন নগদ প্রবাহ, EBITDA এবং কিছু মার্জিন। বাকিটা হলো সাধারণ লেখা, আইনি প্রকাশ এবং হাসিমুখ কর্মীদের স্টক ছবি।
সেই সংখ্যাগুলো খুঁজে বের করা কঠিন কাজ নয়। এগুলো আর্থিক বিবরণী বিভাগে থাকে, সাধারণত ৮০ পৃষ্ঠার কাছাকাছি থেকে শুরু হয়। কঠিন কাজ হলো সেগুলোকে PDF থেকে বের করে আপনার মডেলে এমন ফরম্যাটে আনা যা দিয়ে আপনি কাজ করতে পারবেন। এবং তারপর আপনার কভারেজ ইউনিভার্সের পরবর্তী বিশটি কোম্পানির জন্য এটি আবার করা। এবং তারপর একটি সময় সিরিজ তৈরি করার জন্য প্রতিটি কোম্পানির গত পাঁচ বছরের ডেটা আবার করা।
এটিই বার্ষিক প্রতিবেদন এক্সট্রাকশন সমস্যা, এবং এটি প্রতি বছর ইক্যুইটি গবেষণা দল, ক্রেডিট বিশ্লেষক এবং পোর্টফোলিও ম্যানেজারদের হাজার হাজার ঘন্টা সময় নষ্ট করে। বিশ্বব্যাপী ডেটা এক্সট্রাকশন সফ্টওয়্যার বাজার ২০২৯ সালের মধ্যে $৩.৬৪ বিলিয়ন ডলারে পৌঁছাবে বলে অনুমান করা হচ্ছে, যা বার্ষিক ১৫.৯% হারে বৃদ্ধি পাচ্ছে, যার প্রধান চালিকাশক্তি হলো আর্থিক পেশাদাররা যারা PDF টেবিল থেকে এক্সেল-এ সংখ্যা কপি করতে ক্লান্ত।
এই গাইডটি আলোচনা করবে কেন বার্ষিক প্রতিবেদন এক্সট্রাকশন বিশেষভাবে কঠিন, কোন মেট্রিকগুলি লক্ষ্য করা উচিত এবং প্রক্রিয়াটিকে স্বয়ংক্রিয় করার উপায় যাতে আপনি ডেটা এন্ট্রির পরিবর্তে বিশ্লেষণে আপনার সময় ব্যয় করতে পারেন।
বার্ষিক প্রতিবেদন এক্সট্রাকশনের চ্যালেঞ্জ
বার্ষিক প্রতিবেদন অন্যান্য PDF ডকুমেন্টের মতো নয়। একটি ব্যাংক স্টেটমেন্টের একটি নির্দিষ্ট কাঠামো থাকে: তারিখ, বিবরণ, পরিমাণ, ব্যালেন্স, প্রতিটি লেনদেনের জন্য পুনরাবৃত্তি। একটি চালানে একটি হেডার, লাইন আইটেম এবং একটি মোট পরিমাণ থাকে। এই নথিগুলি এমন প্যাটার্ন অনুসরণ করে যা এক্সট্রাকশন টুলগুলি দ্রুত শিখতে পারে।
বার্ষিক প্রতিবেদন ভিন্ন। এগুলি দীর্ঘ, জটিল এবং কাঠামোগতভাবে অসামঞ্জস্যপূর্ণ নথি যা একত্রিত করে:
- প্রবাহমান বর্ণনামূলক পাঠ্য সিইও চিঠি, ম্যানেজমেন্ট ডিসকাশন অ্যান্ড অ্যানালাইসিস (MD&A), এবং ঝুঁকি ফ্যাক্টর বিভাগে
- ঘন আর্থিক টেবিল আয় বিবরণী, ব্যালেন্স শীট, এবং নগদ প্রবাহ বিবরণীতে
- ফুটনোট এবং টীকা যা সেই টেবিলগুলির সংখ্যাগুলিকে যোগ্যতা দেয়, সামঞ্জস্য করে বা পুনরায় প্রকাশ করে
- চার্ট এবং গ্রাফ যা প্রবণতাগুলি কল্পনা করে তবে কোনও মেশিন-পঠনযোগ্য ডেটা ধারণ করে না
- সেগমেন্ট রিপোর্টিং টেবিল যা ভূগোল, ব্যবসায়িক ইউনিট বা পণ্যের লাইন অনুসারে বিভাজন করে
- বহু-বছরের তুলনামূলক যা পাশাপাশি দুই বা তিন বছরের ডেটা উপস্থাপন করে
একটি সাধারণ 10-K ফাইলিং ১০০ থেকে ৩০০ পৃষ্ঠা পর্যন্ত হয়। আর্থিক বিবরণীগুলি নিজেরাই ৩০ থেকে ৪০ পৃষ্ঠা দখল করতে পারে, তবে আর্থিক বিবরণীর নোটগুলি — যেখানে আসল বিস্তারিত তথ্য থাকে — আরও ৫০ বা ৬০ পৃষ্ঠা পর্যন্ত প্রসারিত হতে পারে। বাকিটা হলো আইনি ভাষা, ঝুঁকির কারণ, নির্বাহী ক্ষতিপূরণ টেবিল এবং শাসন সংক্রান্ত প্রকাশ।
কেন স্ট্যান্ডার্ড কপি-পেস্ট ব্যর্থ হয়
আপনি যদি কখনও একটি PDF বার্ষিক প্রতিবেদনের একটি টেবিল নির্বাচন করে এক্সেলে পেস্ট করার চেষ্টা করে থাকেন, তবে আপনি ফলাফল জানেন: কলামগুলি একত্রিত হয়ে যায়, সংখ্যাগুলি ভুল সারিতে চলে আসে এবং ফুটনোট মার্কারগুলি আপনার ডেটাতে এম্বেড হয়ে যায়।
PDF-এ টেবিল থাকে না। এগুলিতে একটি ক্যানভাসে সুনির্দিষ্ট x,y স্থানাঙ্কে অবস্থিত পৃথক অক্ষর থাকে। যা একটি পরিষ্কার টেবিলের মতো দেখায় তা আসলে শত শত পৃথক টেক্সট পজিশনিং কমান্ড, কোনও সারি বিভাজক, কলাম সীমানা বা সেল রেফারেন্স ছাড়াই। কপি-পেস্ট এই স্থানিক সম্পর্কগুলিকে সম্পূর্ণ উপেক্ষা করে।
বার্ষিক প্রতিবেদনগুলি এটিকে আরও খারাপ করে তোলে কারণ মাল্টি-লাইন রো হেডার যেমন "Net income attributable to common shareholders" একটি একক সারি হওয়া দরকার। বন্ধনীতে থাকা নেতিবাচক সংখ্যা যেমন $(1,234) তিনটি পৃথক পজিশনড এলিমেন্ট যা পৃথক সেলে বিভক্ত হয়ে যায়। ফুটনোট সুপারস্ক্রিপ্ট সংখ্যাগুলিকে নষ্ট করে। এবং তুলনামূলক কলামগুলি প্রায়শই একত্রিত হয়ে যায়।
ম্যানুয়াল এক্সট্রাকশন দুঃস্বপ্ন
প্রচলিত পদ্ধতি হলো ব্রুট ফোর্স। একজন বিশ্লেষক বার্ষিক প্রতিবেদনটি খোলেন, আয় বিবরণীতে যান এবং ম্যানুয়ালি প্রতিটি সংখ্যা একটি স্প্রেডশীটে টাইপ করেন। তারপর ব্যালেন্স শীট। তারপর নগদ প্রবাহ বিবরণী। তারপর সেগমেন্ট ডেটা। তারপর ফুটনোট।
একটি একক কোম্পানির জন্য, এতে ৩০ থেকে ৬০ মিনিট সময় লাগে। কিন্তু আর্থিক বিশ্লেষণে সাধারণত একটি কোম্পানি জড়িত থাকে না। ইক্যুইটি গবেষণা বিশ্লেষকরা সাধারণত ১০ থেকে ২৫টি কোম্পানি কভার করেন। ক্রেডিট বিশ্লেষকদের ৫০ বা তার বেশি ঋণগ্রহীতার ডেটা প্রয়োজন হতে পারে। প্রতি রিপোর্টিং পিরিয়ডে ৪৫ মিনিট করে ২০টি কোম্পানি মানে ডেটা এন্ট্রিতে ১৫ ঘন্টা — বছরে ৬০ ঘন্টা শুধু PDF থেকে সংখ্যা কপি করে।
ত্রুটির হার এটিকে আরও খারাপ করে তোলে। ম্যানুয়াল ডেটা এন্ট্রির একটি নথিভুক্ত ত্রুটির হার ১ থেকে ৪ শতাংশ। $৪,৫২১ মিলিয়ন রাজস্বের একটি অঙ্ক $৪,৫১২ মিলিয়ন হিসাবে টাইপ করলে আপনার বৃদ্ধির হার, মার্জিন গণনা, EV/Revenue মাল্টিপল এবং এর উপর নির্ভরশীল প্রতিটি ডাউনস্ট্রিম পূর্বাভাস ব্যাহত হয়।
বিশ্লেষকরা আসলে কী বের করেন
বার্ষিক প্রতিবেদনের প্রতিটি সংখ্যা সমান গুরুত্বপূর্ণ নয়। আর্থিক পেশাদাররা সাধারণত তাদের ব্যবহারের উপর নির্ভর করে নির্দিষ্ট মেট্রিকগুলির একটি সেট লক্ষ্য করে। এখানে বেশিরভাগ এক্সট্রাকশন ওয়ার্কফ্লোতে কী ফোকাস করা হয়।
আয় বিবরণীর মেট্রিকস
| মেট্রিক | এটি কেন গুরুত্বপূর্ণ | কোথায় পাবেন |
|---|---|---|
| রাজস্ব / নীট বিক্রয় | শীর্ষ-লাইন বৃদ্ধি, বেশিরভাগ মূল্যায়ন মডেলের জন্য শুরুর বিন্দু | আয় বিবরণী, প্রথম লাইন |
| বিক্রয়কৃত পণ্যের ব্যয় (COGS) | মোট মার্জিন গণনা, সরবরাহ চেইন দক্ষতা | আয় বিবরণী, রাজস্বের নিচে |
| মোট লাভ | রাজস্ব বিয়োগ COGS, উৎপাদন লাভজনকতা পরিমাপ করে | আয় বিবরণী, গণনা করা হয় |
| পরিচালন আয় (EBIT) | সুদ এবং করের আগে মূল ব্যবসায়িক লাভজনকতা | আয় বিবরণী, মধ্য-বিভাগ |
| EBITDA | নগদ-ভিত্তিক লাভজনকতা, EV/EBITDA মাল্টিপল-এ ব্যবহৃত হয় | প্রায়শই MD&A-তে বা আয় বিবরণী + D&A থেকে গণনা করা হয় |
| নীট আয় | সমস্ত ব্যয়, কর এবং সুদের পরে নীট লাভ | আয় বিবরণী, নীচের দিকে |
| শেয়ার প্রতি আয় (সাধারণ ও ডিউটেড) | শেয়ার প্রতি লাভজনকতা, P/E অনুপাত চালিত করে | আয় বিবরণী, শেষ লাইন |
ব্যালেন্স শীট মেট্রিকস
| মেট্রিক | এটি কেন গুরুত্বপূর্ণ | কোথায় পাবেন |
|---|---|---|
| মোট সম্পদ | কোম্পানির আকার, লিভারেজ গণনা | ব্যালেন্স শীট, সম্পদ বিভাগের মোট |
| মোট দায় | ঋণের বোঝা, সলভেন্সি মূল্যায়ন | ব্যালেন্স শীট, দায় বিভাগের মোট |
| মোট ইক্যুইটি / শেয়ারহোল্ডারদের ইক্যুইটি | নীট মূল্য, বুক ভ্যালু গণনা | ব্যালেন্স শীট, ইক্যুইটি বিভাগের মোট |
| মোট ঋণ (স্বল্পমেয়াদী + দীর্ঘমেয়াদী) | লিভারেজ অনুপাত, সুদের কভারেজ | ব্যালেন্স শীট + ফুটনোট |
| নগদ এবং নগদ সমতুল্য | তারল্য, নীট ঋণ গণনা | ব্যালেন্স শীট, প্রথম চলতি সম্পদ |
| চলতি সম্পদ / চলতি দায় | কার্যকরী মূলধন, চলতি অনুপাত | ব্যালেন্স শীট বিভাগ মোট |
নগদ প্রবাহ বিবরণীর মেট্রিকস
| মেট্রিক | এটি কেন গুরুত্বপূর্ণ | কোথায় পাবেন |
|---|---|---|
| পরিচালন নগদ প্রবাহ | মূল ব্যবসা থেকে উৎপন্ন নগদ | নগদ প্রবাহ বিবরণী, প্রথম বিভাগ |
| মূলধনী ব্যয় | বৃদ্ধির জন্য বিনিয়োগ, মুক্ত নগদ প্রবাহ গণনা | বিনিয়োগ কার্যক্রম থেকে নগদ প্রবাহ |
| মুক্ত নগদ প্রবাহ | কার্যক্রম রক্ষণাবেক্ষণের পরে উপলব্ধ নগদ | পরিচালন নগদ প্রবাহ বিয়োগ মূলধনী ব্যয় |
| প্রদত্ত লভ্যাংশ | শেয়ারহোল্ডারদের রিটার্ন, পেআউট অনুপাত | অর্থায়ন কার্যক্রম থেকে নগদ প্রবাহ |
প্রাপ্ত অনুপাত এবং মার্জিন
কাঁচা মেট্রিকগুলি বের করার পরে, বিশ্লেষকরা গণনা করেন:
- মোট মার্জিন: মোট লাভ / রাজস্ব
- পরিচালন মার্জিন: পরিচালন আয় / রাজস্ব
- নীট মার্জিন: নীট আয় / রাজস্ব
- ইক্যুইটির উপর রিটার্ন (ROE): নীট আয় / শেয়ারহোল্ডারদের ইক্যুইটি
- সম্পদের উপর রিটার্ন (ROA): নীট আয় / মোট সম্পদ
- ঋণ-থেকে-ইক্যুইটি: মোট ঋণ / মোট ইক্যুইটি
- চলতি অনুপাত: চলতি সম্পদ / চলতি দায়
- সুদ কভারেজ: EBIT / সুদের ব্যয়
এই অনুপাতগুলির জন্য অন্তর্নিহিত উপাদানগুলির পরিষ্কার, সঠিক এক্সট্রাকশন প্রয়োজন। একটি ভুল সংখ্যা পুরো অনুপাতকে নষ্ট করে দেয়।
অসংগঠিত নথিতে লুকানো কাঠামোগত ডেটা
মূল প্রযুক্তিগত চ্যালেঞ্জ হলো কাঠামোগত ডেটা — সুনির্দিষ্ট অর্থ এবং সম্পর্কযুক্ত সংখ্যা — অসংগঠিত নথিতে এম্বেড করা আছে। একটি আর্থিক বিবরণী একটি টেবিল, তবে এটি একটি PDF-এর ভিতরে থাকে যেখানে বর্ণনামূলক অনুচ্ছেদ, আইনি দাবিত্যাগ, ছবি এবং পৃষ্ঠার হেডারও থাকে।
এটি সাধারণ টেবিল স্বীকৃতির বাইরেও বেশ কয়েকটি এক্সট্রাকশন সমস্যা তৈরি করে:
- প্রসঙ্গ-নির্ভর সংখ্যা। "১২,৩৪৩" সংখ্যাটির অর্থ নির্ভর করে এটি কোথায় প্রদর্শিত হয় তার উপর। রাজস্ব লাইনে, এর অর্থ $১২,৩৪৩ মিলিয়ন (বা হাজার, আর্থিক বিবরণীর শীর্ষে উল্লিখিত রিপোর্টিং ইউনিটের উপর নির্ভর করে)। নির্বাহী ক্ষতিপূরণে, এটি প্রকৃত ডলারে $১২,৩৪৩ হতে পারে। কার্যকর এক্সট্রাকশনের জন্য একটি সংখ্যা কোন বিভাগের অন্তর্গত এবং কলাম হেডার এবং ইউনিট ডিনোমিনেশন কী বলে তা বোঝা প্রয়োজন।
- নেস্টেড এবং স্প্যানিং টেবিল। বার্ষিক প্রতিবেদন টেবিলগুলি বিভাগ হেডার, মূল বিভাগের অধীনে ইন্ডেন্টেড সাব-আইটেম, লাইন আইটেমগুলির সাথে মিশ্রিত সাবটোটাল, বহু-বছরের তুলনামূলক কলাম এবং খালি বিভাজক সারিগুলির জন্য মার্জ করা সেল ব্যবহার করে। একটি আনাড়ি এক্সট্রাকশন টুল প্রতিটি ভিজ্যুয়াল এলিমেন্টকে একটি ডেটা পয়েন্ট হিসাবে বিবেচনা করে, যা ফ্যান্টম সারি এবং মার্জ করা মানগুলির পূর্ণ মিসলাইনড স্প্রেডশীট তৈরি করে।
- ফুটনোট রেফারেন্স। "১২,৩৪৩^(১)" এর রাজস্ব এক্সট্রাকশন টুল দ্বারা সেমান্টিক বোঝাপড়া ছাড়াই "১২৩৪৫ ১" হয়ে যায়। সুপারস্ক্রিপ্ট PDF-এ একটি পৃথক পজিশনড অক্ষর। এক্সট্রাকশন টুলগুলি হয় এটি সরিয়ে দেয় (রেফারেন্স হারিয়ে যায়) অথবা এটি অন্তর্ভুক্ত করে (সংখ্যা নষ্ট করে)।
এআই এক্সট্রাকশন বার্ষিক প্রতিবেদনগুলি কীভাবে পরিচালনা করে
এআই-চালিত এক্সট্রাকশন একটি মৌলিকভাবে ভিন্ন পদ্ধতি গ্রহণ করে। কেবল স্থানিক বিশ্লেষণের উপর নির্ভর করার পরিবর্তে — অক্ষরের অবস্থানগুলির উপর ভিত্তি করে সারি এবং কলাম সনাক্তকরণ — এটি স্থানিক সচেতনতাকে সেমান্টিক বোঝার সাথে একত্রিত করে।
লেআউট-সচেতন টেবিল সনাক্তকরণ গ্রিড লাইন খোঁজার বাইরে যায় (অনেক আর্থিক টেবিলে কোনও দৃশ্যমান সীমানা থাকে না)। সিস্টেমটি অক্ষরের ব্যবধানের প্যাটার্ন, দশমিক পয়েন্টের অ্যালাইনমেন্ট, বিন্যাস পুনরাবৃত্তি এবং হেডার সারিগুলি বিশ্লেষণ করে টেবিলের সীমানা সনাক্ত করে। এটি একটি বর্ণনামূলক অনুচ্ছেদকে যা সংখ্যার সাথে ঘটে তা থেকে ডেটা সহ একটি টেবিল থেকে আলাদা করতে পারে।
সেমান্টিক ফিল্ড রিকগনিশন প্রতিটি কলাম এবং সারি কী প্রতিনিধিত্ব করে তা সনাক্ত করে। এটি স্বীকার করে যে "Revenue," "Net sales," "Total revenue," এবং "Net revenues" সবই একই ধারণাকে বোঝায়। এটি বোঝে যে একটি আর্থিক প্রসঙ্গে "(১,২৩৪)" মানে নেতিবাচক ১,২৩৪, ফুটনোট রেফারেন্স নয়। এটি গুরুত্বপূর্ণ কারণ কোম্পানিগুলির মধ্যে নামকরণের নিয়মগুলি ব্যাপকভাবে পরিবর্তিত হয় — একটি রিপোর্ট করে "Stockholders' equity" অন্যটি "Shareholders' equity" বা "Total equity" ব্যবহার করে।
মাল্টি-পেজ টেবিল কন্টিনিউয়েশন পৃষ্ঠা বিরতি জুড়ে পুনরাবৃত্ত হেডার প্যাটার্ন এবং সামঞ্জস্যপূর্ণ কলাম অ্যালাইনমেন্ট সনাক্ত করে পরিচালনা করা হয়। আয় বিবরণী পৃষ্ঠা ৮৪-এ শুরু হয়ে ৮৫-এ চলতে পারে, এবং এআই এক্সট্রাকশন ডেটা একটি একক সুসংগত টেবিলে সেলাই করে।
বার্ষিক প্রতিবেদনে লক্ষ্য করার জন্য মূল বিভাগগুলি
বার্ষিক প্রতিবেদনের প্রতিটি বিভাগে এক্সট্র্যাক্টযোগ্য আর্থিক ডেটা থাকে না। কোথায় ফোকাস করতে হবে তা জানা সময় বাঁচায় এবং নির্ভুলতা উন্নত করে।
আর্থিক বিবরণী হলো প্রাথমিক এক্সট্রাকশন লক্ষ্য: কনসোলিডেটেড স্টেটমেন্টস অফ ইনকাম, ব্যালেন্স শীট, ক্যাশ ফ্লোস, এবং স্টকহোল্ডারস ইক্যুইটি। এই চারটি বিবরণীতে কাঁচা সংখ্যা থাকে যা আর্থিক মডেলগুলিকে চালিত করে।
ম্যানেজমেন্ট ডিসকাশন অ্যান্ড অ্যানালাইসিস (MD&A) হলো যেখানে ম্যানেজমেন্ট সংখ্যাগুলি ব্যাখ্যা করে। এটি প্রায়শই অ-GAAP মেট্রিক যেমন অ্যাডজাস্টেড EBITDA এবং ফ্রি ক্যাশ ফ্লো, সেগমেন্ট-স্তরের বিভাজন এবং ফরোয়ার্ড-লুকিং গাইডেন্স ধারণ করে — সবই টেবিলের পরিবর্তে বর্ণনামূলক অনুচ্ছেদে এম্বেড করা থাকে। এআই এক্সট্রাকশন এই চিত্রগুলি সনাক্ত এবং টানতে পারে, তবে টেবিল ডেটার চেয়ে বেশি প্রাসঙ্গিক বোঝার প্রয়োজন।
সেগমেন্ট রিপোর্টিং ব্যবসায়িক ইউনিট, ভূগোল বা পণ্যের লাইন অনুসারে ফলাফলগুলি ভেঙে দেয়। এই ডেটা সাম-অফ-দ্য-পার্টস মূল্যায়নের জন্য অপরিহার্য। সেগমেন্ট টেবিলগুলিতে প্রায়শই অ-মানক কাঠামো থাকে যেখানে সেগমেন্টের নামগুলি কলাম হেডার হিসাবে এবং ইন্টারসেগমেন্ট এলিমিনেশনগুলি নেতিবাচক সারি যুক্ত করে।
আর্থিক বিবরণীর নোট সবচেয়ে বিস্তারিত ডেটা ধারণ করে: মেয়াদপূর্তির তারিখ সহ ঋণের সময়সূচী, পণ্য বা ভূগোল অনুসারে রাজস্ব বিভাজন, লিজ বাধ্যবাধকতা, পেনশন বিবরণ, কর হার পুনর্মিলন, এবং সেগমেন্ট অনুসারে গুডউইল বিভাজন। এগুলি বের করা সবচেয়ে কঠিন কারণ এগুলি বর্ণনামূলক পাঠ্যকে ছোট এম্বেড করা টেবিলের সাথে মিশ্রিত করে।
ঝুঁকির কারণগুলি বেশিরভাগই গুণগত, তবে কখনও কখনও পরিমাণগত প্রকাশনা ধারণ করে: ঘনত্ব ঝুঁকির শতাংশ, মামলার রিজার্ভ, বা আইনি ভাষার অনুচ্ছেদে লুকানো নিয়ন্ত্রক মূলধনের প্রয়োজনীয়তা।
PDFSub দিয়ে বার্ষিক প্রতিবেদন ডেটা এক্সট্রাক্ট করা
PDFSub বার্ষিক প্রতিবেদন এক্সট্রাকশনের জন্য বিশেষভাবে উপযুক্ত দুটি সরঞ্জাম সরবরাহ করে: Extract Tables টুল এবং Financial Report Analyzer।
Extract Tables: আর্থিক বিবরণী স্প্রেডশীটে টানুন
Extract Tables টুল PDF ডকুমেন্ট থেকে টেবুলার ডেটা সনাক্ত এবং এক্সট্রাক্ট করে। বার্ষিক প্রতিবেদনের জন্য, এর অর্থ হলো:
১. বার্ষিক প্রতিবেদন PDF আপলোড করুন — ফাইলটি ড্র্যাগ এবং ড্রপ করুন। SEC EDGAR বা কোম্পানির ইনভেস্টর রিলেশনস পেজ থেকে ডাউনলোড করা ডিজিটাল PDF-এর জন্য, প্রাথমিক প্রক্রিয়াকরণ আপনার ব্রাউজারে ঘটে। সার্ভার-সাইড এআই প্রক্রিয়াকরণের প্রয়োজন না হলে ফাইলটি আপনার ডিভাইস ছেড়ে যায় না। ২. স্বয়ংক্রিয় টেবিল সনাক্তকরণ — টুলটি ডকুমেন্টের সমস্ত টেবিল অঞ্চল সনাক্ত করে, পৃষ্ঠা বিরতি জুড়ে থাকা মাল্টি-পেজ টেবিল সহ। ৩. এক্সট্রাক্ট করা টেবিলগুলি পর্যালোচনা করুন — সনাক্ত করা প্রতিটি টেবিল তার এক্সট্রাক্ট করা ডেটা সহ প্রদর্শিত হয়। আপনি যাচাই করতে পারেন যে কলামগুলি সঠিকভাবে সারিবদ্ধ আছে এবং মানগুলি সঠিক। ৪. Excel বা CSV তে এক্সপোর্ট করুন — আর্থিক মডেলিংয়ের জন্য প্রস্তুত ফরম্যাটে এক্সট্রাক্ট করা টেবিলগুলি ডাউনলোড করুন।
এই পদ্ধতিটি মূল আর্থিক বিবরণীগুলির (আয় বিবরণী, ব্যালেন্স শীট, নগদ প্রবাহ) জন্য ভাল কাজ করে যেখানে ডেটা স্পষ্ট টেবুলার বিন্যাসে উপস্থাপন করা হয়।
Financial Report Analyzer: এআই-চালিত মেট্রিক এক্সট্রাকশন
Financial Report Analyzer টেবিল এক্সট্রাকশনের বাইরেও যায়। এটি পুরো নথিটি পড়তে, এর কাঠামো বুঝতে এবং বর্ণনামূলক পাঠ্য বা ফুটনোটগুলিতে এম্বেড করা সহ নির্দিষ্ট আর্থিক মেট্রিকগুলি এক্সট্রাক্ট করতে এআই ব্যবহার করে।
বার্ষিক প্রতিবেদনের জন্য, বিশ্লেষক পারেন:
- ডকুমেন্টের সমস্ত বিভাগ জুড়ে মূল আর্থিক মেট্রিকগুলি সনাক্ত এবং এক্সট্রাক্ট করুন
- MD&A বিভাগ থেকে অ-GAAP মেট্রিকগুলি টানুন
- রিপোর্টিং টেবিল থেকে সেগমেন্ট-স্তরের ডেটা এক্সট্রাক্ট করুন
- একই মেট্রিকের জন্য বিভিন্ন নামকরণের নিয়মগুলি সনাক্ত এবং পরিচালনা করুন
- রিপোর্টিং পিরিয়ড এবং পরিমাপের ইউনিট সহ এক্সট্রাক্ট করা সংখ্যাগুলির জন্য প্রসঙ্গ সরবরাহ করুন।
উভয় সরঞ্জাম একত্রিত করা
বার্ষিক প্রতিবেদনের জন্য সবচেয়ে কার্যকর ওয়ার্কফ্লো উভয় পদ্ধতিকে একত্রিত করে:
১. Extract Tables ব্যবহার করে মূল আর্থিক বিবরণীগুলি (আয় বিবরণী, ব্যালেন্স শীট, নগদ প্রবাহ) সম্পূর্ণ টেবিল বিশ্বস্ততার সাথে এক্সেলে টানুন। ২. Financial Report Analyzer ব্যবহার করে বর্ণনামূলক বিভাগ, ফুটনোট এবং অ-মানক টেবিল থেকে নির্দিষ্ট মেট্রিকগুলি এক্সট্রাক্ট করুন। ৩. নির্ভুলতা যাচাই করার জন্য ফলাফলগুলি ক্রস-রেফারেন্স করুন।
উভয় সরঞ্জাম PDFSub-এর ৭-দিনের বিনামূল্যের ট্রায়াল এর সাথে উপলব্ধ, তাই আপনি প্রতিশ্রুতিবদ্ধ হওয়ার আগে আপনার আসল বার্ষিক প্রতিবেদনগুলির বিরুদ্ধে সেগুলি পরীক্ষা করতে পারেন।
আর্থিক মডেলিংয়ের জন্য Excel এবং CSV তে এক্সপোর্ট করুন
এক্সট্রাকশন কেবল তখনই দরকারী যদি আউটপুট আপনার ওয়ার্কফ্লোতে ফিট করে। এক্সট্রাক্ট করা টেবিলগুলি .xlsx ফাইল হিসাবে এক্সপোর্ট হয় যেখানে সঠিকভাবে টাইপ করা সাংখ্যিক সেল, সংরক্ষিত কলাম অ্যালাইনমেন্ট, প্রতিটি টেবিলের জন্য পৃথক শীট এবং পরিষ্কার হেডার থাকে। CSV পছন্দকারী বিশ্লেষকদের জন্য (ডাটাবেস এবং স্ক্রিপ্টিং সরঞ্জামগুলির জন্য সাধারণ), আপনি UTF-8 এনকোডিং সহ কমা-বিভাজিত আউটপুট এবং প্রতিটি এক্সট্রাক্ট করা টেবিলের জন্য একটি ফাইল পান।
একটি সাধারণ পোস্ট-এক্সট্রাকশন ওয়ার্কফ্লো: আয় বিবরণী, ব্যালেন্স শীট এবং নগদ প্রবাহ বিবরণী এক্সট্রাক্ট করুন; তিনটি টেবিল আপনার মডেল টেমপ্লেটে আমদানি করুন; আপনার স্ট্যান্ডার্ডাইজড রো লেবেলগুলিতে ফিল্ড নামগুলি ম্যাপ করুন; মোটগুলি মেলে কিনা তা যাচাই করুন; প্রাপ্ত অনুপাত গণনা করুন; এবং পূর্ববর্তী বছরের প্রতিবেদনগুলির জন্য পুনরাবৃত্তি করে সময় সিরিজ তৈরি করুন। এটি ম্যানুয়াল টাইপিং প্রতিস্থাপন করে এবং প্রতি কোম্পানি প্রতি এন্ড-টু-এন্ড সময় ৪৫ মিনিট থেকে ৫ মিনিটের নিচে কমিয়ে আনে।
ব্যবহারের ক্ষেত্র: কারা বার্ষিক প্রতিবেদন ডেটা এক্সট্রাক্ট করে
ইক্যুইটি গবেষণা। বিশ্লেষকরা ৫ থেকে ১০ বছরের ঐতিহাসিক ডেটা এবং ৩ থেকে ৫ বছরের প্রজেকশন সহ আর্থিক মডেল তৈরি করেন। ১৫টি কোম্পানির একটি কভারেজ ইউনিভার্সের অর্থ বছরে ১৫টি বার্ষিক প্রতিবেদন এবং ৬০টি ত্রৈমাসিক প্রতিবেদন থেকে ডেটা এক্সট্রাক্ট করা। স্বয়ংক্রিয় এক্সট্রাকশন এটিকে একটি বহু-দিনের ডেটা এন্ট্রি অনুশীলন থেকে একই-দিনের কাজে রূপান্তরিত করে।
ক্রেডিট বিশ্লেষণ। ক্রেডিট বিশ্লেষকরা Debt/EBITDA (লিভারেজ), EBITDA/Interest Expense (কভারেজ), Current Ratio (লিকুইডিটি), এবং Debt/Total Capitalization (ক্যাপিটাল স্ট্রাকচার) এর মতো মেট্রিকগুলি ব্যবহার করে ঋণগ্রহীতার ঋণযোগ্যতা মূল্যায়ন করেন। একটি বাণিজ্যিক ব্যাংকের ঋণ পোর্টফোলিওতে শত শত ঋণগ্রহীতা থাকতে পারে, প্রত্যেকে বার্ষিক আর্থিক বিবরণী জমা দেয় যেখান থেকে এই মেট্রিকগুলি এক্সট্রাক্ট করা প্রয়োজন।
বেঞ্চমার্কিং এবং প্রতিযোগিতামূলক বিশ্লেষণ। একটি কোম্পানিকে তার সমকক্ষদের সাথে তুলনা করার জন্য ৫ থেকে ১৫টি বার্ষিক প্রতিবেদন থেকে একই মেট্রিকগুলি এক্সট্রাক্ট করা, বিভিন্ন ফিসকাল বছর শেষ, রিপোর্টিং ইউনিট এবং অ্যাকাউন্টিং মান (US GAAP বনাম IFRS) এর জন্য স্বাভাবিকীকরণ প্রয়োজন।
পোর্টফোলিও পর্যবেক্ষণ। ৩০ থেকে ১০০টি হোল্ডিং ট্র্যাক করা বিনিয়োগ পরিচালকরা ত্রৈমাসিকভাবে একটি স্ট্যান্ডার্ড মনিটরিং মেট্রিক্স সেট এক্সট্রাক্ট করেন: রাজস্ব বৃদ্ধি, EBITDA মার্জিন প্রবণতা, নীট ঋণ/EBITDA, মুক্ত নগদ প্রবাহ ইল্ড, এবং বিনিয়োগকৃত মূলধনের উপর রিটার্ন। স্বয়ংক্রিয় এক্সট্রাকশন এটিকে স্কেলে সম্ভব করে তোলে।
বহু-বছরের এক্সট্রাকশন: সময় সিরিজ ডেটা তৈরি করা
আর্থিক বিশ্লেষণ মূলত প্রবণতা সম্পর্কে: রাজস্ব কি ত্বরান্বিত হচ্ছে? মার্জিন কি প্রসারিত হচ্ছে? কোম্পানি কি ঋণমুক্ত হচ্ছে? এই প্রশ্নগুলির উত্তর দেওয়ার জন্য কমপক্ষে তিন থেকে পাঁচ বছর বিস্তৃত সময় সিরিজ ডেটা প্রয়োজন।
পদ্ধতি ১: প্রতিটি বার্ষিক প্রতিবেদন থেকে এক্সট্রাক্ট করুন
বার্ষিক প্রতিবেদনগুলিতে সাধারণত দুই বছরের আয় বিবরণীর ডেটা (বর্তমান বছর এবং পূর্ববর্তী বছর) এবং দুই বছরের ব্যালেন্স শীট ডেটা থাকে। কিছু তিন বছরের তুলনামূলক আয় বিবরণী অন্তর্ভুক্ত করে।
পাঁচ বছরের সময় সিরিজ তৈরি করতে, আপনার তিনটি বার্ষিক প্রতিবেদন থেকে এক্সট্রাক্ট করতে হবে:
- ২০২৫ বার্ষিক প্রতিবেদন: ২০২৫ এবং ২০২৪ ডেটা ধারণ করে
- ২০২৩ বার্ষিক প্রতিবেদন: ২০২৩ এবং ২০২২ ডেটা ধারণ করে
- ২০২১ বার্ষিক প্রতিবেদন: ২০২১ এবং ২০২০ ডেটা ধারণ করে
এটি আপনাকে ওভারল্যাপিং বছর দেয় (২০২৪ উভয় ২০২৫ এবং ২০২৪ প্রতিবেদনে উপস্থিত হয়) যা একটি ক্রস-চেক হিসাবে কাজ করে।
পদ্ধতি ২: 10-K নির্বাচিত আর্থিক ডেটা ব্যবহার করুন
কিছু কোম্পানি একটি "নির্বাচিত আর্থিক ডেটা" টেবিল অন্তর্ভুক্ত করে যা একটি একক টেবিলে পাঁচ থেকে দশ বছরের মূল মেট্রিকগুলি উপস্থাপন করে। যখন উপলব্ধ থাকে, এটি একটি বহু-বছরের সময় সিরিজের দ্রুততম পথ। তবে, এসইসি ২০২১ সালে এই টেবিলের প্রয়োজনীয়তা বাতিল করেছে, এবং অনেক কোম্পানি তখন থেকে এটি বাদ দিয়েছে।
পদ্ধতি ৩: SEC EDGAR XBRL ডেটা থেকে এক্সট্রাক্ট করুন
মার্কিন পাবলিক কোম্পানিগুলির জন্য, এসইসি ফাইলিংগুলিতে XBRL-ট্যাগযুক্ত ডেটা অন্তর্ভুক্ত থাকে যা PDF এক্সট্রাকশন ছাড়াই মেশিন-পঠনযোগ্য। এসইসি-র EDGAR সিস্টেম JSON-ফরম্যাট করা ডেটা সরবরাহ করে যা স্ট্যান্ডার্ডাইজড লাইন আইটেমগুলির জন্য RESTful API সরবরাহ করে। তবে, XBRL-এর সীমাবদ্ধতা রয়েছে: কাস্টম লাইন আইটেমগুলি ধারাবাহিকভাবে ট্যাগ করা নাও হতে পারে, অ-GAAP মেট্রিকগুলি বিরলভাবে উপলব্ধ, সেগমেন্ট ডেটা অনুপস্থিত থাকতে পারে এবং উপস্থাপনার ক্রম মূল ফাইলিংয়ের সাথে নাও মিলতে পারে। সম্পূর্ণ, উপস্থাপনা-সামঞ্জস্যপূর্ণ আর্থিক ডেটার জন্য PDF এক্সট্রাকশন সবচেয়ে নির্ভরযোগ্য উৎস হিসাবে রয়ে গেছে।
সময় সিরিজ স্প্রেডশীট তৈরি করা
একবার আপনার কাছে একাধিক বছরের এক্সট্রাক্ট করা ডেটা হয়ে গেলে, সারি হিসাবে মেট্রিক এবং কলাম হিসাবে বছর সহ একটি মাস্টার স্প্রেডশীট তৈরি করুন। প্রতিটি বছরের ডেটা আমদানি করুন, ওভারল্যাপিং বছরগুলি প্রতিবেদন জুড়ে মেলে কিনা তা যাচাই করুন, বৃদ্ধির হার এবং অনুপাতগুলির জন্য গণনা করা সারি যুক্ত করুন এবং তুলনামূলকতা ভঙ্গ করে এমন কোনও পুনর্গঠন ফ্ল্যাগ করুন।
গুণমান পরীক্ষা: এক্সট্রাক্ট করা ডেটা যাচাই করা
স্বয়ংক্রিয় এক্সট্রাকশন দ্রুত, তবে আপনার সর্বদা আউটপুট যাচাই করা উচিত। বার্ষিক প্রতিবেদনগুলিতে যাচাইকরণ সহজ করার জন্য বিল্ট-ইন ক্রস-চেক থাকে।
ব্যালেন্স শীট সমীকরণ
সবচেয়ে মৌলিক পরীক্ষা: মোট সম্পদ = মোট দায় + মোট শেয়ারহোল্ডারদের ইক্যুইটি।
যদি এই সমীকরণটি আপনার এক্সট্রাক্ট করা ডেটাতে না মেলে, তবে কিছু ভুল হয়েছে। হয় একটি সংখ্যা ভুল পড়া হয়েছে, একটি সারি বাদ দেওয়া হয়েছে, বা কলামগুলি ভুলভাবে সারিবদ্ধ করা হয়েছে। এই একক পরীক্ষাটি এক্সট্রাকশন ত্রুটির একটি বড় শতাংশ ধরে ফেলে।
আয় বিবরণী প্রবাহ
সমস্ত ব্যয় বিয়োগ রাজস্ব নীট আয়ের সমান হওয়া উচিত। পাটিগণিত যাচাই করুন:
রাজস্ব
- বিক্রয়কৃত পণ্যের ব্যয়
= মোট লাভ
- পরিচালন ব্যয়
= পরিচালন আয়
- সুদের ব্যয়
+ সুদের আয়
- করের বিধান
= নীট আয়
যদি সাবটোটালগুলি যোগ না হয়, তবে কোন লাইন আইটেমগুলি মিস করা হয়েছে বা ভুলভাবে এক্সট্রাক্ট করা হয়েছে তা পরীক্ষা করুন।
নগদ প্রবাহ পুনর্মিলন
নগদ প্রবাহ বিবরণী নীট আয় দিয়ে শুরু হয় এবং নগদের পরিবর্তনে শেষ হয়। সেই শেষ পরিবর্তনটি ব্যালেন্স শীটে শুরু এবং শেষের নগদের পার্থক্যের সাথে পুনর্মিলিত হওয়া উচিত।
শুরুর নগদ ব্যালেন্স (ব্যালেন্স শীট থেকে)
+ নীট নগদ পরিবর্তন (নগদ প্রবাহ বিবরণী থেকে)
= শেষের নগদ ব্যালেন্স (ব্যালেন্স শীট থেকে)
যুক্তিসঙ্গততা এবং স্পট চেক
অবিশ্বাস্য মানগুলির জন্য এক্সট্রাক্ট করা ডেটা স্ক্যান করুন: রাজস্ব বছরে ৫০% এর বেশি পরিবর্তিত হচ্ছে, নেতিবাচক মোট সম্পদ, শেয়ার প্রতি আয় যা শেয়ার প্রতি আয়কে শেয়ার সংখ্যা দিয়ে ভাগ করার সাথে সঙ্গতিপূর্ণ নয়, বা শিল্পের স্বাভাবিকতার বাইরে মার্জিন (উৎপাদনে ৯০% নীট মার্জিন একটি দশমিক ত্রুটি নির্দেশ করে)। তারপরে তিনটি থেকে পাঁচটি সংখ্যা এলোমেলোভাবে নির্বাচন করুন, আসল PDF-এ ফিরে যান এবং যাচাই করুন যে সেগুলি মেলে। এটি ৩০ সেকেন্ড সময় নেয় এবং ভুল কলাম থেকে ডেটা এক্সট্রাক্ট করার মতো পদ্ধতিগত ত্রুটিগুলি ধরে ফেলে।
উন্নত এক্সট্রাকশন ফলাফলের জন্য টিপস
ডিজিটাল বার্ষিক প্রতিবেদন ব্যবহার করুন, স্ক্যান করা কপি নয়। ডিজিটাল PDF স্ক্যান করা ডকুমেন্টের চেয়ে অনেক নির্ভুলভাবে এক্সট্রাক্ট করে। মার্কিন পাবলিক কোম্পানিগুলির জন্য, সর্বদা SEC EDGAR (ফাইলিংগুলি সংজ্ঞানুসারে ডিজিটাল) বা কোম্পানির ইনভেস্টর রিলেশনস পেজ থেকে ডাউনলোড করুন। প্রিন্টেড রিপোর্টগুলি PDF-এ স্ক্যান করা এবং বিপণনের জন্য ডিজাইন করা চিত্র-ভারী "গ্লসি" বার্ষিক প্রতিবেদনগুলি এড়িয়ে চলুন।
বার্ষিক প্রতিবেদন শেয়ারহোল্ডারদের জন্য 10-K ব্যবহার করুন, বার্ষিক প্রতিবেদন নয়। পাবলিক কোম্পানিগুলি প্রায়শই একটি 10-K ফাইলিং (স্ট্যান্ডার্ডাইজড আর্থিক বিবরণী) এবং একটি বার্ষিক প্রতিবেদন শেয়ারহোল্ডারদের জন্য (গ্লসি ছবি সহ বিপণন নথি) উভয়ই তৈরি করে। 10-K-তে স্ট্যান্ডার্ডাইজড GAAP উপস্থাপনা, সামঞ্জস্যপূর্ণ টেবিল বিন্যাস, সম্পূর্ণ ফুটনোট থাকে এবং EDGAR থেকে সর্বদা ডিজিটাল PDF হিসাবে উপলব্ধ থাকে।
এক্সট্রাক্ট করার আগে রিপোর্টিং ইউনিট সনাক্ত করুন। প্রতিটি আর্থিক বিবরণীর শীর্ষে "মিলিয়নে, প্রতি শেয়ারের পরিমাণ ব্যতীত" বা "হাজারে" এর মতো একটি নোট থাকে। আপনি যদি এটি মিস করেন, "৪৫,২৩১" এর রাজস্ব অঙ্ক $৪৫.২ বিলিয়ন বা $৪৫.২ মিলিয়ন হতে পারে। সর্বদা পরীক্ষা করুন এবং সঠিক গুণক প্রয়োগ করুন।
ফিসকাল বছরের পার্থক্যগুলি পরিচালনা করুন। সমস্ত কোম্পানি ক্যালেন্ডার ফিসকাল বছর ব্যবহার করে না। অ্যাপল সেপ্টেম্বরে শেষ হয়, ওয়ালমার্ট জানুয়ারিতে, মাইক্রোসফট জুনে। ফিসকাল বছরের শেষ তারিখ প্রতিটি আর্থিক বিবরণীর শীর্ষে উল্লেখ করা হয়।
পুনর্গঠনগুলির জন্য নজর রাখুন। যখন কোনও কোম্পানি পূর্ববর্তী বছরের আর্থিক বিবরণী পুনর্গঠন করে, তখন পুনর্গঠিত সংখ্যাগুলি বর্তমান বছরের বার্ষিক প্রতিবেদনে প্রদর্শিত হয়। ২০২৫ প্রতিবেদনের ২০২৪ ডেটা ২০২৪ প্রতিবেদনের ২০২৪ ডেটা থেকে ভিন্ন হতে পারে। সময় সিরিজ তৈরি করার সময় সর্বদা সবচেয়ে সম্প্রতি পুনর্গঠিত পরিসংখ্যান ব্যবহার করুন।
শুরু করা
বার্ষিক প্রতিবেদন এক্সট্রাকশন ম্যানুয়াল, ত্রুটি-প্রবণ প্রক্রিয়া হওয়ার প্রয়োজন নেই। ব্যবহারিক ওয়ার্কফ্লো: SEC EDGAR থেকে 10-K ডাউনলোড করুন, এটি PDFSub-এর Extract Tables টুল বা Financial Report Analyzer এ আপলোড করুন, আউটপুট পর্যালোচনা করুন, Excel বা CSV তে এক্সপোর্ট করুন, উপরে বর্ণিত গুণমান পরীক্ষাগুলি চালান এবং যাচাইকৃত ডেটা আপনার আর্থিক মডেলে আমদানি করুন।
PDFSub একটি ৭-দিনের বিনামূল্যের ট্রায়াল অফার করে যাতে আপনি আপনার আসল বার্ষিক প্রতিবেদনগুলির বিরুদ্ধে এক্সট্রাকশন সরঞ্জামগুলি পরীক্ষা করতে পারেন। এটি পূর্বে ম্যানুয়ালি এক্সট্রাক্ট করা একটি 10-K দিয়ে চেষ্টা করুন এবং ফলাফলগুলির তুলনা করুন — উভয় নির্ভুলতা এবং সময় সাশ্রয়।
নিয়মিত বার্ষিক প্রতিবেদন প্রক্রিয়া করে এমন আর্থিক পেশাদারদের জন্য, স্বয়ংক্রিয় এক্সট্রাকশন একটি প্রতিযোগিতামূলক সুবিধা। যে বিশ্লেষক ডেটা এক্সট্রাক্ট করতে ৫ মিনিট এবং বিশ্লেষণ করতে ৫৫ মিনিট ব্যয় করেন তিনি সেই বিশ্লেষকের চেয়ে ধারাবাহিকভাবে ভাল পারফর্ম করবেন যিনি এক্সট্রাক্ট করতে ৫৫ মিনিট এবং বিশ্লেষণ করতে ৫ মিনিট ব্যয় করেন।