বর্তমান সময়:0:00পুরো সময়কাল:7:05
0 শক্তি পয়েন্ট
ভিডিও ট্রান্সক্রিপ্ট
## আগামী ও গ্রামীণফোন এর সহযোগিতায় অনূদিত ## মনে করা যাক আমাদের কাছে দুইটি মেশিন আছে। দুইটি মেশিনই A, B, C অথবা D বর্ণমালাগুলো ব্যবহার করে কিছু বার্তা আউটপুট হিসেবে প্রদান করে। মেশিন এক প্রতিটি চিহ্ন দৈবভাবে তৈরি করে, এই চিহ্নগুলোর প্রতিটির আউটপুট হিসেবে আসার সম্ভাবনা ২৫% করে, যেখানে মেশিন ২ নিচের সম্ভাবনা অনুযায়ী চিহ্নগুলো আউটপুট হিসেবে প্রকাশ করে। তাহলে কোন মেশিনটি সবচেয়ে বেশি তথ্য উপস্থাপন করছে? ক্লড শ্যানন একটু ভিন্নভাবে এই প্রশ্নটি উপস্থাপন করেছেন। যদি তোমাকে দুইটি মেশিন থেকে বের হওয়া, পরবর্তী চিহ্ন অনুমান করতে বলা হয়, তাহলে সর্বনিম্ন কতগুলো হ্যাঁ এবং না প্রশ্ন তোমাকে করতে হবে বলে তুমি মনে কর? প্রথমে মেশিন এক এর দিকে দেখা যাক। সবচেয়ে কার্যকরী পন্থা হল একটি প্রশ্নকে সেই রকমভাবে উপস্থাপন করা যেটা সম্ভাবনাকে দুইটি আলাদাভাগে ভাগ করে দিবে। উদাহরণস্বরূপ, আমাদের প্রথম প্রশ্নটি হল, আমরা এখানে প্রশ্ন করতে পারি, এখানে কোন চিহ্ন দুইটি হতে পারে, যেমন- " এটা কি A অথবা B?", যেহেতু এখানে A অথবা B আসার ৫০% সম্ভাবনা আছে এবং একই সাথে C অথবা D আসার ৫০% সম্ভাবনা আছে। উত্তরটি পাবার পরে আমরা, অর্ধেক সম্ভাবনা বাদ দিয়ে দিতে পারি, এবং আমাদের কাছে তাহলে দুইটি চিহ্ন থাকবে আর চিহ্ন দুইটি আসার সম্ভাবনা সমান। সুতরাং আমরা একদম সাধারনভাবে একটি চিহ্ন নির্বাচন করতে পারি, যেমন- " এটা কি A?", এবং এই দ্বিতীয় প্রশ্নটি করার পরে আমরা সঠিকভাবে চিহ্নটি চিহ্নিত করতে সক্ষম হব। তাহলে আমরা এখন বলতে পারি, মেশিন এক এর ক্ষেত্রে অনিশ্চয়তার মাত্রা হল প্রতি চিহ্নের জন্য দুইটি প্রশ্ন করে। এখন মেশিন দুই এর ক্ষেত্রে তাহলে কি হবে? মেশন এক এর ক্ষেত্রে আমরা যেটা করেছি সেটা হল পরবর্তী চিহ্নটি কি হবে তা নির্ধারণ করার জন্য আমরা দুইটি প্রশ্ন করতে পেরেছি। যেহেতু এইবার প্রতিটি চিহ্ন আসার সম্ভাবনা ভিন্ন ভিন্ন, তাই একটু ভিন্নভাবে আমরা এখানে প্রশ্ন করতে পারি। এখানে A চিহ্নটি আসার সম্ভাবনা আছে ৫০%, এবং বাকি চিহ্ন বা অক্ষরগুলো যোগ করে সেগুলো আসার সম্ভাবনা সব মিলিয়ে ৫০%। তাহলে আমরা এখানে এই প্রশ্নটি দিয়ে শুরু করতে পারি "এটা কি A?", উত্তরটি যদি A হয় তাহলে আমাদের কাজ হয়ে গেল, আমাদের এখানে শুধুমাত্র একটি প্রশ্ন করতে হল। অন্যথায়, আমাদের কাছে আরও দুইটি সমান সম্ভাবনা থাকবে, D অথবা B এবং C। আমার আবার প্রশ্ন করতে পারি, "এটা কি D?" উত্তর যদি হ্যাঁ হয়, তাহলে আমাদের কাজ দুইটি প্রশ্নের মাধ্যমেই শেষ। অন্যথায় তিন নম্বর প্রশ্নটি আমাদের জিজ্ঞেস করতে হবে শেষের চিহ্ন দুইটি নির্ধারণ করার জন্য। মেশিন দুই থেকে কোন চিহ্নটি বের হবে তা নির্ধারণ করার জন্য তোমাকে গড়ে কতগুলো প্রশ্ন জিজ্ঞেস করতে হবে? এই বিষয়টি একটি তুলনার মাধ্যমে খুব ভালভাবে ব্যাখ্যা করা সম্ভব। এখন মনে করা যাক, আমরা এই কাজটি করার পরিবর্তে মেশিন এক এবং দুই তৈরি করতে চাই, এবং আমরা চিহ্ন তৈরি করতে পারি এভাবে, একটি ডিস্ককে, একটি পেরেকের সাথে বাউন্স করানোর মাধ্যমে যেখানে ডিস্কটি যেকোন দিকে যেতে পারে। ডিস্কটি কোনদিকে পড়ছে তার উপরে ভিত্তি করে আমরা একটি চিহ্ন তৈরি করতে পারি। মেশিন এক এর ক্ষেত্রে, আমাদের আরও একটি স্তর সংযুক্ত করতে হবে, অথবা বলা যেতে পারে দ্বিতীয় একটি বাউন্স এখানে রাখতে হবে, যাতে আমাদের ডিস্কগুলো দুইবার বাউন্স খেতে পারে, যেটা আমাদেরকে চারটি ভিন্ন ভিন্ন ফলাফলের দিকে নিয়ে যাবে। ডিস্কগুলো কোথায় পড়ছে তার উপরে ভিত্তি করে আমাদের কাছে A, B,C অথবা D এই চারটি ফলাফল আসবে। এখন মেশিন দুই এর ক্ষেত্রে। এক্ষেত্রে, প্রথম বাউন্সটি A এর দিকে হতে পারে যেটা হবার সম্ভাবনা হল ৫০% অথবা এরকমটি না হলে আমরা দ্বিতীয় একটি বাউন্স পাব যেটা আউটপুট হিসেবে D প্রকাশ করতে পারে, যেটা হবার সম্ভাবনা হল ২৫%, অথবা এরকমটিও যদি না হয় আমরা তৃতীয় একটি বাউন্স পাব যেটা আউটপুট হিসেবে B অথবা C প্রকাশ করবে, উভয়ের ক্ষেত্রেই এটা হবার সম্ভাবনা হল ১২.৫%। এখন আমরা নিম্নোক্তেভাবে গড় বের করতে পারি। প্রতাশিত বাউন্সের সংখ্যা হল- অক্ষর A গুন একটি বাউন্সের সম্ভাবনা, যোগ অক্ষর B গুন তিনটি বাউন্সের সম্ভাবনা, যোগ অক্ষর C গুন তিনটি বাউন্সের সম্ভাবনা, যোগ অক্ষর D গুন দুইটি বাউন্সের সম্ভাবনা. ফল হিসেবে আমরা পাই ১.৭৫ বার বাউন্স। এখন হ্যাঁ অথবা না প্রশ্ন এবং পক্ষপাতহীন বাউন্সগুলোর মধ্যের সম্পর্ক দেখা যাক। প্রত্যাশিত প্রশ্নের সংখ্যা সমান হল প্রত্যাশিত বাউন্সের সংখ্যা। তাহলে মেশিন এক এর একটি চিহ্ন তৈরি করার জন্য দুইটি বাউন্স প্রয়োজন হবে, যেখানে অজানা কোন একটি চিহ্ন অনুমান করার জন্য দুইটি প্রশ্ন লাগবে। মেশিন দুইয়ের ক্ষেত্রে লাগবে ১.৭৫ বার বাউন্স। সুতরাং আমাদের গড়ে ১.৭৫ টি প্রশ্ন এখানে জিজ্ঞেস করতে হবে যার অর্থ হল আমাদের যদি উভই মেশিন থেকেই ১০০ টি চিহ্ন অনুমান করার দরকার পড়ে তাহলে, মেশিন এক এর জন্য ২০০ টি এবং মেশিন দুইয়ের জন্য ১৭৫টি প্রশ্ন আমাদের জিজ্ঞেস করার প্রয়োজন পড়বে। যার অর্থ হল মেশিন দুই কম সংখ্যক তথ্য প্রকাশ করছে কারন এখানে এর আউটপুটে অল্প সংখ্যক অনিশ্চয়তা অথবা চমক রয়েছে, আর এখানেই এর কাজ থেমে গেছে। ক্লড শ্যানন একে অনিশ্চয়তার গড় পরিমাপের "এনট্রপি" হিসেবে অভিহিত করেছেন, এবং একে তিনি H অক্ষরটি দিয়ে প্রকাশ করেছেন। এনট্রপির একক যেটা শ্যানন নির্বাচন করেছেন সেটা একটি পক্ষপাতহীন মুদ্রা নিক্ষেপের অনিশ্চয়তার উপরে ভিত্তি করে নির্ধারণ করেছেন এবং তিনি একে "দ্যা বিট" বলে আখ্যায়িত করেছেন, যেটা একটি পক্ষপাতহীন বাউন্সের সমান। আমরা আমাদের বাউন্সের এই সদৃশতা ব্যবহার করে একই ফলাফলে পৌছতে পারি। এনট্রপি অথবা H হল প্রতিটি চিহ্নের সম্ভাবনার সমষ্টি গুন বাউন্সের সংখ্যা। পার্থক্যটি হল, আমরা কিভাবে বাউন্সের সংখ্যাটি আরও সাধারন পন্থা অবলম্বন করে প্রকাশ করতে পারব? আমরা যেটা দেখেছি সেটা হল, বাউন্সের সংখ্যা নির্ভর করে বাউন্সের ট্রি টি কত লম্বা সেটার উপরে। আমরা এটাকে এভাবে সাধারণীকরণ করতে পারি বাউন্সের সংখ্যা সমান লগারিদমের ভিত্তি দুই এবং ঐ লেভেল থেকে বের হওয়া আউটকাম বা ফলের সংখ্যার উপরে। একটি লেভেল বা স্তরের আউটকাম বা ফলাফল ও সম্ভাবনার উপরে নির্ভর করে, যেখানে একটি লেভেলের ফলাফলের সংখ্যা সমান হল এক ভাগ আউটকাম বা ফলাফলের সম্ভাবনার সংখ্যা। বাউন্সের সংখ্যা আসলে সমান হল লগারিদমের ভিত্তি দুই এক ভাগ ঐ চিহ্নটি আসার সম্ভাবনা, যেটা আমাদেরকে চূড়ান্ত সমীকরণটি দিবে। এনট্রপি বা H, হল প্রতিটি চিহ্নের সম্ভাবনার সমষ্টি গুন লগারিদমের ভিত্তি দুই এক ভাগ ঐ চিহ্নটির সম্ভাবনা। শ্যানন এই সমীকরণটি একটু ভিন্নভাবে লিখেছেন, যেখানে তিনি এই সমীকরণটি লগারিদমের ভিতরে উল্টে লিখেছেন যেটার কারনে আমাদের একটি ঋণাত্মক প্রতীক এখানে ব্যবহার করতে হবে, যদিও উভই সুত্রই আমাদের একই ফলাফল দিবে। সংক্ষেপে এখানে বলা যাক। এনট্রপি সর্বোচ্চ হবে যখন সকল আউটকাম বা ফলগুলো সমান হবে। যখন তুমি সমান অবস্থা থেকে দূরে সরে যাবে অথবা অনুমানের উপরে ভিত্তি করে কাজ করা চলে আসবে, তখন এনট্রপি নিচের দিকে নেমে যাবে। মৌলিক ধারনা হল, যদি একটি তথ্য সুত্রের এনট্রপি নিচে নেমে যাই, তার মানে হল আমরা অল্প সংখ্যক প্রশ্ন জিজ্ঞেস করতে পারি আউটকাম বা ফলাফল পাবার জন্য। শ্যাননকে ধন্যবাদ, দ্যা বিটের জন্য যেটা হল এনট্রপির একক, যেটাকে আমরা তথ্যের পরিমাণগত ভিত্তি পরিমাপের জন্য আমরা ব্যবহার করে থাকি, অথবা বলা যাই চমক পরিমাপের মাপকাঠি হিসেবে। ## আগামী ও গ্রামীণফোন এর সহযোগিতায় অনূদিত ##