If you're seeing this message, it means we're having trouble loading external resources on our website.

তোমার যদি কোন ওয়েব ফিল্টার দেওয়া থাকে, তাহলে দয়া করে নিশ্চিত কর যে *.kastatic.org এবং *.kasandbox.org ডোমেইনগুলো উন্মুক্ত।

মূল বিষয়বস্তু

তথ্য পরিমাপ করা

কীভাবে আমরা একটি তথ্য ভাণ্ডারকে পরিমাপ করতে পারি? এটি তৈরি করেছে ব্রিট ক্রুজ

আলোচনায় অংশ নিতে চাও?

কোন আলাপচারিতা নেই।
ইংরেজি জানো? খান একাডেমির ইংরেজি সাইটে আরো আলোচনা দেখতে এখানে ক্লিক কর।

ভিডিও ট্রান্সক্রিপ্ট

## আগামী ও গ্রামীণফোন এর সহযোগিতায় অনূদিত ## মনে কর অ্যালিস এবং বব তাদের বাড়িতে বার্তা প্রেরণের পদ্ধতি বের করেছিল। প্রথমে তারা রাতে আগুন এবং দিনে সময় শাটার ব্যবহার করতো। তারপর তারা একটি তার ব্যবহার করে বিভিন্নভাবে কম্পন তৈরি করতো। অবশেষে, তারা বৈদ্যুতিক তারের সাহায্যে বৈদ্যুতিক স্পন্দন পাঠায় এবং তারা একটি পরীক্ষামূলক বেতার পদ্ধতি চেষ্টা করছিল। সমস্যা হল, তাদের এই সকল সরঞ্জামের জন্য, টাকার প্রয়োজন। এজন্য, তারা টাকার বিনিময়ে অন্যদের কাছে সেবা প্রদান করার সিদ্ধান্ত নিয়েছে। আর প্রথম দিনে, অ্যালিসের তিনটি নতুন গ্রাহক এসেছিল যারা ববের বাড়িতে তাদের বন্ধুদের কাছে বার্তা প্রেরণ করতে চান। প্রথম গ্রাহক ১০ টি মুদ্রা নিক্ষেপের একটি তালিকা পাঠাতে চেয়েছিলেন, দ্বিতীয় গ্রাহক ছয় অক্ষর একটি শব্দ পাঠাতে চেয়েছিলেন, এবং তৃতীয় গ্রাহক একটি তাসের হাত পাঠাতে চেয়েছিলেন। এখন প্রশ্ন হল, কিভাবে মূল্য নির্ধারণ করা উচিত? আসলে, এটির মূল্য নির্ভর করে করা উচিত অ্যালিসের বার্তা প্রেরণের সময়ের উপর। কিন্তু বিভিন্ন ধরনের বার্তার ক্ষেত্রে সে কিভাবে এটি পরিমাপ করতে পারবে? এটি বের করার জন্য, এসো একটা খেলা খেলি। কল্পনা কর তুমি এখন বব, এবং তুমি জানো অ্যালিস তোমাকে এসব বার্তা পাঠাতে চায়, কিন্তু তুমি শুধুমাত্র উত্তর হিসেবে প্রশ্ন করে হ্যাঁ অথবা না গ্রহণ করতে পারবে। অ্যালিস উত্তর দেওয়ার জন্য শূন্য বা এক এর ক্রম পাঠাবে, কোন একটি পদ্ধতি ব্যবহার করে। লক্ষ্য করি, তাদের বার্তা পাঠানোর আগের সকল পদ্ধতির মধ্যে পার্থক্যের বিনিময় জড়িত ছিল। সুতরাং, তো ১ কে জ্বলন্ত কাঠি দ্বারা অথবা খোলা শাটার বা বৈদ্যুতিক স্পন্দন দ্বারা প্রকাশ করা যায়। যে কোন ভাবেই প্রকাশ করা হোক না কেন, আমরা তাদের বাইনারি সংখ্যা বলতে পারি, কারণ একটি বাইনারি সংখ্যা শুধুমাত্র এক অথবা শূন্য হতে পারে। ধরি, শূন্য দ্বারা না এবং এক দ্বারা হ্যাঁ প্রকাশ করা হয়। এখন চ্যালেঞ্জ হল সবসময় সর্বনিম্ন সংখ্যক প্রস্ন করতে হবে সঠিক বার্তা নির্ধারণের জন্য। প্রথমত, মুদ্রা নিক্ষেপে লক্ষ্য করি। প্রতিটি অক্ষরের জন্য, প্রেরক, অ্যালিস, যে কোন একটি অক্ষর নির্বাচন করতে পারে, হেড অথবা টেইল। এখন তার নির্বাচিত অক্ষরটি নির্ণয় করতে কয়টি প্রশ্ন করা লাগবে? একটি প্রশ্ন যেমন, এটি কি হেড, বলাই যথেষ্ট। কিন্তু ১০ টি নিক্ষেপের জন্য কয়টি প্রশ্ন করতে হবে? আচ্ছা, ১০ টির প্রতিটি নিক্ষেপে একটি প্রশ্ন হল ১০ টি প্রশ্ন বা ১০ টি বাইনারি সংখ্যার সমান যা দ্বারা ওই বার্তা পাঠানো যায়। এখন, চিঠি নিয়ে চিন্তা করা যাক। প্রতিটি অক্ষরের জন্য, প্রেরক, অ্যালিস, ২৬ টি অক্ষরের মধ্যে যে কোন একটি নির্বাচন করতে পারে। একটি সহজ বার্তা দিয়ে শুরু করা যাক, যা এক অক্ষর বিশিষ্ট হয়ে থাকে। এখানে কয়টি প্রশ্ন করা দরকার? এটি কি A? এটি কি B? এটি কি C? এটি কি D? আর এভাবেই চলবে, কিন্তু এটি প্রশ্নের সর্বনিম্ন সংখ্যা নয়। সবচেয়ে উত্তম হল এমন প্রশ্ন করা যা সম্ভাব্য অর্ধেক উত্তর নাকচ করে দেয়। উদাহরণস্বরূপ, বর্ণমালার মাঝমাঝি M ও N রয়েছে সুতরাং, আমরা প্রথমে জিজ্ঞেস করতে পারি, এটি কি N এর চেয়ে ছোট? আমরা যদি একটি এক পাই, হ্যাঁ, আমরা বাকি অর্ধেক সম্ভাব্যতা মুছে ফেলি, তো ১৩ টি অবশিষ্ট থাকে এবং যেহেতু আমরা একটি চিঠিকে বিভক্ত করতে পারি না, এজন্য আমরা সম্ভাব্য অক্ষরগুলোকে ছয় এবং সাতের সেটে ভাগ করে প্রশ্ন করি, এটি কি G এর চেয়ে ছোট? আমরা এক পাই, যা হল হ্যাঁ এবং এখন আমরা সম্ভাব্য ছয়টি অক্ষর পাই, এবং তাদের বিভক্ত করে প্রশ্ন করতে পারি এটি কি D এর চেয়ে ছোট? আমরা একটি শূন্য পাই, যা হল না, ফলে তিনটি সম্ভাব্য অক্ষর অবশিষ্ট থাকে, এবং এখন এক পাশ নির্বাচন করে প্রশ্ন করতে পারি, এটি কি D? আমরা একটি শূন্য পাই, যা হল না, এবং পরিশেষে বামে দুটি সম্ভাব্যতা অবশিষ্ট থাকে। আমরা প্রশ্ন করি, এটি কি E? আমরা একটি না পাই এবং পাঁচটি প্রশ্নের পর, আমরা সঠিকভাবে F অক্ষর নির্ণয় করেছি। বোঝা যায় যে, আমাদের কখনই পাঁচটির বেশি প্রশ্ন করতে হবে না, তাই প্রশ্ন সংখ্যা অন্তত চারটি বা সর্বোচ্চ পাঁচটি হবে এবং সাধারণভাবে, দুই এর ঘাত হল প্রশ্ন সংখ্যা যা সমান মোট বার্তার সংখ্যা, যা আমরা পূর্বে বার্তার পরিমাণ হিসেবে সংজ্ঞায়িত করেছি। সুতরাং, কিভাবে আমরা সঠিকভাবে গড় অথবা প্রত্যাশিত প্রশ্নের সংখ্যা বের করবো, যেখানে দেওয়া আছে বার্তার পরিমাণ ২৬? আমরা উল্টোভাবে প্রশ্ন করি। দুই এর কোন ঘাত সমান ২৬, এবং এই ধরনের প্রশ্নের উত্তর দিতে, আমরা স্বাভাবিকভাবেই লগারিদমের ফাংশন, ব্যবহার করি যেখানে ভিত্তি হল দুই, কারণ ২৬ এর দুই এর লগের ভিত্তি হল দুই এর সেই ঘাত যা সমান ২৬ হয়, যা হল প্রায় ৪.৭। সুতরাং, গড়ে, সর্বনিম্নে প্রায় ৪.৭ টি প্রশ্ন প্রতি অক্ষরের জন্য প্রয়োজন হবে, এবং যেহেতু সে ছয় অক্ষরের একটি শব্দ প্রেরণ করতে চায়, বব তাকে, সর্বনিম্নে, ২৮.২ টি প্রশ্ন করতে পারে, অর্থাৎ অ্যালিসকে পাঠাতে হবে, সর্বোচ্চ, ২৯ টি বাইনারি সংখ্যা। অবশেষে, এই সূত্র প্রয়োগ একটি নতুন বার্তা, অর্থাৎ তাসের হাতে প্রয়োগ করা যাক। আসলে, প্রতিটি চিহ্নের জন্য, প্রেরক, অ্যালিস, ৫২ টি তাসের বিভিন্ন চিহ্নের মধ্যে যে কোন একটি নির্বাচন করতে পারে এবং এই ক্ষেত্রে, প্রশ্নের সংখ্যা নির্ভর করবে তাস বিভক্ত করে অ্যালিসকে প্রশ্ন করার উপর যে কোন অংশে সেই তাসটি আছে, এবং একটি কার্ড না পাওয়া পর্যন্ত এরূপ করতে থাকা যা ছয় বা পাঁচবার করতে হতে পারে। কিন্তু আমরা সময় বাঁচািয়ে শুধু আমাদের সমীকরণ ব্যবহার করতে পারি। ৫২ এর লগের দুই এর ভিত্তি হল প্রায় ৫.৭, যেহেতু ৫.৭ এর ঘাত ২ প্রায় ৫২। সুতরাং, প্রশ্নের সর্বনিম্ন সংখ্যা হল প্রতি কার্ডে গড়ে ৫.৭ টি। একটি তাসের হাতে পাঁচটি কার্ড রয়েছে। সুতরাং, তাসের হাতটি প্রেরণ করার জন্য গড়ে ২৮.৫ টি প্রশ্ন করতে হবে। আমরা শেষ করেছি। এখন আমাদের একটি একক আছে। এটি একটি বার্তাকে সংজ্ঞায়িত করার জন্য সর্বনিম্ন প্রশ্নের সংখ্যার উপর ভিত্তি করে তৈরি করা এবং যেহেতু অ্যালিস বাইনারি সংখ্যায় তথ্য প্রেরণ করে, আমরা একে ছোট করে আমাদের একক - কে বিট বলতে পারি বাইনারি সংখ্যা বলার পরিবর্তে। সুতরাং, ১০ টি মুদ্রা নিক্ষেপের জন্য ১০ বিট প্রয়োজন, ছয় অক্ষর শব্দের ২৮.২ বিট প্রয়োজন, এবং তাসের হাতে ২৮.৫ বিট প্রয়োজন। তারপর অ্যালিস বিট প্রতি এক পয়সা মূল্য নির্ধারণের সিদ্ধান্ত নেয় এবং তার ফি সংগ্রহ শুরু করে। এখন, এই ধারণার আবির্ভাব ১৯২০ সালের দিকে ঘটে। এটি অন্যান্য সমস্যার অন্যতম ছিল যা নিয়ে যোগাযোগ প্রকৌশলীরা চিন্তিত ছিলেন। রালফ হার্টলি একজন অসাধারণ ইলেক্ট্রনিক্স গবেষক ছিলেন যিনি এটি হ্যারি নেকুইস্টের ধারণা উপর ভিত্তি করে নির্মাণ করেন। যারা উভয় প্রথম বিশ্বযুদ্ধের পর বেল ল্যাবে কাজ করতেন, এবং ১৯২৮ সালে, হার্টলি একটি গুরুত্বপূর্ণ কাগজ প্রকাশ করেন, তথ্য প্রেরণ, এবং এটিতে তিনি তথ্য শব্দটি সংজ্ঞায়িত করেন H অক্ষর ব্যবহার করে, যেখানে H সমান N গুণ S এর লগারিদম, যেখানে H হল তথ্য, N হল প্রতীকের সংখ্যা, এটি চিঠি, অক্ষর, সংখ্যা ইত্যাদি হতে পারে। এবং S হল উপস্থিত বিভিন্ন প্রতীকের সংখ্যা প্রতিটি নির্বাচনে, এবং এই এভাবেও লেখা যেতে পারে H সমান N ঘাতবিশিষ্ট S এর লগারিদম, এবং হার্টলি লিখেছেন, "আমরা যা করেছি তা হল আমাদের তথ্যের বাস্তবিক পরিমাপ হিসেবে ধরেছি সম্ভাব্য প্রতীকের ক্রমের লগারিদম। " সুতরাং, তথ্য হল বার্তার পরিমাণের লগারিদম; অবশ্য, বুঝতে হবে যে, এই পাঠের সর্বত্র আমরা ধরেছি যে প্রতীক নির্বাচন দৈব, সুবিধার জন্য এরূপ সরল ধারণা করা হয়েছে; যাই হোক, আমরা বাস্তবে জানি প্রায় সব যোগাযোগ যেমন, কথা, সবসময় দৈব নয়। এটি অনুমান এবং বিস্ময়ের সূক্ষ্ম মিশ্রণ। চিঠি লেখার সময় আমরা ছক্কা চালবো না, এবং এই অনুমান উল্লেখযোগ্যভাবে তথ্য প্রেরণের পরিমাণ হ্রাস করতে পারে, কারণ যখন আমরা কোন কিছু আগে অনুমান করি, আমাদের বেশি হ্যাঁ না প্রশ্ন জিজ্ঞেস করতে হয় না একে সংজ্ঞায়িত করার জন্য, কিন্তু আমরা কিভাবে এটির সূক্ষ্ম পার্থক্য মডেল করতে পারবো? এই প্রশ্নটি আমাদের গল্পে একটি গুরুত্বপূর্ণ বিষয় উৎক্ষেপণ করে এটি কি হতে পারে তা কি তুমি ধারণা করতে পারো? ## আগামী ও গ্রামীণফোন এর সহযোগিতায় অনূদিত ##