عدد صحيح من الرموز الثنائية

تقدير المعلمات الكمية للمستندات النصية، جدول الرموز، ثنائي ثمانية بت، حجم معلومات النص، التمثيل معلومات نصيةفي ذاكرة الكمبيوتر، علوم الكمبيوتر الصف السابع بوسوفا، علوم الكمبيوتر الصف السابع

4.6.1. تمثيل المعلومات النصية في ذاكرة الكمبيوتر
يتكون النص من رموز - أحرف وأرقام وعلامات ترقيم وما إلى ذلك، والتي يميزها الشخص بأسلوبه. يقوم الكمبيوتر بتمييز الأحرف التي تم إدخالها بواسطة الكود الثنائي الخاص بها. تضغط على مفتاح رمز على لوحة المفاتيح، ويتم إرسال تسلسل معين من النبضات الكهربائية متفاوتة القوة إلى الكمبيوتر، والتي يمكن تمثيلها كسلسلة من ثمانية أصفار وواحد (رمز ثنائي).
لقد قلنا بالفعل أن طول البت للكود الثنائي i وعدد مجموعات التعليمات البرمجية المحتملة N مرتبطان بالعلاقة: 2 i = N. يتيح لك الثنائي المكون من ثمانية بتات الحصول على 256 مجموعة رموز مختلفة: 2 8 = 256.
باستخدام هذا العدد من مجموعات التعليمات البرمجية، يمكنك تشفير جميع الأحرف الموجودة على لوحة مفاتيح الكمبيوتر - الحروف الصغيرة والكبيرة الروسية واللاتينية والأرقام وعلامات الترقيم والعلامات العمليات الحسابية، والأقواس، وما إلى ذلك، بالإضافة إلى عدد من أحرف التحكم، والتي بدونها يستحيل إنشاء مستند نصي (حذف الحرف السابق، وتغذية الأسطر، والمسافة، وما إلى ذلك).
يتم إنشاء المراسلات بين صور الأحرف ورموز الأحرف باستخدام جداول الكود.
تخضع جميع جداول الأكواد المستخدمة في أي جهاز كمبيوتر وأي نظام تشغيل لمعايير ترميز الأحرف الدولية.
يحتوي كتاب الرموز على رموز لـ 256 حرفًا مختلفًا، مرقمة من 0 إلى 255. أول 128 رمزًا في جميع كتب الرموز تتوافق مع نفس الأحرف:
- الرموز ذات الأرقام من 0 إلى 32 تتوافق مع أحرف التحكم؛
- الرموز ذات الأرقام من 33 إلى 127 تتوافق مع الأحرف المعروضة - الحروف اللاتينية وعلامات الترقيم والأرقام وعلامات العمليات الحسابية وما إلى ذلك.
تم تطوير هذه الرموز في الولايات المتحدة الأمريكية وكانت تسمى ASCII (الكود القياسي الأمريكي لتبادل المعلومات).
ويبين الجدول 4.1 جزءًا من تشفير ASCII.

تُستخدم الرموز ذات الأرقام من 128 إلى 255 لترميز أحرف الأبجدية الوطنية ورموز العملة الوطنية وما إلى ذلك. لذلك، في جداول الرموز للغات المختلفة، تتوافق الأحرف المختلفة مع نفس الرمز. علاوة على ذلك، بالنسبة للعديد من اللغات، هناك العديد من الخيارات لجداول التعليمات البرمجية (على سبيل المثال، بالنسبة للغة الروسية هناك حوالي اثنتي عشرة منها!).
يوضح الجدول 4.2 الرموز العشرية والثنائية لعدة أحرف من الأبجدية الروسية بترميزين مختلفين.

الترميز

على سبيل المثال، تسلسل الرموز الثنائية
11010010 11000101 11001010 11010001 11010010
في تشفير Windows، ستتوافق كلمة "TEXT"، وفي ترميز KOI-8 ستتوافق مع مجموعة الأحرف التي لا معنى لها "reyar".
كقاعدة عامة، لا داعي للقلق بشأن تحويل المستندات النصية، حيث يتم ذلك عن طريق برامج محول خاصة مدمجة في نظام التشغيل والتطبيقات.
تحتوي الترميزات ذات الثمانية بتات على قيد واحد خطير: عدد رموز الأحرف المختلفة في هذه الترميزات ليس كبيرًا بما يكفي للسماح باستخدام أكثر من لغتين في وقت واحد. وللتغلب على هذا القيد، تم تطوير معيار جديد لترميز الأحرف يسمى Unicode. في Unicode، يتم ترميز كل حرف في رمز ثنائي مكون من ستة عشر بت. يتيح لك هذا العدد من البتات تشفير 65,536 حرفًا مختلفًا:
2 16 = 65 536.
أول 128 حرفًا في Unicode هي نفس جدول ASCII؛ فيما يلي أبجديات جميع اللغات الحديثة، وكذلك جميع الرموز الرياضية والعلمية الأخرى. كل عام يصبح Unicode منتشرًا بشكل متزايد.

4.6.2. حجم المعلومات لجزء النص
أنت تعلم أن حجم معلومات الرسالة I يساوي حاصل ضرب عدد الرموز K في الرسالة بوزن معلومات الحرف الأبجدي i: I = K * i.
اعتمادا على عمق بت الترميز المستخدم، المعلومات
يمكن أن يساوي وزن حرف النص الذي تم إنشاؤه على جهاز الكمبيوتر ما يلي:
- 8 بت (1) - تشفير من ثمانية بتات؛
- 16 بت (2 بايت) - ترميز ستة عشر بت.
سيكون حجم المعلومات الخاص بجزء النص هو عدد البتات أو البايتات أو الوحدات المشتقة (كيلوبايت، ميغابايت، وما إلى ذلك) المطلوبة لتسجيل هذا الجزء باستخدام طريقة تشفير ثنائية متفق عليها مسبقًا.

المشكلة 1. بافتراض أن كل حرف مشفر ببايت واحد، حدد حجم المعلومات للعبارة التالية لجان جاك روسو:

آلاف الطرق تؤدي إلى الخطأ، ولكن طريق واحد فقط يؤدي إلى الحقيقة.

حل. يحتوي هذا النص على 57 حرفًا (بما في ذلك علامات الترقيم والمسافات). يتم ترميز كل حرف كبايت واحد. وبالتالي، فإن حجم المعلومات للنص بأكمله هو 57 بايت.
الجواب: 57 بايت.

اضبط على 2. في Unicode، يتم تخصيص وحدتي بايت لكل حرف. تحديد حجم المعلومات لنص مكون من 24 حرفًا في هذا الترميز.

حل. أنا = 24 * 2 = 48 بايت.
الجواب: 48 بايت.

المهمة 3. قام جهاز أوتوماتيكي بإعادة ترميز رسالة معلومات باللغة الروسية، مكتوبة في الأصل برمز 8 بت، إلى ترميز Unicode 16 بت. وفي الوقت نفسه، زادت رسالة المعلومات بمقدار 2048 بايت. ما هو حجم معلومات الرسالة قبل إعادة ترميزها؟

حل. إن وزن المعلومات لكل حرف في تشفير 16 بت هو ضعف وزن معلومات الحرف في تشفير 8 بت. لذلك، عند إعادة ترميز كتلة المعلومات الأصلية من ترميز 8 بت إلى 16 بت، يجب أن يتضاعف حجم معلوماتها، بمعنى آخر، بمقدار يساوي حجم المعلومات الأصلية. وبالتالي، كان حجم معلومات الرسالة قبل إعادة تشفيرها 2048 بايت = 2 كيلو بايت.
الجواب: 2 كيلو بايت.

تم تعيينه 4. التعبير بالميجابايت عن مقدار المعلومات النصية في "القاموس الحديث للكلمات الأجنبية" البالغ 740 صفحة، إذا كانت صفحة واحدة تحتوي على 60 سطرًا في المتوسط ​​من 80 حرفًا (بما في ذلك المسافات). ضع في اعتبارك أن التسجيل استخدم أبجدية بسعة 256 حرفًا.

حل. وزن المعلومات للحرف الأبجدي بقوة 256 يساوي ثمانية بتات (بايت واحد). عدد الأحرف في القاموس بأكمله هو 740 * 80 * 60 = 3,552,000، وبالتالي فإن حجم هذا النص بالبايت هو 3,552,000 بايت = 3,468.75 كيلو بايت = 3.39 ميجابايت.
الإجابة: 3.39 ميجابايت.

إجابات على "الأسئلة والمهام" بعد الفقرة

حول النظام الثنائي والرموز

في التكنولوجيا الرقمية، يتم التعبير عن المعلومات المرسلة أو المستلمة أو المحولة من خلال مجموعة من رموز النظام الثنائي رقم - ثنائيشفرة.

يمكن تمثيل أي رقم عشري مألوف لدينا كمجموعة من الآحاد والأصفار لهذا النظام. الرقم العشري 7، على سبيل المثال في النظام الثنائييكتبون مثل هذا: 0111. هنا الحرف الموجود في أقصى اليسار هو الرقم الأكثر أهمية، والحرف الموجود في أقصى اليمين هو الرقم الأقل أهمية في رقم الكود الثنائي المكون من أربعة بتات. يتم تحويل هذا الرقم الثنائي إلى رقم في نظام الأرقام العشرية بالترتيب التالي: 0111 = 0X2 3 +1X2 2 +1X2 1 +1X2 0 =0+4+2+1 =7.

في قلب التحول رقم ثنائييحتوي العلامة العشرية على الرقم 2. ويسمى الرمز نفسه في هذه الحالة بالرمز الثنائي الطبيعي أو الرمز 8-4-2-1.

سيساعدك الجدول 1 على تحويل الأرقام العشرية إلى أرقام ثنائية وإعادتها ضمن رمز مكون من أربعة أرقام.

الجدول 1

رقم عشري رقم ثنائي
0 0000
1 0001
2 0010
3 0011
4 0100
5 0101
6 0110
7 0111
8 1000
9 1001
10 1010
11 1011
12 1100
13 1101
14 1110
15 1111

لتعزيز مبدأ الترميز في الذاكرة بشكل أكثر قوة المعلومات الرقميةفي النظام الثنائي، نقترح تحليلًا تجريبيًا لتشغيل عداد ثنائي رباعي البتات، تم تجميعه، على سبيل المثال، على قلاب JK وفقًا للدائرة الموضحة في الشكل. 1.


أرز. 1 عداد مكون من أربعة أرقام

قم بتركيب جميع أجزاء العداد على لوحة اللوح.

قم بتوصيل مصابيح LED أو المؤشرات الأخرى بالمخرجات المباشرة لجميع المشغلات بحيث يمكنك مراقبة الحالات المنطقية للمشغلات بشكل مرئي. يتم تنفيذ وظيفة مصدر نبضات عد المدخلات طويلة الأمد بواسطة مشغل RS مُجمَّع على عناصر منطقية 2I-NOT DD1.1 و DD1.2 ويتم التحكم فيها بواسطة زر SB1.

قم بإعداد جدول (الجدول 2) تكتب فيه الحالات المنطقية لمشغلات عداد النبض باستخدام رموز نظام الأرقام الثنائية. في عمود "العد" الموجود في أقصى اليسار، اكتب على الفور الأرقام التسلسلية لنبضات الإدخال من 0 إلى 15. في العمود الثاني على اليسار (Q1) اكتب الحالة المنطقية للمشغل الأول عند كل نبضة تالية، في العمود الثالث العمود (Q2) - الحالة المنطقية للمشغل الثاني، الخ. د.

لذا، تحقق من التثبيت وموثوقية اللحام، وإذا لم تجد أي أخطاء، قم بتشغيل الطاقة. في هذه الحالة، قد تضيء بعض مصابيح LED، مما يشير إلى أن المشغلات المرتبطة بها كانت في حالة واحدة في لحظة تشغيل الطاقة. اضغط على زر SB2 ل. قم بتطبيق جهد منخفض المستوى على مدخل R الخاص بالمشغلات وبالتالي قم بضبط جميع مشغلات العداد على الحالة الصفرية. الآن جميع المؤشرات معطلة. يتم تحديد هذه الحالة المنطقية لجميع مشغلات عداد النبض ذو الأربعة بتات في الجدول بالأصفار.

الجدول 2 يفحص س1 س2 س3
0 0 0 0 0
1 1 0 0 0
2 0 1 0 0
3 1 1 0 0
4 0 0 1 0
5 1 0 1 0
6 0 1 1 0
7 1 1 1 0
8 0 0 0 1
9 1 0 0 1
10 0 1 0 1
11 1 1 0 1
12 0 0 1 1
13 1 0 1 1
14 0 1 1 1
15 1 1 1 1

س 4

سجل حالة المشغلات هذه في الجدول: في العمود Ql-1، في الباقي - 0. اضغط على زر SB1 مرة ثانية، لمحاكاة نبضة إدخال ثانية. سوف ينطفئ مؤشر LED الأول على الفور، وسيتم تشغيل المصباح الثاني - HL2. الآن المشغل الثاني في حالة الوحدة، والباقي في حالة الصفر. اكتب هذه الحالات المنطقية المتقلبة في السطر المقابل لنبضة الإدخال الثانية.

ستعمل نبضة الإدخال الثالثة مرة أخرى على ضبط مشغل العداد الأول على الحالة الفردية ولن تغير حالة المشغل الثاني، وبالتالي ستضيء مؤشرات HL1 وHL2. في الجدول، اكتب حالة العداد هذه بالشكل التالي: 1100. عند نبضة الإدخال الرابعة، سيضيء مصباح LED HL3 فقط، ويجب أن يظهر الإدخال 0010 في الجدول.

لذا، دون التسرع، والضغط على زر SB1 وقراءة مؤشرات حالة المشغلات بواسطة التوهج، فسوف تملأ تدريجياً جدول الحالات المنطقية بالكامل للعداد ذو الأربعة بتات. بعد ذلك، افصل مشغل RS عن مدخل العداد وقم بتطبيق سلسلة من النبضات عليه من المولد، متبوعة بتردد 1...2 هرتز. سيؤكد ترتيب حرث المؤشرات، والذي يمكن تتبعه عند هذا التردد، سجلاتك التي تميز تشغيل العداد الثنائي المكون من أربعة أرقام.

دعونا نلخص.

إن التقليب الأول للعداد الرئيسي الخاص بك هو البت الأقل أهمية، والرابع هو البت الأكثر أهمية في العداد ذو الأربع بتات.

يمكن بالطبع إجراء تجارب مماثلة مع المخرجات المقابلة باستخدام عداد رباعي البتات على قلاب D، وربط مخرجاتها العكسية بمدخلات D بحيث تعمل القلابات في وضع العد.


من المفيد إجراء مثل هذه الدراسة باستخدام الدائرة الدقيقة K155IE2. بعد تشغيله حسب الرسم البياني الموضح في الشكل. 2، يمكنك إنشاء جدول لحالات الكود لعداد النبض هذا من 0 إلى 9.

أرز. 2 تجربة مع شريحة K155IE2

كما تعلم، فإن الحد الأقصى للرقم العشري الذي يمكن التعبير عنه بثنائي مكون من أربعة أرقام هو -15. وماذا لو كان هذا الرقم مكونًا من ثلاثة أرقام، على سبيل المثال 137؟ في الكود الثنائي سيبدو مرهقًا وغير مناسب دائمًا للمعالجة: 10001001. لذلك، في التكنولوجيا الرقمية، بالإضافة إلى الكود الثنائي، يستخدمون أيضًا الكود الثنائي العشري، حيث يتم تمثيل كل رقم من الرقم العشري في شكل ثنائي. في الكود العشري الثنائي، نفس الرقم المكون من ثلاثة أرقام 137 له الشكل التالي:

كيف يتم تحويل حالات الكود الثنائي أو الثنائي العشري لعدادات النبض إلى أرقام من نظام الأرقام العشري؟ ويتم ذلك باستخدام أجهزة فك التشفير ومؤشرات تجميع الإشارات.القراءة والكتابة

مفيد

الرموز الثنائية غير الموقعة النوع الأول من الرموز الثنائية الذي سننظر فيه هو الأعداد الصحيحة بدونهارموز الأحرف

. للتأكد من ذلك، لنأخذ طول كلمة المعالج ليكون ثمانية بتات. في هذه الرموز، يمثل كل رقم ثنائي قوة 2:

في هذه الحالة، الحد الأدنى للرقم الذي يمكن كتابته بمثل هذا الرمز الثنائي هو 0. ويمكن تعريف الحد الأقصى للرقم الذي يمكن كتابته بمثل هذا الرمز الثنائي على النحو التالي:

يمكن لهذين الرقمين تحديد نطاق الأرقام التي يمكن تمثيلها بواسطة هذا الرمز الثنائي بشكل كامل. في حالة وجود عدد صحيح ثنائي بدون إشارة مكون من ثمانية بتات، سيكون النطاق هو: نطاق الأرقام التي يمكن كتابتها بهذا الرمز: 0 .. 255. بالنسبة إلى الكود المكون من ستة عشر بت، هذا هو 0 .. 65535. في حالة وجود عدد صحيح ثنائي مكون من ثمانية بتات، يكون هذا هو 0 .. 65535. معالج ثماني بتات، يتم استخدام خليتي ذاكرة موجودتين في عناوين متجاورة لتخزين مثل هذا الرقم. للعمل مع هذه الأرقام، يتم استخدام أوامر خاصة.

الرموز الثنائية الموقعة مباشرة


في حالة وجود عدد صحيح ثنائي مكون من ثمانية بتات، فإن نطاق الأرقام التي يمكن كتابتها بهذا الرمز هو -127 .. +127. بالنسبة للرمز المكون من ستة عشر بت، سيكون هذا النطاق: -32767 .. +32767. يستخدم المعالج ذو الثمانية بت أيضًا خليتي ذاكرة موجودتين في العناوين المجاورة لتخزين مثل هذا الرقم.

عيب هذا الرمز هو أنه يجب معالجة بت الإشارة والبتات الرقمية بشكل منفصل. خوارزمية البرنامج التي تعمل مع مثل هذه الرموز معقدة. لتحديد وتغيير بت الإشارة، من الضروري استخدام آلية إخفاء البت، مما يزيد بشكل كبير من حجم البرنامج ويقلل من أدائه. ولضمان عدم اختلاف خوارزمية معالجة الإشارة والبتات الرقمية، تم تقديم رموز ثنائية عكسية.

وقعت رموز ثنائية معكوس.

تختلف الرموز الثنائية العكسية عن الرموز المباشرة فقط حيث يتم الحصول على الأرقام السالبة فيها عن طريق قلب جميع أرقام الرقم. في هذه الحالة، لا تختلف الإشارة والأرقام الرقمية. تم تبسيط خوارزمية العمل مع هذه الرموز إلى حد كبير.


ومع ذلك، عند العمل مع الرموز العكسية، يلزم وجود خوارزمية خاصة للتعرف على العلامة وحساب القيمة المطلقة للرقم واستعادة علامة نتيجة الرقم. بالإضافة إلى ذلك، في الكود المباشر والعكسي للرقم، يتم استخدام رمزين لتذكر الرقم 0، في حين أنه من المعروف أن الرقم 0 لا يمكن أن يكون موجبًا وسالبًا أبدًا.

رموز ثنائية مكملة موقعة.

الرموز الإضافية خالية من العيوب المذكورة. تسمح لك هذه الرموز بجمع الأرقام الموجبة والسالبة مباشرة دون تحليل رقم الإشارة والحصول على النتيجة الصحيحة. كل هذا يصبح ممكنا بفضل حقيقة ذلك أرقام إضافيةهي حلقة طبيعية من الأرقام، وليست تشكيلًا صناعيًا مثل الرموز المباشرة والعكسية. بالإضافة إلى ذلك، من المهم أن يكون حساب المكمل الثنائي في الكود الثنائي أمرًا سهلاً للغاية. لهذا يكفي رمز عكسيإضافة 1:


نطاق الأرقام التي يمكن كتابتها بهذا الكود: -128 .. +127. بالنسبة للرمز المكون من ستة عشر بت، سيكون هذا النطاق: -32768 .. +32767. يستخدم المعالج ذو الثمانية بتات خليتي ذاكرة موجودتين في عناوين متجاورة لتخزين هذا الرقم.

في الرموز العكسية والتكميلية، لوحظ تأثير مثير للاهتمام، وهو ما يسمى تأثير انتشار الإشارة. يكمن في حقيقة أنه عند تحويل رقم أحادي البايت إلى رقم مزدوج البايت، يكفي تعيين جميع بتات البايت العالي قيمة بت الإشارة للبايت المنخفض. أي أنه لتخزين إشارة رقم ما، يمكنك استخدام أي عدد تريده من البتات عالية الترتيب. في هذه الحالة، لا يتغير معنى الكود على الإطلاق.

يوفر استخدام البتتين لتمثيل إشارة الرقم فرصة مثيرة للاهتمام للتحكم في التدفقات الفائضة عند إجراء العمليات الحسابية. دعونا نلقي نظرة على بعض الأمثلة.

1) لنجمع العددين 12 و 5

في هذا المثال، يمكنك أن ترى أن الجمع ينتج النتيجة الصحيحة. يمكن التحقق من ذلك بواسطة علامة الحمل C، والتي تتزامن مع علامة النتيجة (ينطبق تأثير نشر الإشارة).

2) لنجمع رقمين سالبين -12 و -5

في هذا المثال، تتطابق علامة الحمل C أيضًا مع علامة النتيجة، أي أنه لم يحدث تجاوز في هذه الحالة أيضًا

3) جمع الأعداد الموجبة والسالبة -12 و +5

في هذا المثال، تؤدي إضافة رقم موجب ورقم سالب تلقائيًا إلى إنتاج الإشارة الصحيحة للنتيجة. وفي هذه الحالة تكون إشارة النتيجة سلبية. تتطابق علامة الحمل مع علامة النتيجة، لذلك لم يكن هناك تجاوز (يمكننا التحقق من ذلك عن طريق الحسابات المباشرة على الورق أو على الآلة الحاسبة).

4) جمع الأعداد الموجبة والسالبة +12 و -5

في هذا المثال، علامة النتيجة إيجابية. تتطابق علامة الحمل مع علامة النتيجة، لذلك لم يكن هناك تجاوز في هذه الحالة أيضًا.

5) لنجمع العددين 100 و 31

في هذا المثال، يمكنك أن ترى أنه نتيجة للجمع، تجاوز متغير ثمانية بت، لأن نتيجة لعملية جراحية أرقام إيجابيةوكانت النتيجة سلبية. ومع ذلك، إذا نظرنا إلى علامة الحمل، فإنها لا تتطابق مع إشارة النتيجة. يعد هذا الموقف علامة على تجاوز سعة النتيجة ويمكن اكتشافه بسهولة باستخدام عملية OR حصرية على الجزء الأكثر أهمية من النتيجة وعلامة الحمل C. تنفذ معظم المعالجات هذه العملية في الأجهزة وتضع النتيجة في علامة تجاوز السعة OV.

في هذا المثال، نتيجة العملية أرقام سلبيةنتيجة للجمع، فاض متغير ثمانية بت، لأن وكانت النتيجة إيجابية. وفي هذه الحالة، إذا نظرنا إلى علامة الحمل C، فهي لا تتطابق مع علامة النتيجة. الفرق عن الحالة السابقة هو فقط في مزيج هذه البتات. في المثال 5 نتحدث عن تجاوز النتيجة (المجموعة 01)، وفي المثال 6 نتحدث عن مكافحة تجاوز النتيجة (المجموعة 10).

الأدب:

أنواع أخرى من الرموز الثنائية:

في بعض الأحيان يكون من المناسب تخزين الأرقام في ذاكرة المعالج في شكل عشري
http://site/proc/DecCod.php

تنسيقات أرقام الفاصلة العائمة القياسية لأجهزة الكمبيوتر ووحدات التحكم الدقيقة
http://site/proc/float/

تمثيل النصوص في ذاكرة أجهزة الكمبيوتر والمتحكمات الدقيقة
http://site/proc/text.php

حاليًا، يتم استخدام أنظمة الأرقام الموضعية وغير الموضعية على نطاق واسع في التكنولوجيا وفي الحياة اليومية.
.php



glvpom.ru - المحطات الفرعية. إلكترونيات الطاقة. علم البيئة. الهندسة الكهربائية